gdb: move struct reggroup into reggroups.h header
[binutils-gdb.git] / libctf / ctf-link.c
index 1cda324e65e10f308ea7d483a6b45999a42d31d1..d92a6930dd0895e70948b69a1f2fb2c2dcc52f58 100644 (file)
@@ -1,5 +1,5 @@
 /* CTF linking.
-   Copyright (C) 2019-2020 Free Software Foundation, Inc.
+   Copyright (C) 2019-2022 Free Software Foundation, Inc.
 
    This file is part of libctf.
 
 #pragma weak ctf_open
 #endif
 
-/* Type tracking machinery.  */
-
-/* Record the correspondence between a source and ctf_add_type()-added
-   destination type: both types are translated into parent type IDs if need be,
-   so they relate to the actual container they are in.  Outside controlled
-   circumstances (like linking) it is probably not useful to do more than
-   compare these pointers, since there is nothing stopping the user closing the
-   source container whenever they want to.
-
-   Our OOM handling here is just to not do anything, because this is called deep
-   enough in the call stack that doing anything useful is painfully difficult:
-   the worst consequence if we do OOM is a bit of type duplication anyway.  */
-
-void
-ctf_add_type_mapping (ctf_file_t *src_fp, ctf_id_t src_type,
-                     ctf_file_t *dst_fp, ctf_id_t dst_type)
-{
-  if (LCTF_TYPE_ISPARENT (src_fp, src_type) && src_fp->ctf_parent)
-    src_fp = src_fp->ctf_parent;
-
-  src_type = LCTF_TYPE_TO_INDEX(src_fp, src_type);
-
-  if (LCTF_TYPE_ISPARENT (dst_fp, dst_type) && dst_fp->ctf_parent)
-    dst_fp = dst_fp->ctf_parent;
-
-  dst_type = LCTF_TYPE_TO_INDEX(dst_fp, dst_type);
-
-  /* This dynhash is a bit tricky: it has a multivalued (structural) key, so we
-     need to use the sized-hash machinery to generate key hashing and equality
-     functions.  */
-
-  if (dst_fp->ctf_link_type_mapping == NULL)
-    {
-      ctf_hash_fun f = ctf_hash_type_key;
-      ctf_hash_eq_fun e = ctf_hash_eq_type_key;
-
-      if ((dst_fp->ctf_link_type_mapping = ctf_dynhash_create (f, e, free,
-                                                              NULL)) == NULL)
-       return;
-    }
-
-  ctf_link_type_key_t *key;
-  key = calloc (1, sizeof (struct ctf_link_type_key));
-  if (!key)
-    return;
-
-  key->cltk_fp = src_fp;
-  key->cltk_idx = src_type;
-
-  /* No OOM checking needed, because if this doesn't work the worst we'll do is
-     add a few more duplicate types (which will probably run out of memory
-     anyway).  */
-  ctf_dynhash_insert (dst_fp->ctf_link_type_mapping, key,
-                     (void *) (uintptr_t) dst_type);
-}
-
-/* Look up a type mapping: return 0 if none.  The DST_FP is modified to point to
-   the parent if need be.  The ID returned is from the dst_fp's perspective.  */
-ctf_id_t
-ctf_type_mapping (ctf_file_t *src_fp, ctf_id_t src_type, ctf_file_t **dst_fp)
-{
-  ctf_link_type_key_t key;
-  ctf_file_t *target_fp = *dst_fp;
-  ctf_id_t dst_type = 0;
-
-  if (LCTF_TYPE_ISPARENT (src_fp, src_type) && src_fp->ctf_parent)
-    src_fp = src_fp->ctf_parent;
-
-  src_type = LCTF_TYPE_TO_INDEX(src_fp, src_type);
-  key.cltk_fp = src_fp;
-  key.cltk_idx = src_type;
-
-  if (target_fp->ctf_link_type_mapping)
-    dst_type = (uintptr_t) ctf_dynhash_lookup (target_fp->ctf_link_type_mapping,
-                                              &key);
-
-  if (dst_type != 0)
-    {
-      dst_type = LCTF_INDEX_TO_TYPE (target_fp, dst_type,
-                                    target_fp->ctf_parent != NULL);
-      *dst_fp = target_fp;
-      return dst_type;
-    }
-
-  if (target_fp->ctf_parent)
-    target_fp = target_fp->ctf_parent;
-  else
-    return 0;
-
-  if (target_fp->ctf_link_type_mapping)
-    dst_type = (uintptr_t) ctf_dynhash_lookup (target_fp->ctf_link_type_mapping,
-                                              &key);
-
-  if (dst_type)
-    dst_type = LCTF_INDEX_TO_TYPE (target_fp, dst_type,
-                                  target_fp->ctf_parent != NULL);
-
-  *dst_fp = target_fp;
-  return dst_type;
-}
-
-/* Linker machinery.
-
-   CTF linking consists of adding CTF archives full of content to be merged into
+/* CTF linking consists of adding CTF archives full of content to be merged into
    this one to the current file (which must be writable) by calling
-   ctf_link_add_ctf().  Once this is done, a call to ctf_link() will merge the
-   type tables together, generating new CTF files as needed, with this one as a
-   parent, to contain types from the inputs which conflict.
-   ctf_link_add_strtab() takes a callback which provides string/offset pairs to
-   be added to the external symbol table and deduplicated from all CTF string
-   tables in the output link; ctf_link_shuffle_syms() takes a callback which
-   provides symtab entries in ascending order, and shuffles the function and
-   data sections to match; and ctf_link_write() emits a CTF file (if there are
-   no conflicts requiring per-compilation-unit sub-CTF files) or CTF archives
-   (otherwise) and returns it, suitable for addition in the .ctf section of the
-   output.  */
+   ctf_link_add_ctf.  Once this is done, a call to ctf_link will merge the type
+   tables together, generating new CTF files as needed, with this one as a
+   parent, to contain types from the inputs which conflict.  ctf_link_add_strtab
+   takes a callback which provides string/offset pairs to be added to the
+   external symbol table and deduplicated from all CTF string tables in the
+   output link; ctf_link_shuffle_syms takes a callback which provides symtab
+   entries in ascending order, and shuffles the function and data sections to
+   match; and ctf_link_write emits a CTF file (if there are no conflicts
+   requiring per-compilation-unit sub-CTF files) or CTF archives (otherwise) and
+   returns it, suitable for addition in the .ctf section of the output.  */
 
 /* Return the name of the compilation unit this CTF dict or its parent applies
    to, or a non-null string otherwise: prefer the parent.  Used in debugging
    output.  Sometimes used for outputs too.  */
 const char *
-ctf_link_input_name (ctf_file_t *fp)
+ctf_link_input_name (ctf_dict_t *fp)
 {
   if (fp->ctf_parent && fp->ctf_parent->ctf_cuname)
     return fp->ctf_parent->ctf_cuname;
@@ -155,17 +51,30 @@ ctf_link_input_name (ctf_file_t *fp)
     return "(unnamed)";
 }
 
+/* Return the cuname of a dict, or the string "unnamed-CU" if none.  */
+
+static const char *
+ctf_unnamed_cuname (ctf_dict_t *fp)
+{
+  const char *cuname = ctf_cuname (fp);
+
+  if (!cuname)
+    cuname = "unnamed-CU";
+
+  return cuname;
+}
+
 /* The linker inputs look like this.  clin_fp is used for short-circuited
    CU-mapped links that can entirely avoid the first link phase in some
-   situations in favour of just passing on the contained ctf_file_t: it is
-   always the sole ctf_file_t inside the corresponding clin_arc.  If set, it
+   situations in favour of just passing on the contained ctf_dict_t: it is
+   always the sole ctf_dict_t inside the corresponding clin_arc.  If set, it
    gets assigned directly to the final link inputs and freed from there, so it
    never gets explicitly freed in the ctf_link_input.  */
 typedef struct ctf_link_input
 {
   const char *clin_filename;
   ctf_archive_t *clin_arc;
-  ctf_file_t *clin_fp;
+  ctf_dict_t *clin_fp;
   int n;
 } ctf_link_input_t;
 
@@ -181,8 +90,8 @@ ctf_link_input_close (void *input)
 /* Like ctf_link_add_ctf, below, but with no error-checking, so it can be called
    in the middle of an ongoing link.  */
 static int
-ctf_link_add_ctf_internal (ctf_file_t *fp, ctf_archive_t *ctf,
-                          ctf_file_t *fp_input, const char *name)
+ctf_link_add_ctf_internal (ctf_dict_t *fp, ctf_archive_t *ctf,
+                          ctf_dict_t *fp_input, const char *name)
 {
   ctf_link_input_t *input = NULL;
   char *dupname = NULL;
@@ -228,7 +137,7 @@ ctf_link_add_ctf_internal (ctf_file_t *fp, ctf_archive_t *ctf,
     implemented.  */
 
 static int
-ctf_link_add (ctf_file_t *fp, ctf_archive_t *ctf, const char *name,
+ctf_link_add (ctf_dict_t *fp, ctf_archive_t *ctf, const char *name,
              void *buf _libctf_unused_, size_t n _libctf_unused_)
 {
   if (buf)
@@ -275,38 +184,80 @@ ctf_link_add (ctf_file_t *fp, ctf_archive_t *ctf, const char *name,
     final link output, but otherwise is not important.  */
 
 int
-ctf_link_add_ctf (ctf_file_t *fp, ctf_archive_t *ctf, const char *name)
+ctf_link_add_ctf (ctf_dict_t *fp, ctf_archive_t *ctf, const char *name)
 {
   return ctf_link_add (fp, ctf, name, NULL, 0);
 }
 
+/* Lazily open a CTF archive for linking, if not already open.
+
+   Returns the number of files contained within the opened archive (0 for none),
+   or -1 on error, as usual.  */
+static ssize_t
+ctf_link_lazy_open (ctf_dict_t *fp, ctf_link_input_t *input)
+{
+  size_t count;
+  int err;
+
+  if (input->clin_arc)
+    return ctf_archive_count (input->clin_arc);
+
+  if (input->clin_fp)
+    return 1;
+
+  /* See ctf_link_add_ctf.  */
+#if defined (PIC) || !NOBFD
+  input->clin_arc = ctf_open (input->clin_filename, NULL, &err);
+#else
+  ctf_err_warn (fp, 0, ECTF_NEEDSBFD, _("cannot open %s lazily"),
+               input->clin_filename);
+  ctf_set_errno (fp, ECTF_NEEDSBFD);
+  return -1;
+#endif
+
+  /* Having no CTF sections is not an error.  We just don't need to do
+     anything.  */
+
+  if (!input->clin_arc)
+    {
+      if (err == ECTF_NOCTFDATA)
+       return 0;
+
+      ctf_err_warn (fp, 0, err, _("opening CTF %s failed"),
+                   input->clin_filename);
+      ctf_set_errno (fp, err);
+      return -1;
+    }
+
+  if ((count = ctf_archive_count (input->clin_arc)) == 0)
+    ctf_arc_close (input->clin_arc);
+
+  return (ssize_t) count;
+}
+
 /* Return a per-CU output CTF dictionary suitable for the given CU, creating and
    interning it if need be.  */
 
-static ctf_file_t *
-ctf_create_per_cu (ctf_file_t *fp, const char *filename, const char *cuname)
+_libctf_nonnull_((1,2))
+static ctf_dict_t *
+ctf_create_per_cu (ctf_dict_t *fp, const char *cu_name)
 {
-  ctf_file_t *cu_fp;
+  ctf_dict_t *cu_fp;
   const char *ctf_name = NULL;
   char *dynname = NULL;
 
   /* First, check the mapping table and translate the per-CU name we use
-     accordingly.  We check both the input filename and the CU name.  Only if
-     neither are set do we fall back to the input filename as the per-CU
-     dictionary name.  We prefer the filename because this is easier for likely
-     callers to determine.  */
+     accordingly.  */
 
   if (fp->ctf_link_in_cu_mapping)
     {
-      if (((ctf_name = ctf_dynhash_lookup (fp->ctf_link_in_cu_mapping,
-                                          filename)) == NULL) &&
-         ((ctf_name = ctf_dynhash_lookup (fp->ctf_link_in_cu_mapping,
-                                          cuname)) == NULL))
-       ctf_name = filename;
+      if ((ctf_name = ctf_dynhash_lookup (fp->ctf_link_in_cu_mapping,
+                                         cu_name)) == NULL)
+       ctf_name = cu_name;
     }
 
   if (ctf_name == NULL)
-    ctf_name = filename;
+    ctf_name = cu_name;
 
   if ((cu_fp = ctf_dynhash_lookup (fp->ctf_link_outputs, ctf_name)) == NULL)
     {
@@ -315,8 +266,7 @@ ctf_create_per_cu (ctf_file_t *fp, const char *filename, const char *cuname)
       if ((cu_fp = ctf_create (&err)) == NULL)
        {
          ctf_err_warn (fp, 0, err, _("cannot create per-CU CTF archive for "
-                                     "CU %s from input file %s"),
-                       cuname, filename);
+                                     "input CU %s"), cu_name);
          ctf_set_errno (fp, err);
          return NULL;
        }
@@ -327,28 +277,28 @@ ctf_create_per_cu (ctf_file_t *fp, const char *filename, const char *cuname)
        goto oom;
 
       ctf_import_unref (cu_fp, fp);
-      ctf_cuname_set (cu_fp, cuname);
+      ctf_cuname_set (cu_fp, cu_name);
       ctf_parent_name_set (cu_fp, _CTF_SECTION);
     }
   return cu_fp;
 
  oom:
   free (dynname);
-  ctf_file_close (cu_fp);
+  ctf_dict_close (cu_fp);
   ctf_set_errno (fp, ENOMEM);
   return NULL;
 }
 
 /* Add a mapping directing that the CU named FROM should have its
-   conflicting/non-duplicate types (depending on link mode) go into a container
+   conflicting/non-duplicate types (depending on link mode) go into a dict
    named TO.  Many FROMs can share a TO.
 
-   We forcibly add a container named TO in every case, even though it may well
+   We forcibly add a dict named TO in every case, even though it may well
    wind up empty, because clients that use this facility usually expect to find
-   every TO container present, even if empty, and malfunction otherwise.  */
+   every TO dict present, even if empty, and malfunction otherwise.  */
 
 int
-ctf_link_add_cu_mapping (ctf_file_t *fp, const char *from, const char *to)
+ctf_link_add_cu_mapping (ctf_dict_t *fp, const char *from, const char *to)
 {
   int err;
   char *f = NULL, *t = NULL;
@@ -431,7 +381,7 @@ ctf_link_add_cu_mapping (ctf_file_t *fp, const char *from, const char *to)
    The changer function accepts a name and should return a new
    dynamically-allocated name, or NULL if the name should be left unchanged.  */
 void
-ctf_link_set_memb_name_changer (ctf_file_t *fp,
+ctf_link_set_memb_name_changer (ctf_dict_t *fp,
                                ctf_link_memb_name_changer_f *changer,
                                void *arg)
 {
@@ -439,101 +389,9 @@ ctf_link_set_memb_name_changer (ctf_file_t *fp,
   fp->ctf_link_memb_name_changer_arg = arg;
 }
 
-typedef struct ctf_link_in_member_cb_arg
-{
-  /* The shared output dictionary.  */
-  ctf_file_t *out_fp;
-
-  /* The filename of the input file, and an fp to each dictionary in that file
-     in turn.  */
-  const char *in_file_name;
-  ctf_file_t *in_fp;
-
-  /* The CU name of the dict being processed.  */
-  const char *cu_name;
-  int in_input_cu_file;
-
-  /* The parent dictionary in the input, and whether it's been processed yet.
-     Not needed by ctf_link_one_type / ctf_link_one_variable, only by higher
-     layers.  */
-  ctf_file_t *in_fp_parent;
-  int done_parent;
-
-  /* If true, this is the CU-mapped portion of a deduplicating link: no child
-     dictionaries should be created.  */
-  int cu_mapped;
-} ctf_link_in_member_cb_arg_t;
-
-/* Link one type into the link.  We rely on ctf_add_type() to detect
-   duplicates.  This is not terribly reliable yet (unnmamed types will be
-   mindlessly duplicated), but will improve shortly.  */
-
-static int
-ctf_link_one_type (ctf_id_t type, int isroot _libctf_unused_, void *arg_)
-{
-  ctf_link_in_member_cb_arg_t *arg = (ctf_link_in_member_cb_arg_t *) arg_;
-  ctf_file_t *per_cu_out_fp;
-  int err;
-
-  if (arg->in_fp->ctf_link_flags != CTF_LINK_SHARE_UNCONFLICTED)
-    {
-      ctf_err_warn (arg->out_fp, 0, ECTF_NOTYET,
-                   _("share-duplicated mode not yet implemented"));
-      return ctf_set_errno (arg->out_fp, ECTF_NOTYET);
-    }
-
-  /* Simply call ctf_add_type: if it reports a conflict and we're adding to the
-     main CTF file, add to the per-CU archive member instead, creating it if
-     necessary.  If we got this type from a per-CU archive member, add it
-     straight back to the corresponding member in the output.  */
-
-  if (!arg->in_input_cu_file)
-    {
-      if (ctf_add_type (arg->out_fp, arg->in_fp, type) != CTF_ERR)
-       return 0;
-
-      err = ctf_errno (arg->out_fp);
-      if (err != ECTF_CONFLICT)
-       {
-         if (err != ECTF_NONREPRESENTABLE)
-           ctf_err_warn (arg->out_fp, 1, 0,
-                         _("cannot link type %lx from input file %s, CU %s "
-                           "into output link"), type, arg->cu_name,
-                         arg->in_file_name);
-         /* We must ignore this problem or we end up losing future types, then
-            trying to link the variables in, then exploding.  Better to link as
-            much as possible.  */
-         return 0;
-       }
-      ctf_set_errno (arg->out_fp, 0);
-    }
-
-  if ((per_cu_out_fp = ctf_create_per_cu (arg->out_fp, arg->in_file_name,
-                                         arg->cu_name)) == NULL)
-    return -1;                                 /* Errno is set for us.  */
-
-  if (ctf_add_type (per_cu_out_fp, arg->in_fp, type) != CTF_ERR)
-    return 0;
-
-  err = ctf_errno (per_cu_out_fp);
-  if (err != ECTF_NONREPRESENTABLE)
-    ctf_err_warn (arg->out_fp, 1, 0,
-                 _("cannot link type %lx from input file %s, CU %s "
-                   "into output per-CU CTF archive member %s: %s: skipped"),
-                 type, ctf_link_input_name (arg->in_fp), arg->in_file_name,
-                 ctf_link_input_name (per_cu_out_fp), ctf_errmsg (err));
-  if (err == ECTF_CONFLICT)
-      /* Conflicts are possible at this stage only if a non-ld user has combined
-        multiple TUs into a single output dictionary.  Even in this case we do not
-        want to stop the link or propagate the error.  */
-      ctf_set_errno (arg->out_fp, 0);
-
-  return 0;                                    /* As above: do not lose types.  */
-}
-
 /* Set a function which is used to filter out unwanted variables from the link.  */
 int
-ctf_link_set_variable_filter (ctf_file_t *fp, ctf_link_variable_filter_f *filter,
+ctf_link_set_variable_filter (ctf_dict_t *fp, ctf_link_variable_filter_f *filter,
                              void *arg)
 {
   fp->ctf_link_variable_filter = filter;
@@ -541,10 +399,10 @@ ctf_link_set_variable_filter (ctf_file_t *fp, ctf_link_variable_filter_f *filter
   return 0;
 }
 
-/* Check if we can safely add a variable with the given type to this container.  */
+/* Check if we can safely add a variable with the given type to this dict.  */
 
 static int
-check_variable (const char *name, ctf_file_t *fp, ctf_id_t type,
+check_variable (const char *name, ctf_dict_t *fp, ctf_id_t type,
                ctf_dvdef_t **out_dvd)
 {
   ctf_dvdef_t *dvd;
@@ -566,49 +424,48 @@ check_variable (const char *name, ctf_file_t *fp, ctf_id_t type,
   return 0;                                  /* Already exists.  */
 }
 
-/* Link one variable in.  */
+/* Link one variable named NAME of type TYPE found in IN_FP into FP.  */
 
 static int
-ctf_link_one_variable (const char *name, ctf_id_t type, void *arg_)
+ctf_link_one_variable (ctf_dict_t *fp, ctf_dict_t *in_fp, const char *name,
+                      ctf_id_t type, int cu_mapped)
 {
-  ctf_link_in_member_cb_arg_t *arg = (ctf_link_in_member_cb_arg_t *) arg_;
-  ctf_file_t *per_cu_out_fp;
+  ctf_dict_t *per_cu_out_fp;
   ctf_id_t dst_type = 0;
-  ctf_file_t *check_fp;
   ctf_dvdef_t *dvd;
 
   /* See if this variable is filtered out.  */
 
-  if (arg->out_fp->ctf_link_variable_filter)
+  if (fp->ctf_link_variable_filter)
     {
-      void *farg = arg->out_fp->ctf_link_variable_filter_arg;
-      if (arg->out_fp->ctf_link_variable_filter (arg->in_fp, name, type, farg))
+      void *farg = fp->ctf_link_variable_filter_arg;
+      if (fp->ctf_link_variable_filter (in_fp, name, type, farg))
        return 0;
     }
 
-  /* In unconflicted link mode, if this type is mapped to a type in the parent
-     container, we want to try to add to that first: if it reports a duplicate,
-     or if the type is in a child already, add straight to the child.  */
+  /* If this type is mapped to a type in the parent dict, we want to try to add
+     to that first: if it reports a duplicate, or if the type is in a child
+     already, add straight to the child.  */
 
-  check_fp = arg->out_fp;
+  if ((dst_type = ctf_dedup_type_mapping (fp, in_fp, type)) == CTF_ERR)
+    return -1;                                 /* errno is set for us.  */
 
-  dst_type = ctf_type_mapping (arg->in_fp, type, &check_fp);
   if (dst_type != 0)
     {
-      if (check_fp == arg->out_fp)
-       {
-         if (check_variable (name, check_fp, dst_type, &dvd))
-           {
-             /* No variable here: we can add it.  */
-             if (ctf_add_variable (check_fp, name, dst_type) < 0)
-               return (ctf_set_errno (arg->out_fp, ctf_errno (check_fp)));
-             return 0;
-           }
+      if (!ctf_assert (fp, ctf_type_isparent (fp, dst_type)))
+       return -1;                              /* errno is set for us.  */
 
-         /* Already present?  Nothing to do.  */
-         if (dvd && dvd->dvd_type == dst_type)
-           return 0;
+      if (check_variable (name, fp, dst_type, &dvd))
+       {
+         /* No variable here: we can add it.  */
+         if (ctf_add_variable (fp, name, dst_type) < 0)
+           return -1;                          /* errno is set for us.  */
+         return 0;
        }
+
+      /* Already present?  Nothing to do.  */
+      if (dvd && dvd->dvd_type == dst_type)
+       return 0;
     }
 
   /* Can't add to the parent due to a name clash, or because it references a
@@ -616,30 +473,29 @@ ctf_link_one_variable (const char *name, ctf_id_t type, void *arg_)
      be.  If we can't do that, skip it.  Don't add to a child if we're doing a
      CU-mapped link, since that has only one output.  */
 
-  if (arg->cu_mapped)
+  if (cu_mapped)
     {
       ctf_dprintf ("Variable %s in input file %s depends on a type %lx hidden "
-                  "due to conflicts: skipped.\n", name, arg->in_file_name,
-                  type);
+                  "due to conflicts: skipped.\n", name,
+                  ctf_unnamed_cuname (in_fp), type);
       return 0;
     }
 
-  if ((per_cu_out_fp = ctf_create_per_cu (arg->out_fp, arg->in_file_name,
-                                         arg->cu_name)) == NULL)
-    return -1;                                 /* Errno is set for us.  */
+  if ((per_cu_out_fp = ctf_create_per_cu (fp, ctf_unnamed_cuname (in_fp))) == NULL)
+    return -1;                                 /* errno is set for us.  */
 
-  /* If the type was not found, check for it in the child too. */
+  /* If the type was not found, check for it in the child too.  */
   if (dst_type == 0)
     {
-      check_fp = per_cu_out_fp;
-      dst_type = ctf_type_mapping (arg->in_fp, type, &check_fp);
+      if ((dst_type = ctf_dedup_type_mapping (per_cu_out_fp,
+                                             in_fp, type)) == CTF_ERR)
+       return -1;                              /* errno is set for us.   */
 
       if (dst_type == 0)
        {
-         ctf_err_warn (arg->out_fp, 1, 0,
-                       _("type %lx for variable %s in input file %s "
-                         "not found: skipped"), type, name,
-                       arg->in_file_name);
+         ctf_err_warn (fp, 1, 0, _("type %lx for variable %s in input file %s "
+                                   "not found: skipped"), type, name,
+                       ctf_unnamed_cuname (in_fp));
          /* Do not terminate the link: just skip the variable.  */
          return 0;
        }
@@ -647,187 +503,14 @@ ctf_link_one_variable (const char *name, ctf_id_t type, void *arg_)
 
   if (check_variable (name, per_cu_out_fp, dst_type, &dvd))
     if (ctf_add_variable (per_cu_out_fp, name, dst_type) < 0)
-      return (ctf_set_errno (arg->out_fp, ctf_errno (per_cu_out_fp)));
-  return 0;
-}
-
-/* Merge every type (and optionally, variable) in this archive member into the
-   link, so we can relink things that have already had ld run on them.  We use
-   the archive member name, sans any leading '.ctf.', as the CU name for
-   ambiguous types if there is one and it's not the default: otherwise, we use
-   the name of the input file.  */
-static int
-ctf_link_one_input_archive_member (ctf_file_t *in_fp, const char *name, void *arg_)
-{
-  ctf_link_in_member_cb_arg_t *arg = (ctf_link_in_member_cb_arg_t *) arg_;
-  int err = 0;
-
-  if (strcmp (name, _CTF_SECTION) == 0)
-    {
-      /* This file is the default member of this archive, and has already been
-        explicitly processed.
-
-        In the default sharing mode of CTF_LINK_SHARE_UNCONFLICTED, it does no
-        harm to rescan an existing shared repo again: all the types will just
-        end up in the same place.  But in CTF_LINK_SHARE_DUPLICATED mode, this
-        causes the system to erroneously conclude that all types are duplicated
-        and should be shared, even if they are not.  */
-
-      if (arg->done_parent)
-       return 0;
-    }
-  else
-    {
-      /* Get ambiguous types from our parent.  */
-      ctf_import (in_fp, arg->in_fp_parent);
-      arg->in_input_cu_file = 1;
-    }
-
-  arg->cu_name = name;
-  if (strncmp (arg->cu_name, ".ctf.", strlen (".ctf.")) == 0)
-    arg->cu_name += strlen (".ctf.");
-  arg->in_fp = in_fp;
-
-  if ((err = ctf_type_iter_all (in_fp, ctf_link_one_type, arg)) > -1)
-    if (!(in_fp->ctf_link_flags & CTF_LINK_OMIT_VARIABLES_SECTION))
-      err = ctf_variable_iter (in_fp, ctf_link_one_variable, arg);
-
-  arg->in_input_cu_file = 0;
-
-  if (err < 0)
-      return -1;                               /* Errno is set for us.  */
-
+      return (ctf_set_errno (fp, ctf_errno (per_cu_out_fp)));
   return 0;
 }
 
-/* Dump the unnecessary link type mapping after one input file is processed.  */
-static void
-empty_link_type_mapping (void *key _libctf_unused_, void *value,
-                        void *arg _libctf_unused_)
-{
-  ctf_file_t *fp = (ctf_file_t *) value;
-
-  if (fp->ctf_link_type_mapping)
-    ctf_dynhash_empty (fp->ctf_link_type_mapping);
-}
-
-/* Lazily open a CTF archive for linking, if not already open.
-
-   Returns the number of files contained within the opened archive (0 for none),
-   or -1 on error, as usual.  */
-static ssize_t
-ctf_link_lazy_open (ctf_file_t *fp, ctf_link_input_t *input)
-{
-  size_t count;
-  int err;
-
-  if (input->clin_arc)
-    return ctf_archive_count (input->clin_arc);
-
-  if (input->clin_fp)
-    return 1;
-
-  /* See ctf_link_add_ctf.  */
-#if defined (PIC) || !NOBFD
-  input->clin_arc = ctf_open (input->clin_filename, NULL, &err);
-#else
-  ctf_err_warn (fp, 0, ECTF_NEEDSBFD, _("cannot open %s lazily"),
-               input->clin_filename);
-  ctf_set_errno (fp, ECTF_NEEDSBFD);
-  return -1;
-#endif
-
-  /* Having no CTF sections is not an error.  We just don't need to do
-     anything.  */
-
-  if (!input->clin_arc)
-    {
-      if (err == ECTF_NOCTFDATA)
-       return 0;
-
-      ctf_err_warn (fp, 0, err, _("opening CTF %s failed"),
-                   input->clin_filename);
-      ctf_set_errno (fp, err);
-      return -1;
-    }
-
-  if ((count = ctf_archive_count (input->clin_arc)) == 0)
-    ctf_arc_close (input->clin_arc);
-
-  return (ssize_t) count;
-}
-
-/* Close an input, as a ctf_dynhash_iter iterator.  */
-static void
-ctf_link_close_one_input_archive (void *key _libctf_unused_, void *value,
-                                 void *arg _libctf_unused_)
-{
-  ctf_link_input_t *input = (ctf_link_input_t *) value;
-  if (input->clin_arc)
-    ctf_arc_close (input->clin_arc);
-  input->clin_arc = NULL;
-}
-
-/* Link one input file's types into the output file.  */
-static void
-ctf_link_one_input_archive (void *key, void *value, void *arg_)
-{
-  const char *file_name = (const char *) key;
-  ctf_link_input_t *input = (ctf_link_input_t *)value;
-  ctf_link_in_member_cb_arg_t *arg = (ctf_link_in_member_cb_arg_t *) arg_;
-  int err = 0;
-
-  if (!input->clin_arc)
-    {
-      err = ctf_link_lazy_open (arg->out_fp, input);
-      if (err == 0)                            /* Just no CTF.  */
-       return;
-
-      if (err < 0)
-       return;                                 /* errno is set for us.  */
-    }
-
-  arg->in_file_name = file_name;
-  arg->done_parent = 0;
-  if ((arg->in_fp_parent = ctf_arc_open_by_name (input->clin_arc, NULL,
-                                                &err)) == NULL)
-    if (err != ECTF_ARNNAME)
-      {
-       ctf_err_warn (arg->out_fp, 1, 0,
-                     _("cannot open main archive member in input file %s "
-                       "in the link: skipping: %s"), arg->in_file_name,
-                     ctf_errmsg (err));
-       goto out;
-      }
-
-  if (ctf_link_one_input_archive_member (arg->in_fp_parent,
-                                        _CTF_SECTION, arg) < 0)
-    {
-      ctf_file_close (arg->in_fp_parent);
-      goto out;
-    }
-  arg->done_parent = 1;
-  if (ctf_archive_iter (input->clin_arc, ctf_link_one_input_archive_member,
-                       arg) < 0)
-    ctf_err_warn (arg->out_fp, 0, 0, _("cannot traverse archive in input file "
-                                      "%s: link cannot continue"),
-                 arg->in_file_name);
-  else
-    {
-      /* The only error indication to the caller is the errno: so ensure that it
-        is zero if there was no actual error from the caller.  */
-      ctf_set_errno (arg->out_fp, 0);
-    }
-  ctf_file_close (arg->in_fp_parent);
-
- out:
-  ctf_link_close_one_input_archive (key, value, NULL);
-}
-
 typedef struct link_sort_inputs_cb_arg
 {
   int is_cu_mapped;
-  ctf_file_t *fp;
+  ctf_dict_t *fp;
 } link_sort_inputs_cb_arg_t;
 
 /* Sort the inputs by N (the link order).  For CU-mapped links, this is a
@@ -875,7 +558,7 @@ ctf_link_sort_inputs (const ctf_next_hkv_t *one, const ctf_next_hkv_t *two,
    and optionally the name and ctf_link_input_t of the single input archive if
    only one exists (no matter how many dicts it contains).  */
 static ssize_t
-ctf_link_deduplicating_count_inputs (ctf_file_t *fp, ctf_dynhash_t *cu_names,
+ctf_link_deduplicating_count_inputs (ctf_dict_t *fp, ctf_dynhash_t *cu_names,
                                     ctf_link_input_t **only_one_input)
 {
   ctf_dynhash_t *inputs = fp->ctf_link_inputs;
@@ -952,23 +635,23 @@ ctf_link_deduplicating_count_inputs (ctf_file_t *fp, ctf_dynhash_t *cu_names,
 
    If no inputs exist that correspond to these CUs, return NULL with the errno
    set to ECTF_NOCTFDATA.  */
-static ctf_file_t **
-ctf_link_deduplicating_open_inputs (ctf_file_t *fp, ctf_dynhash_t *cu_names,
+static ctf_dict_t **
+ctf_link_deduplicating_open_inputs (ctf_dict_t *fp, ctf_dynhash_t *cu_names,
                                    ssize_t ninputs, uint32_t **parents)
 {
   ctf_dynhash_t *inputs = fp->ctf_link_inputs;
   ctf_next_t *i = NULL;
   void *name, *input;
   link_sort_inputs_cb_arg_t sort_arg;
-  ctf_file_t **dedup_inputs = NULL;
-  ctf_file_t **walk;
+  ctf_dict_t **dedup_inputs = NULL;
+  ctf_dict_t **walk;
   uint32_t *parents_ = NULL;
   int err;
 
   if (cu_names)
     inputs = cu_names;
 
-  if ((dedup_inputs = calloc (ninputs, sizeof (ctf_file_t *))) == NULL)
+  if ((dedup_inputs = calloc (ninputs, sizeof (ctf_dict_t *))) == NULL)
     goto oom;
 
   if ((parents_ = calloc (ninputs, sizeof (uint32_t))) == NULL)
@@ -987,8 +670,8 @@ ctf_link_deduplicating_open_inputs (ctf_file_t *fp, ctf_dynhash_t *cu_names,
     {
       const char *one_name = (const char *) name;
       ctf_link_input_t *one_input;
-      ctf_file_t *one_fp;
-      ctf_file_t *parent_fp = NULL;
+      ctf_dict_t *one_fp;
+      ctf_dict_t *parent_fp = NULL;
       uint32_t parent_i;
       ctf_next_t *j = NULL;
 
@@ -1015,8 +698,8 @@ ctf_link_deduplicating_open_inputs (ctf_file_t *fp, ctf_dynhash_t *cu_names,
         multiple members.  We assume, as elsewhere, that the parent is named
         _CTF_SECTION.  */
 
-      if ((parent_fp = ctf_arc_open_by_name (one_input->clin_arc,
-                                            _CTF_SECTION, &err)) == NULL)
+      if ((parent_fp = ctf_dict_open (one_input->clin_arc, _CTF_SECTION,
+                                     &err)) == NULL)
        {
          if (err != ECTF_NOMEMBNAM)
            {
@@ -1088,8 +771,8 @@ ctf_link_deduplicating_open_inputs (ctf_file_t *fp, ctf_dynhash_t *cu_names,
    CU_NAMES.  If CU_NAMES is not specified, close all the ctf_link_inputs in one
    go, leaving it empty.  */
 static int
-ctf_link_deduplicating_close_inputs (ctf_file_t *fp, ctf_dynhash_t *cu_names,
-                                    ctf_file_t **inputs, ssize_t ninputs)
+ctf_link_deduplicating_close_inputs (ctf_dict_t *fp, ctf_dynhash_t *cu_names,
+                                    ctf_dict_t **inputs, ssize_t ninputs)
 {
   ctf_next_t *it = NULL;
   void *name;
@@ -1099,7 +782,7 @@ ctf_link_deduplicating_close_inputs (ctf_file_t *fp, ctf_dynhash_t *cu_names,
   /* This is the inverse of ctf_link_deduplicating_open_inputs: so first, close
      all the individual input dicts, opened by the archive iterator.  */
   for (i = 0; i < ninputs; i++)
-    ctf_file_close (inputs[i]);
+    ctf_dict_close (inputs[i]);
 
   /* Now close the archives they are part of.  */
   if (cu_names)
@@ -1124,38 +807,230 @@ ctf_link_deduplicating_close_inputs (ctf_file_t *fp, ctf_dynhash_t *cu_names,
   return 0;
 }
 
-/* Do a deduplicating link of all variables in the inputs.  */
+/* Do a deduplicating link of all variables in the inputs.
+
+   Also, if we are not omitting the variable section, integrate all symbols from
+   the symtypetabs into the variable section too.  (Duplication with the
+   symtypetab section in the output will be eliminated at serialization time.)  */
+
 static int
-ctf_link_deduplicating_variables (ctf_file_t *fp, ctf_file_t **inputs,
+ctf_link_deduplicating_variables (ctf_dict_t *fp, ctf_dict_t **inputs,
                                  size_t ninputs, int cu_mapped)
 {
-  ctf_link_in_member_cb_arg_t arg;
   size_t i;
 
-  arg.cu_mapped = cu_mapped;
-  arg.out_fp = fp;
-  arg.in_input_cu_file = 0;
-
   for (i = 0; i < ninputs; i++)
     {
-      arg.in_fp = inputs[i];
-      if (ctf_cuname (inputs[i]) != NULL)
-       arg.in_file_name = ctf_cuname (inputs[i]);
+      ctf_next_t *it = NULL;
+      ctf_id_t type;
+      const char *name;
+
+      /* First the variables on the inputs.  */
+
+      while ((type = ctf_variable_next (inputs[i], &it, &name)) != CTF_ERR)
+       {
+         if (ctf_link_one_variable (fp, inputs[i], name, type, cu_mapped) < 0)
+           {
+             ctf_next_destroy (it);
+             return -1;                        /* errno is set for us.  */
+           }
+       }
+      if (ctf_errno (inputs[i]) != ECTF_NEXT_END)
+       return ctf_set_errno (fp, ctf_errno (inputs[i]));
+
+      /* Next the symbols.  We integrate data symbols even though the compiler
+        is currently doing the same, to allow the compiler to stop in
+        future.  */
+
+      while ((type = ctf_symbol_next (inputs[i], &it, &name, 0)) != CTF_ERR)
+       {
+         if (ctf_link_one_variable (fp, inputs[i], name, type, 1) < 0)
+           {
+             ctf_next_destroy (it);
+             return -1;                        /* errno is set for us.  */
+           }
+       }
+      if (ctf_errno (inputs[i]) != ECTF_NEXT_END)
+       return ctf_set_errno (fp, ctf_errno (inputs[i]));
+
+      /* Finally the function symbols.  */
+
+      while ((type = ctf_symbol_next (inputs[i], &it, &name, 1)) != CTF_ERR)
+       {
+         if (ctf_link_one_variable (fp, inputs[i], name, type, 1) < 0)
+           {
+             ctf_next_destroy (it);
+             return -1;                        /* errno is set for us.  */
+           }
+       }
+      if (ctf_errno (inputs[i]) != ECTF_NEXT_END)
+       return ctf_set_errno (fp, ctf_errno (inputs[i]));
+    }
+  return 0;
+}
+
+/* Check for symbol conflicts during linking.  Three possibilities: already
+   exists, conflicting, or nonexistent.  We don't have a dvd structure we can
+   use as a flag like check_variable does, so we use a tristate return
+   value instead: -1: conflicting; 1: nonexistent: 0: already exists.  */
+
+static int
+check_sym (ctf_dict_t *fp, const char *name, ctf_id_t type, int functions)
+{
+  ctf_dynhash_t *thishash = functions ? fp->ctf_funchash : fp->ctf_objthash;
+  ctf_dynhash_t *thathash = functions ? fp->ctf_objthash : fp->ctf_funchash;
+  void *value;
+
+  /* Wrong type (function when object is wanted, etc).  */
+  if (ctf_dynhash_lookup_kv (thathash, name, NULL, NULL))
+    return -1;
+
+  /* Not present at all yet.  */
+  if (!ctf_dynhash_lookup_kv (thishash, name, NULL, &value))
+    return 1;
+
+  /* Already present.  */
+  if ((ctf_id_t) (uintptr_t) value == type)
+    return 0;
+
+  /* Wrong type.  */
+  return -1;
+}
+
+/* Do a deduplicating link of one symtypetab (function info or data object) in
+   one input dict.  */
+
+static int
+ctf_link_deduplicating_one_symtypetab (ctf_dict_t *fp, ctf_dict_t *input,
+                                      int cu_mapped, int functions)
+{
+  ctf_next_t *it = NULL;
+  const char *name;
+  ctf_id_t type;
+
+  while ((type = ctf_symbol_next (input, &it, &name, functions)) != CTF_ERR)
+    {
+      ctf_id_t dst_type;
+      ctf_dict_t *per_cu_out_fp;
+      int sym;
+
+      /* Look in the parent first.  */
+
+      if ((dst_type = ctf_dedup_type_mapping (fp, input, type)) == CTF_ERR)
+       return -1;                              /* errno is set for us.  */
+
+      if (dst_type != 0)
+       {
+         if (!ctf_assert (fp, ctf_type_isparent (fp, dst_type)))
+           return -1;                          /* errno is set for us.  */
+
+         sym = check_sym (fp, name, dst_type, functions);
+
+         /* Already present: next symbol.  */
+         if (sym == 0)
+           continue;
+         /* Not present: add it.  */
+         else if (sym > 0)
+           {
+             if (ctf_add_funcobjt_sym (fp, functions,
+                                       name, dst_type) < 0)
+               return -1;                      /* errno is set for us.  */
+             continue;
+           }
+       }
+
+      /* Can't add to the parent due to a name clash (most unlikely), or because
+        it references a type only present in the child.  Try adding to the
+        child, creating if need be.  If we can't do that, skip it.  Don't add
+        to a child if we're doing a CU-mapped link, since that has only one
+        output.  */
+      if (cu_mapped)
+       {
+         ctf_dprintf ("Symbol %s in input file %s depends on a type %lx "
+                      "hidden due to conflicts: skipped.\n", name,
+                      ctf_unnamed_cuname (input), type);
+         continue;
+       }
+
+      if ((per_cu_out_fp = ctf_create_per_cu (fp, ctf_unnamed_cuname (input))) == NULL)
+       return -1;                              /* errno is set for us.  */
+
+      /* If the type was not found, check for it in the child too.  */
+      if (dst_type == 0)
+       {
+         if ((dst_type = ctf_dedup_type_mapping (per_cu_out_fp,
+                                                 input, type)) == CTF_ERR)
+           return -1;                          /* errno is set for us.  */
+
+         if (dst_type == 0)
+           {
+             ctf_err_warn (fp, 1, 0,
+                           _("type %lx for symbol %s in input file %s "
+                             "not found: skipped"), type, name,
+                           ctf_unnamed_cuname (input));
+             continue;
+           }
+       }
+
+      sym = check_sym (per_cu_out_fp, name, dst_type, functions);
+
+      /* Already present: next symbol.  */
+      if (sym == 0)
+       continue;
+      /* Not present: add it.  */
+      else if (sym > 0)
+       {
+         if (ctf_add_funcobjt_sym (per_cu_out_fp, functions,
+                                   name, dst_type) < 0)
+           return -1;                          /* errno is set for us.  */
+       }
       else
-       arg.in_file_name = "unnamed-CU";
-      arg.cu_name = arg.in_file_name;
-      if (ctf_variable_iter (arg.in_fp, ctf_link_one_variable, &arg) < 0)
-       return ctf_set_errno (fp, ctf_errno (arg.in_fp));
+       {
+         /* Perhaps this should be an assertion failure.  */
+         ctf_err_warn (fp, 0, ECTF_DUPLICATE,
+                       _("symbol %s in input file %s found conflicting "
+                         "even when trying in per-CU dict."), name,
+                       ctf_unnamed_cuname (input));
+         return (ctf_set_errno (fp, ECTF_DUPLICATE));
+       }
+    }
+  if (ctf_errno (input) != ECTF_NEXT_END)
+    {
+      ctf_set_errno (fp, ctf_errno (input));
+      ctf_err_warn (fp, 0, ctf_errno (input),
+                   functions ? _("iterating over function symbols") :
+                   _("iterating over data symbols"));
+      return -1;
+    }
+
+  return 0;
+}
 
-      /* Outputs > 0 are per-CU.  */
-      arg.in_input_cu_file = 1;
+/* Do a deduplicating link of the function info and data objects
+   in the inputs.  */
+static int
+ctf_link_deduplicating_syms (ctf_dict_t *fp, ctf_dict_t **inputs,
+                            size_t ninputs, int cu_mapped)
+{
+  size_t i;
+
+  for (i = 0; i < ninputs; i++)
+    {
+      if (ctf_link_deduplicating_one_symtypetab (fp, inputs[i],
+                                                cu_mapped, 0) < 0)
+       return -1;                              /* errno is set for us.  */
+
+      if (ctf_link_deduplicating_one_symtypetab (fp, inputs[i],
+                                                cu_mapped, 1) < 0)
+       return -1;                              /* errno is set for us.  */
     }
+
   return 0;
 }
 
 /* Do the per-CU part of a deduplicating link.  */
 static int
-ctf_link_deduplicating_per_cu (ctf_file_t *fp)
+ctf_link_deduplicating_per_cu (ctf_dict_t *fp)
 {
   ctf_next_t *i = NULL;
   int err;
@@ -1172,9 +1047,9 @@ ctf_link_deduplicating_per_cu (ctf_file_t *fp)
     {
       const char *out_name = (const char *) out_cu;
       ctf_dynhash_t *in = (ctf_dynhash_t *) in_cus;
-      ctf_file_t *out = NULL;
-      ctf_file_t **inputs;
-      ctf_file_t **outputs;
+      ctf_dict_t *out = NULL;
+      ctf_dict_t **inputs;
+      ctf_dict_t **outputs;
       ctf_archive_t *in_arc;
       ssize_t ninputs;
       ctf_link_input_t *only_input;
@@ -1294,7 +1169,12 @@ ctf_link_deduplicating_per_cu (ctf_file_t *fp)
          goto err_inputs;
        }
       if (!ctf_assert (fp, noutputs == 1))
-       goto err_inputs_outputs;
+       {
+         size_t j;
+         for (j = 1; j < noutputs; j++)
+           ctf_dict_close (outputs[j]);
+         goto err_inputs_outputs;
+       }
 
       if (!(fp->ctf_link_flags & CTF_LINK_OMIT_VARIABLES_SECTION)
          && ctf_link_deduplicating_variables (out, inputs, ninputs, 1) < 0)
@@ -1305,6 +1185,13 @@ ctf_link_deduplicating_per_cu (ctf_file_t *fp)
          goto err_inputs_outputs;
        }
 
+      ctf_dedup_fini (out, outputs, noutputs);
+
+      /* For now, we omit symbol section linking for CU-mapped links, until it
+        is clear how to unify the symbol table across such links.  (Perhaps we
+        should emit an unconditionally indexed symtab, like the compiler
+        does.)  */
+
       if (ctf_link_deduplicating_close_inputs (fp, in, inputs, ninputs) < 0)
        {
          free (inputs);
@@ -1336,17 +1223,17 @@ ctf_link_deduplicating_per_cu (ctf_file_t *fp)
          goto err_outputs;
        }
 
-      ctf_file_close (out);
+      ctf_dict_close (out);
       free (outputs);
       continue;
 
     err_inputs_outputs:
       ctf_list_splice (&fp->ctf_errs_warnings, &outputs[0]->ctf_errs_warnings);
-      ctf_file_close (outputs[0]);
+      ctf_dict_close (outputs[0]);
       free (outputs);
     err_inputs:
       ctf_link_deduplicating_close_inputs (fp, in, inputs, ninputs);
-      ctf_file_close (out);
+      ctf_dict_close (out);
       free (inputs);
       free (parents);
     err_open_inputs:
@@ -1355,7 +1242,7 @@ ctf_link_deduplicating_per_cu (ctf_file_t *fp)
 
     err_outputs:
       ctf_list_splice (&fp->ctf_errs_warnings, &outputs[0]->ctf_errs_warnings);
-      ctf_file_close (outputs[0]);
+      ctf_dict_close (outputs[0]);
       free (outputs);
       ctf_next_destroy (i);
       return -1;                               /* Errno is set for us.  */
@@ -1372,10 +1259,10 @@ ctf_link_deduplicating_per_cu (ctf_file_t *fp)
 
 /* Do a deduplicating link using the ctf-dedup machinery.  */
 static void
-ctf_link_deduplicating (ctf_file_t *fp)
+ctf_link_deduplicating (ctf_dict_t *fp)
 {
   size_t i;
-  ctf_file_t **inputs, **outputs = NULL;
+  ctf_dict_t **inputs, **outputs = NULL;
   ssize_t ninputs;
   uint32_t noutputs;
   uint32_t *parents;
@@ -1416,7 +1303,11 @@ ctf_link_deduplicating (ctf_file_t *fp)
     }
 
   if (!ctf_assert (fp, outputs[0] == fp))
-    goto err;
+    {
+      for (i = 1; i < noutputs; i++)
+       ctf_dict_close (outputs[i]);
+      goto err;
+    }
 
   for (i = 0; i < noutputs; i++)
     {
@@ -1425,7 +1316,7 @@ ctf_link_deduplicating (ctf_file_t *fp)
       /* We already have access to this one.  Close the duplicate.  */
       if (i == 0)
        {
-         ctf_file_close (outputs[0]);
+         ctf_dict_close (outputs[0]);
          continue;
        }
 
@@ -1443,7 +1334,7 @@ ctf_link_deduplicating (ctf_file_t *fp)
       free (dynname);
 
       for (; i < noutputs; i++)
-       ctf_file_close (outputs[i]);
+       ctf_dict_close (outputs[i]);
       goto err;
     }
 
@@ -1452,11 +1343,18 @@ ctf_link_deduplicating (ctf_file_t *fp)
     {
       ctf_err_warn (fp, 0, 0, _("deduplicating link variable emission failed for "
                                "%s"), ctf_link_input_name (fp));
-      for (i = 1; i < noutputs; i++)
-       ctf_file_close (outputs[i]);
-      goto err;
+      goto err_clean_outputs;
     }
 
+  if (ctf_link_deduplicating_syms (fp, inputs, ninputs, 0) < 0)
+    {
+      ctf_err_warn (fp, 0, 0, _("deduplicating link symbol emission failed for "
+                               "%s"), ctf_link_input_name (fp));
+      goto err_clean_outputs;
+    }
+
+  ctf_dedup_fini (fp, outputs, noutputs);
+
   /* Now close all the inputs, including per-CU intermediates.  */
 
   if (ctf_link_deduplicating_close_inputs (fp, NULL, inputs, ninputs) < 0)
@@ -1469,24 +1367,29 @@ ctf_link_deduplicating (ctf_file_t *fp)
 
  err:
   for (i = 0; i < (size_t) ninputs; i++)
-    ctf_file_close (inputs[i]);
+    ctf_dict_close (inputs[i]);
   free (inputs);
   free (parents);
   free (outputs);
   return;
+
+ err_clean_outputs:
+  for (i = 1; i < noutputs; i++)
+    {
+      ctf_dynhash_remove (fp->ctf_link_outputs, ctf_cuname (outputs[i]));
+      ctf_dict_close (outputs[i]);
+    }
+  goto err;
 }
 
-/* Merge types and variable sections in all files added to the link
-   together.  All the added files are closed.  */
+/* Merge types and variable sections in all dicts added to the link together.
+   All the added dicts are closed.  */
 int
-ctf_link (ctf_file_t *fp, int flags)
+ctf_link (ctf_dict_t *fp, int flags)
 {
-  ctf_link_in_member_cb_arg_t arg;
   ctf_next_t *i = NULL;
   int err;
 
-  memset (&arg, 0, sizeof (struct ctf_link_in_member_cb_arg));
-  arg.out_fp = fp;
   fp->ctf_link_flags = flags;
 
   if (fp->ctf_link_inputs == NULL)
@@ -1496,7 +1399,7 @@ ctf_link (ctf_file_t *fp, int flags)
     fp->ctf_link_outputs = ctf_dynhash_create (ctf_hash_string,
                                               ctf_hash_eq_string, free,
                                               (ctf_hash_free_fun)
-                                              ctf_file_close);
+                                              ctf_dict_close);
 
   if (fp->ctf_link_outputs == NULL)
     return ctf_set_errno (fp, ENOMEM);
@@ -1505,6 +1408,7 @@ ctf_link (ctf_file_t *fp, int flags)
      links in succession with CTF_LINK_EMPTY_CU_MAPPINGS set in some calls and
      not set in others will do anything especially sensible.  */
 
+  fp->ctf_flags |= LCTF_LINKING;
   if (fp->ctf_link_out_cu_mapping && (flags & CTF_LINK_EMPTY_CU_MAPPINGS))
     {
       void *v;
@@ -1513,31 +1417,25 @@ ctf_link (ctf_file_t *fp, int flags)
                                      NULL)) == 0)
        {
          const char *to = (const char *) v;
-         if (ctf_create_per_cu (fp, to, to) == NULL)
+         if (ctf_create_per_cu (fp, to) == NULL)
            {
+             fp->ctf_flags &= ~LCTF_LINKING;
              ctf_next_destroy (i);
              return -1;                        /* Errno is set for us.  */
            }
        }
       if (err != ECTF_NEXT_END)
        {
+         fp->ctf_flags &= ~LCTF_LINKING;
          ctf_err_warn (fp, 1, err, _("iteration error creating empty CUs"));
          ctf_set_errno (fp, err);
          return -1;
        }
     }
 
-  if ((flags & CTF_LINK_NONDEDUP) || (getenv ("LD_NO_CTF_DEDUP")))
-    ctf_dynhash_iter (fp->ctf_link_inputs, ctf_link_one_input_archive,
-                     &arg);
-  else
-    ctf_link_deduplicating (fp);
-
-  /* Discard the now-unnecessary mapping table data from all the outputs.  */
-  if (fp->ctf_link_type_mapping)
-    ctf_dynhash_empty (fp->ctf_link_type_mapping);
-  ctf_dynhash_iter (fp->ctf_link_outputs, empty_link_type_mapping, NULL);
+  ctf_link_deduplicating (fp);
 
+  fp->ctf_flags &= ~LCTF_LINKING;
   if ((ctf_errno (fp) != 0) && (ctf_errno (fp) != ECTF_NOCTFDATA))
     return -1;
   return 0;
@@ -1555,7 +1453,7 @@ static void
 ctf_link_intern_extern_string (void *key _libctf_unused_, void *value,
                               void *arg_)
 {
-  ctf_file_t *fp = (ctf_file_t *) value;
+  ctf_dict_t *fp = (ctf_dict_t *) value;
   ctf_link_out_string_cb_arg_t *arg = (ctf_link_out_string_cb_arg_t *) arg_;
 
   fp->ctf_flags |= LCTF_DIRTY;
@@ -1566,11 +1464,11 @@ ctf_link_intern_extern_string (void *key _libctf_unused_, void *value,
 /* Repeatedly call ADD_STRING to acquire strings from the external string table,
    adding them to the atoms table for this CU and all subsidiary CUs.
 
-   If ctf_link() is also called, it must be called first if you want the new CTF
-   files ctf_link() can create to get their strings dedupped against the ELF
+   If ctf_link is also called, it must be called first if you want the new CTF
+   files ctf_link can create to get their strings dedupped against the ELF
    strtab properly.  */
 int
-ctf_link_add_strtab (ctf_file_t *fp, ctf_link_strtab_string_f *add_string,
+ctf_link_add_strtab (ctf_dict_t *fp, ctf_link_strtab_string_f *add_string,
                     void *arg)
 {
   const char *str;
@@ -1591,23 +1489,181 @@ ctf_link_add_strtab (ctf_file_t *fp, ctf_link_strtab_string_f *add_string,
        err = iter_arg.err;
     }
 
+  if (err)
+    ctf_set_errno (fp, err);
+
   return -err;
 }
 
-/* Not yet implemented.  */
+/* Inform the ctf-link machinery of a new symbol in the target symbol table
+   (which must be some symtab that is not usually stripped, and which
+   is in agreement with ctf_bfdopen_ctfsect).  May be called either before or
+   after ctf_link_add_strtab.  */
 int
-ctf_link_shuffle_syms (ctf_file_t *fp _libctf_unused_,
-                      ctf_link_iter_symbol_f *add_sym _libctf_unused_,
-                      void *arg _libctf_unused_)
+ctf_link_add_linker_symbol (ctf_dict_t *fp, ctf_link_sym_t *sym)
 {
+  ctf_in_flight_dynsym_t *cid;
+
+  /* Cheat a little: if there is already an ENOMEM error code recorded against
+     this dict, we shouldn't even try to add symbols because there will be no
+     memory to do so: probably we failed to add some previous symbol.  This
+     makes out-of-memory exits 'sticky' across calls to this function, so the
+     caller doesn't need to worry about error conditions.  */
+
+  if (ctf_errno (fp) == ENOMEM)
+    return -ENOMEM;                            /* errno is set for us.  */
+
+  if (ctf_symtab_skippable (sym))
+    return 0;
+
+  if (sym->st_type != STT_OBJECT && sym->st_type != STT_FUNC)
+    return 0;
+
+  /* Add the symbol to the in-flight list.  */
+
+  if ((cid = malloc (sizeof (ctf_in_flight_dynsym_t))) == NULL)
+    goto oom;
+
+  cid->cid_sym = *sym;
+  ctf_list_append (&fp->ctf_in_flight_dynsyms, cid);
+
   return 0;
+
+ oom:
+  ctf_dynhash_destroy (fp->ctf_dynsyms);
+  fp->ctf_dynsyms = NULL;
+  ctf_set_errno (fp, ENOMEM);
+  return -ENOMEM;
+}
+
+/* Impose an ordering on symbols.  The ordering takes effect immediately, but
+   since the ordering info does not include type IDs, lookups may return nothing
+   until such IDs are added by calls to ctf_add_*_sym.  Must be called after
+   ctf_link_add_strtab and ctf_link_add_linker_symbol.  */
+int
+ctf_link_shuffle_syms (ctf_dict_t *fp)
+{
+  ctf_in_flight_dynsym_t *did, *nid;
+  ctf_next_t *i = NULL;
+  int err = ENOMEM;
+  void *name_, *sym_;
+
+  if (!fp->ctf_dynsyms)
+    {
+      fp->ctf_dynsyms = ctf_dynhash_create (ctf_hash_string,
+                                           ctf_hash_eq_string,
+                                           NULL, free);
+      if (!fp->ctf_dynsyms)
+       {
+         ctf_set_errno (fp, ENOMEM);
+         return -ENOMEM;
+       }
+    }
+
+  /* Add all the symbols, excluding only those we already know are prohibited
+     from appearing in symtypetabs.  */
+
+  for (did = ctf_list_next (&fp->ctf_in_flight_dynsyms); did != NULL; did = nid)
+    {
+      ctf_link_sym_t *new_sym;
+
+      nid = ctf_list_next (did);
+      ctf_list_delete (&fp->ctf_in_flight_dynsyms, did);
+
+      /* We might get a name or an external strtab offset.  The strtab offset is
+        guaranteed resolvable at this point, so turn it into a string.  */
+
+      if (did->cid_sym.st_name == NULL)
+       {
+         uint32_t off = CTF_SET_STID (did->cid_sym.st_nameidx, CTF_STRTAB_1);
+
+         did->cid_sym.st_name = ctf_strraw (fp, off);
+         did->cid_sym.st_nameidx_set = 0;
+         if (!ctf_assert (fp, did->cid_sym.st_name != NULL))
+           return -ECTF_INTERNAL;              /* errno is set for us.  */
+       }
+
+      /* The symbol might have turned out to be nameless, so we have to recheck
+        for skippability here.  */
+      if (!ctf_symtab_skippable (&did->cid_sym))
+       {
+         ctf_dprintf ("symbol from linker: %s (%x)\n", did->cid_sym.st_name,
+                      did->cid_sym.st_symidx);
+
+         if ((new_sym = malloc (sizeof (ctf_link_sym_t))) == NULL)
+           goto local_oom;
+
+         memcpy (new_sym, &did->cid_sym, sizeof (ctf_link_sym_t));
+         if (ctf_dynhash_cinsert (fp->ctf_dynsyms, new_sym->st_name, new_sym) < 0)
+           goto local_oom;
+
+         if (fp->ctf_dynsymmax < new_sym->st_symidx)
+           fp->ctf_dynsymmax = new_sym->st_symidx;
+       }
+
+      free (did);
+      continue;
+
+    local_oom:
+      free (did);
+      free (new_sym);
+      goto err;
+    }
+
+  /* If no symbols are reported, unwind what we have done and return.  This
+     makes it a bit easier for the serializer to tell that no symbols have been
+     reported and that it should look elsewhere for reported symbols.  */
+  if (!ctf_dynhash_elements (fp->ctf_dynsyms))
+    {
+      ctf_dprintf ("No symbols: not a final link.\n");
+      ctf_dynhash_destroy (fp->ctf_dynsyms);
+      fp->ctf_dynsyms = NULL;
+      return 0;
+    }
+
+  /* Construct a mapping from shndx to the symbol info.  */
+  free (fp->ctf_dynsymidx);
+  if ((fp->ctf_dynsymidx = calloc (fp->ctf_dynsymmax + 1,
+                                  sizeof (ctf_link_sym_t *))) == NULL)
+    goto err;
+
+  while ((err = ctf_dynhash_next (fp->ctf_dynsyms, &i, &name_, &sym_)) == 0)
+    {
+      const char *name = (const char *) name;
+      ctf_link_sym_t *symp = (ctf_link_sym_t *) sym_;
+
+      if (!ctf_assert (fp, symp->st_symidx <= fp->ctf_dynsymmax))
+       {
+         ctf_next_destroy (i);
+         err = ctf_errno (fp);
+         goto err;
+       }
+      fp->ctf_dynsymidx[symp->st_symidx] = symp;
+    }
+  if (err != ECTF_NEXT_END)
+    {
+      ctf_err_warn (fp, 0, err, _("error iterating over shuffled symbols"));
+      goto err;
+    }
+  return 0;
+
+ err:
+  /* Leave the in-flight symbols around: they'll be freed at
+     dict close time regardless.  */
+  ctf_dynhash_destroy (fp->ctf_dynsyms);
+  fp->ctf_dynsyms = NULL;
+  free (fp->ctf_dynsymidx);
+  fp->ctf_dynsymidx = NULL;
+  fp->ctf_dynsymmax = 0;
+  ctf_set_errno (fp, err);
+  return -err;
 }
 
 typedef struct ctf_name_list_accum_cb_arg
 {
   char **names;
-  ctf_file_t *fp;
-  ctf_file_t **files;
+  ctf_dict_t *fp;
+  ctf_dict_t **files;
   size_t i;
   char **dynames;
   size_t ndynames;
@@ -1618,9 +1674,9 @@ static void
 ctf_accumulate_archive_names (void *key, void *value, void *arg_)
 {
   const char *name = (const char *) key;
-  ctf_file_t *fp = (ctf_file_t *) value;
+  ctf_dict_t *fp = (ctf_dict_t *) value;
   char **names;
-  ctf_file_t **files;
+  ctf_dict_t **files;
   ctf_name_list_accum_cb_arg_t *arg = (ctf_name_list_accum_cb_arg_t *) arg_;
 
   if ((names = realloc (arg->names, sizeof (char *) * ++(arg->i))) == NULL)
@@ -1630,7 +1686,7 @@ ctf_accumulate_archive_names (void *key, void *value, void *arg_)
       return;
     }
 
-  if ((files = realloc (arg->files, sizeof (ctf_file_t *) * arg->i)) == NULL)
+  if ((files = realloc (arg->files, sizeof (ctf_dict_t *) * arg->i)) == NULL)
     {
       (arg->i)--;
       ctf_set_errno (arg->fp, ENOMEM);
@@ -1675,23 +1731,52 @@ ctf_accumulate_archive_names (void *key, void *value, void *arg_)
 static void
 ctf_change_parent_name (void *key _libctf_unused_, void *value, void *arg)
 {
-  ctf_file_t *fp = (ctf_file_t *) value;
+  ctf_dict_t *fp = (ctf_dict_t *) value;
   const char *name = (const char *) arg;
 
   ctf_parent_name_set (fp, name);
 }
 
+/* Warn if we may suffer information loss because the CTF input files are too
+   old.  Usually we provide complete backward compatibility, but compiler
+   changes etc which never hit a release may have a flag in the header that
+   simply prevents those changes from being used.  */
+static void
+ctf_link_warn_outdated_inputs (ctf_dict_t *fp)
+{
+  ctf_next_t *i = NULL;
+  void *name_;
+  void *ifp_;
+  int err;
+
+  while ((err = ctf_dynhash_next (fp->ctf_link_inputs, &i, &name_, &ifp_)) == 0)
+    {
+      const char *name = (const char *) name_;
+      ctf_dict_t *ifp = (ctf_dict_t *) ifp_;
+
+      if (!(ifp->ctf_header->cth_flags & CTF_F_NEWFUNCINFO)
+         && (ifp->ctf_header->cth_varoff - ifp->ctf_header->cth_funcoff) > 0)
+       ctf_err_warn (ifp, 1, 0, _("linker input %s has CTF func info but uses "
+                                  "an old, unreleased func info format: "
+                                  "this func info section will be dropped."),
+                     name);
+    }
+  if (err != ECTF_NEXT_END)
+    ctf_err_warn (fp, 0, err, _("error checking for outdated inputs"));
+}
+
 /* Write out a CTF archive (if there are per-CU CTF files) or a CTF file
    (otherwise) into a new dynamically-allocated string, and return it.
    Members with sizes above THRESHOLD are compressed.  */
 unsigned char *
-ctf_link_write (ctf_file_t *fp, size_t *size, size_t threshold)
+ctf_link_write (ctf_dict_t *fp, size_t *size, size_t threshold)
 {
   ctf_name_list_accum_cb_arg_t arg;
   char **names;
   char *transformed_name = NULL;
-  ctf_file_t **files;
+  ctf_dict_t **files;
   FILE *f = NULL;
+  size_t i;
   int err;
   long fsize;
   const char *errloc;
@@ -1699,6 +1784,9 @@ ctf_link_write (ctf_file_t *fp, size_t *size, size_t threshold)
 
   memset (&arg, 0, sizeof (ctf_name_list_accum_cb_arg_t));
   arg.fp = fp;
+  fp->ctf_flags |= LCTF_LINKING;
+
+  ctf_link_warn_outdated_inputs (fp);
 
   if (fp->ctf_link_outputs)
     {
@@ -1710,9 +1798,13 @@ ctf_link_write (ctf_file_t *fp, size_t *size, size_t threshold)
        }
     }
 
-  /* No extra outputs? Just write a simple ctf_file_t.  */
+  /* No extra outputs? Just write a simple ctf_dict_t.  */
   if (arg.i == 0)
-    return ctf_write_mem (fp, size, threshold);
+    {
+      unsigned char *ret = ctf_write_mem (fp, size, threshold);
+      fp->ctf_flags &= ~LCTF_LINKING;
+      return ret;
+    }
 
   /* Writing an archive.  Stick ourselves (the shared repository, parent of all
      other archives) on the front of it with the default name.  */
@@ -1740,14 +1832,21 @@ ctf_link_write (ctf_file_t *fp, size_t *size, size_t threshold)
        }
     }
 
+  /* Propagate the link flags to all the dicts in this link.  */
+  for (i = 0; i < arg.i; i++)
+    {
+      arg.files[i]->ctf_link_flags = fp->ctf_link_flags;
+      arg.files[i]->ctf_flags |= LCTF_LINKING;
+    }
+
   if ((files = realloc (arg.files,
-                       sizeof (struct ctf_file *) * (arg.i + 1))) == NULL)
+                       sizeof (struct ctf_dict *) * (arg.i + 1))) == NULL)
     {
-      errloc = "ctf_file reallocation";
+      errloc = "ctf_dict reallocation";
       goto err_no;
     }
   arg.files = files;
-  memmove (&(arg.files[1]), arg.files, sizeof (ctf_file_t *) * (arg.i));
+  memmove (&(arg.files[1]), arg.files, sizeof (ctf_dict_t *) * (arg.i));
   arg.files[0] = fp;
 
   if ((f = tmpfile ()) == NULL)
@@ -1812,6 +1911,10 @@ ctf_link_write (ctf_file_t *fp, size_t *size, size_t threshold)
 
  err_no:
   ctf_set_errno (fp, errno);
+
+  /* Turn off the is-linking flag on all the dicts in this link.  */
+  for (i = 0; i < arg.i; i++)
+    arg.files[i]->ctf_flags &= ~LCTF_LINKING;
  err:
   free (buf);
   if (f)