(struct database_dyn): Add propagate field.
[kopensolaris-gnu/glibc.git] / nscd / nscd_gethst_r.c
index 8a498b6..9fa10e2 100644 (file)
@@ -1,4 +1,4 @@
-/* Copyright (C) 1998-2002, 2003, 2004 Free Software Foundation, Inc.
+/* Copyright (C) 1998-2002, 2003, 2004, 2005 Free Software Foundation, Inc.
    This file is part of the GNU C Library.
    Contributed by Ulrich Drepper <drepper@cygnus.com>, 1998.
 
@@ -17,6 +17,7 @@
    Software Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA
    02111-1307 USA.  */
 
+#include <assert.h>
 #include <errno.h>
 #include <netdb.h>
 #include <resolv.h>
@@ -26,9 +27,7 @@
 #include <string.h>
 #include <unistd.h>
 #include <arpa/nameser.h>
-#include <sys/socket.h>
-#include <sys/uio.h>
-#include <sys/un.h>
+#include <not-cancel.h>
 
 #include "nscd-client.h"
 #include "nscd_proto.h"
@@ -88,31 +87,18 @@ __nscd_gethostbyaddr_r (const void *addr, socklen_t len, int type,
 }
 
 
-/* Create a socket connected to a name. */
-int
-__nscd_open_socket (void)
+libc_locked_map_ptr (, __hst_map_handle);
+/* Note that we only free the structure if necessary.  The memory
+   mapping is not removed since it is not visible to the malloc
+   handling.  */
+libc_freeres_fn (hst_map_free)
 {
-  struct sockaddr_un addr;
-  int sock;
-  int saved_errno = errno;
-
-  sock = __socket (PF_UNIX, SOCK_STREAM, 0);
-  if (sock < 0)
-    {
-      __set_errno (saved_errno);
-      return -1;
-    }
-
-  addr.sun_family = AF_UNIX;
-  strcpy (addr.sun_path, _PATH_NSCDSOCKET);
-  if (__connect (sock, (struct sockaddr *) &addr, sizeof (addr)) < 0)
+  if (__hst_map_handle.mapped != NO_MAPPING)
     {
-      __close (sock);
-      __set_errno (saved_errno);
-      return -1;
+      void *p = __hst_map_handle.mapped;
+      __hst_map_handle.mapped = NO_MAPPING;
+      free (p);
     }
-
-  return sock;
 }
 
 
@@ -122,50 +108,92 @@ nscd_gethst_r (const char *key, size_t keylen, request_type type,
               struct hostent *resultbuf, char *buffer, size_t buflen,
               struct hostent **result, int *h_errnop)
 {
-  int sock = __nscd_open_socket ();
-  hst_response_header hst_resp;
-  request_header req;
-  ssize_t nbytes;
-  struct iovec vec[4];
+  int gc_cycle;
+  int nretries = 0;
+
+  /* If the mapping is available, try to search there instead of
+     communicating with the nscd.  */
+  struct mapped_database *mapped;
+  mapped = __nscd_get_map_ref (GETFDHST, "hosts", &__hst_map_handle,
+                              &gc_cycle);
+
+ retry:;
+  const hst_response_header *hst_resp = NULL;
+  const char *h_name = NULL;
+  const uint32_t *aliases_len = NULL;
+  const char *addr_list = NULL;
+  size_t addr_list_len = 0;
   int retval = -1;
+  const char *recend = (const char *) ~UINTMAX_C (0);
+  int sock = -1;
+  if (mapped != NO_MAPPING)
+    {
+      const struct datahead *found = __nscd_cache_search (type, key, keylen,
+                                                         mapped);
+      if (found != NULL)
+       {
+         hst_resp = &found->data[0].hstdata;
+         h_name = (char *) (hst_resp + 1);
+         aliases_len = (uint32_t *) (h_name + hst_resp->h_name_len);
+         addr_list = ((char *) aliases_len
+                      + hst_resp->h_aliases_cnt * sizeof (uint32_t));
+         addr_list_len = hst_resp->h_addr_list_cnt * INADDRSZ;
+
+#ifndef _STRING_ARCH_unaligned
+         /* The aliases_len array in the mapped database might very
+            well be unaligned.  We will access it word-wise so on
+            platforms which do not tolerate unaligned accesses we
+            need to make an aligned copy.  */
+         if (((uintptr_t) aliases_len & (__alignof__ (*aliases_len) - 1))
+             != 0)
+           {
+             uint32_t *tmp = alloca (hst_resp->h_aliases_cnt
+                                     * sizeof (uint32_t));
+             aliases_len = memcpy (tmp, aliases_len,
+                                   hst_resp->h_aliases_cnt
+                                   * sizeof (uint32_t));
+           }
+#endif
+         if (type != GETHOSTBYADDR && type != GETHOSTBYNAME)
+           {
+             if (hst_resp->h_length == INADDRSZ)
+               addr_list += addr_list_len;
+             addr_list_len = hst_resp->h_addr_list_cnt * IN6ADDRSZ;
+           }
+         recend = (const char *) found->data + found->recsize;
+         if (__builtin_expect ((const char *) addr_list + addr_list_len
+                               > recend, 0))
+           goto out_close;
+       }
+    }
 
-  if (sock == -1)
+  hst_response_header hst_resp_mem;
+  if (hst_resp == NULL)
     {
-      __nss_not_use_nscd_hosts = 1;
-      return -1;
+      sock = __nscd_open_socket (key, keylen, type, &hst_resp_mem,
+                                sizeof (hst_resp_mem));
+      if (sock == -1)
+       {
+         __nss_not_use_nscd_hosts = 1;
+         goto out;;
+       }
+
+      hst_resp = &hst_resp_mem;
     }
 
   /* No value found so far.  */
   *result = NULL;
 
-  req.version = NSCD_VERSION;
-  req.type = type;
-  req.key_len = keylen;
-
-  vec[0].iov_base = &req;
-  vec[0].iov_len = sizeof (request_header);
-  vec[1].iov_base = (void *) key;
-  vec[1].iov_len = req.key_len;
-
-  nbytes = TEMP_FAILURE_RETRY (__writev (sock, vec, 2));
-  if ((size_t) nbytes != sizeof (request_header) + req.key_len)
-    goto out;
-
-  nbytes = TEMP_FAILURE_RETRY (__read (sock, &hst_resp,
-                                      sizeof (hst_response_header)));
-  if (__builtin_expect (nbytes != sizeof (hst_response_header), 0))
-    goto out;
-
-  if (hst_resp.found == -1)
+  if (__builtin_expect (hst_resp->found == -1, 0))
     {
       /* The daemon does not cache this database.  */
       __nss_not_use_nscd_hosts = 1;
-      goto out;
+      goto out_close;
     }
 
-  if (hst_resp.found == 1)
+  if (hst_resp->found == 1)
     {
-      uint32_t *aliases_len;
+      struct iovec vec[4];
       char *cp = buffer;
       uintptr_t align1;
       uintptr_t align2;
@@ -179,96 +207,110 @@ nscd_gethst_r (const char *key, size_t keylen, request_type type,
         align the pointer and the base of the h_addr_list pointers.  */
       align1 = ((__alignof__ (char *) - (cp - ((char *) 0)))
                & (__alignof__ (char *) - 1));
-      align2 = ((__alignof__ (char *) - ((cp + align1 + hst_resp.h_name_len)
+      align2 = ((__alignof__ (char *) - ((cp + align1 + hst_resp->h_name_len)
                                         - ((char *) 0)))
                & (__alignof__ (char *) - 1));
-      if (buflen < (align1 + hst_resp.h_name_len + align2
-                   + ((hst_resp.h_aliases_cnt + hst_resp.h_addr_list_cnt + 2)
+      if (buflen < (align1 + hst_resp->h_name_len + align2
+                   + ((hst_resp->h_aliases_cnt + hst_resp->h_addr_list_cnt
+                       + 2)
                       * sizeof (char *))
-                   + hst_resp.h_addr_list_cnt * (type == AF_INET
-                                                 ? INADDRSZ : IN6ADDRSZ)))
+                   + hst_resp->h_addr_list_cnt * (type == AF_INET
+                                                  ? INADDRSZ : IN6ADDRSZ)))
        {
        no_room:
+         *h_errnop = NETDB_INTERNAL;
          __set_errno (ERANGE);
          retval = ERANGE;
-         goto out;
+         goto out_close;
        }
       cp += align1;
 
       /* Prepare the result as far as we can.  */
       resultbuf->h_aliases = (char **) cp;
-      cp += (hst_resp.h_aliases_cnt + 1) * sizeof (char *);
+      cp += (hst_resp->h_aliases_cnt + 1) * sizeof (char *);
       resultbuf->h_addr_list = (char **) cp;
-      cp += (hst_resp.h_addr_list_cnt + 1) * sizeof (char *);
+      cp += (hst_resp->h_addr_list_cnt + 1) * sizeof (char *);
 
       resultbuf->h_name = cp;
-      cp += hst_resp.h_name_len + align2;
-      vec[0].iov_base = resultbuf->h_name;
-      vec[0].iov_len = hst_resp.h_name_len;
-
-      aliases_len = alloca (hst_resp.h_aliases_cnt * sizeof (uint32_t));
-      vec[1].iov_base = aliases_len;
-      vec[1].iov_len = hst_resp.h_aliases_cnt * sizeof (uint32_t);
+      cp += hst_resp->h_name_len + align2;
 
-      total_len = (hst_resp.h_name_len
-                  + hst_resp.h_aliases_cnt * sizeof (uint32_t));
-
-      n = 2;
       if (type == GETHOSTBYADDR || type == GETHOSTBYNAME)
        {
-         vec[2].iov_base = cp;
-         vec[2].iov_len = hst_resp.h_addr_list_cnt * INADDRSZ;
-
-         for (cnt = 0; cnt < hst_resp.h_addr_list_cnt; ++cnt)
-           {
-             resultbuf->h_addr_list[cnt] = cp;
-             cp += INADDRSZ;
-           }
-
          resultbuf->h_addrtype = AF_INET;
          resultbuf->h_length = INADDRSZ;
-
-         total_len += hst_resp.h_addr_list_cnt * INADDRSZ;
-
-         n = 3;
        }
       else
        {
-         if (hst_resp.h_length == INADDRSZ)
-           {
-             ignore = alloca (hst_resp.h_addr_list_cnt * INADDRSZ);
-             vec[2].iov_base = ignore;
-             vec[2].iov_len = hst_resp.h_addr_list_cnt * INADDRSZ;
+         resultbuf->h_addrtype = AF_INET6;
+         resultbuf->h_length = IN6ADDRSZ;
+       }
+      for (cnt = 0; cnt < hst_resp->h_addr_list_cnt; ++cnt)
+       {
+         resultbuf->h_addr_list[cnt] = cp;
+         cp += resultbuf->h_length;
+       }
+      resultbuf->h_addr_list[cnt] = NULL;
 
-             total_len += hst_resp.h_addr_list_cnt * INADDRSZ;
+      if (h_name == NULL)
+       {
+         vec[0].iov_base = resultbuf->h_name;
+         vec[0].iov_len = hst_resp->h_name_len;
+         total_len = hst_resp->h_name_len;
+         n = 1;
 
-             n = 3;
-           }
+         if (hst_resp->h_aliases_cnt > 0)
+           {
+             aliases_len = alloca (hst_resp->h_aliases_cnt
+                                   * sizeof (uint32_t));
+             vec[n].iov_base = (void *) aliases_len;
+             vec[n].iov_len = hst_resp->h_aliases_cnt * sizeof (uint32_t);
 
-         vec[n].iov_base = cp;
-         vec[n].iov_len = hst_resp.h_addr_list_cnt * IN6ADDRSZ;
+             total_len += hst_resp->h_aliases_cnt * sizeof (uint32_t);
+             ++n;
+           }
 
-         for (cnt = 0; cnt < hst_resp.h_addr_list_cnt; ++cnt)
+         if (type == GETHOSTBYADDR || type == GETHOSTBYNAME)
            {
-             resultbuf->h_addr_list[cnt] = cp;
-             cp += IN6ADDRSZ;
+             vec[n].iov_base = resultbuf->h_addr_list[0];
+             vec[n].iov_len = hst_resp->h_addr_list_cnt * INADDRSZ;
+
+             total_len += hst_resp->h_addr_list_cnt * INADDRSZ;
+
+             ++n;
            }
+         else
+           {
+             if (hst_resp->h_length == INADDRSZ)
+               {
+                 ignore = alloca (hst_resp->h_addr_list_cnt * INADDRSZ);
+                 vec[n].iov_base = ignore;
+                 vec[n].iov_len = hst_resp->h_addr_list_cnt * INADDRSZ;
 
-         resultbuf->h_addrtype = AF_INET6;
-         resultbuf->h_length = IN6ADDRSZ;
+                 total_len += hst_resp->h_addr_list_cnt * INADDRSZ;
 
-         total_len += hst_resp.h_addr_list_cnt * IN6ADDRSZ;
+                 ++n;
+               }
 
-         ++n;
-       }
-      resultbuf->h_addr_list[cnt] = NULL;
+             vec[n].iov_base = resultbuf->h_addr_list[0];
+             vec[n].iov_len = hst_resp->h_addr_list_cnt * IN6ADDRSZ;
 
-      if ((size_t) TEMP_FAILURE_RETRY (__readv (sock, vec, n)) != total_len)
-       goto out;
+             total_len += hst_resp->h_addr_list_cnt * IN6ADDRSZ;
+
+             ++n;
+           }
+
+         if ((size_t) __readvall (sock, vec, n) != total_len)
+           goto out_close;
+       }
+      else
+       {
+         memcpy (resultbuf->h_name, h_name, hst_resp->h_name_len);
+         memcpy (resultbuf->h_addr_list[0], addr_list, addr_list_len);
+       }
 
       /*  Now we also can read the aliases.  */
       total_len = 0;
-      for (cnt = 0; cnt < hst_resp.h_aliases_cnt; ++cnt)
+      for (cnt = 0; cnt < hst_resp->h_aliases_cnt; ++cnt)
        {
          resultbuf->h_aliases[cnt] = cp;
          cp += aliases_len[cnt];
@@ -276,14 +318,39 @@ nscd_gethst_r (const char *key, size_t keylen, request_type type,
        }
       resultbuf->h_aliases[cnt] = NULL;
 
+      if (__builtin_expect ((const char *) addr_list + addr_list_len
+                           + total_len > recend, 0))
+       goto out_close;
       /* See whether this would exceed the buffer capacity.  */
-      if (cp > buffer + buflen)
+      if (__builtin_expect (cp > buffer + buflen, 0))
        goto no_room;
 
       /* And finally read the aliases.  */
-      if ((size_t) TEMP_FAILURE_RETRY (__read (sock, resultbuf->h_aliases[0],
-                                              total_len)) == total_len)
+      if (addr_list == NULL)
+       {
+         if (total_len == 0
+             || ((size_t) __readall (sock, resultbuf->h_aliases[0], total_len)
+                 == total_len))
+           {
+             retval = 0;
+             *result = resultbuf;
+           }
+       }
+      else
        {
+         memcpy (resultbuf->h_aliases[0],
+                 (const char *) addr_list + addr_list_len, total_len);
+
+         /* Try to detect corrupt databases.  */
+         if (resultbuf->h_name[hst_resp->h_name_len - 1] != '\0'
+             || ({for (cnt = 0; cnt < hst_resp->h_aliases_cnt; ++cnt)
+                    if (resultbuf->h_aliases[cnt][aliases_len[cnt] - 1]
+                        != '\0')
+                      break;
+                  cnt < hst_resp->h_aliases_cnt; }))
+           /* We cannot use the database.  */
+           goto out_close;
+
          retval = 0;
          *result = resultbuf;
        }
@@ -291,7 +358,7 @@ nscd_gethst_r (const char *key, size_t keylen, request_type type,
   else
     {
       /* Store the error number.  */
-      *h_errnop = hst_resp.error;
+      *h_errnop = hst_resp->error;
 
       /* The `errno' to some value != ERANGE.  */
       __set_errno (ENOENT);
@@ -299,8 +366,24 @@ nscd_gethst_r (const char *key, size_t keylen, request_type type,
       retval = 0;
     }
 
+ out_close:
+  if (sock != -1)
+    close_not_cancel_no_status (sock);
  out:
-  __close (sock);
+  if (__nscd_drop_map_ref (mapped, &gc_cycle) != 0 && retval != -1)
+    {
+      /* When we come here this means there has been a GC cycle while we
+        were looking for the data.  This means the data might have been
+        inconsistent.  Retry if possible.  */
+      if ((gc_cycle & 1) != 0 || ++nretries == 5)
+       {
+         /* nscd is just running gc now.  Disable using the mapping.  */
+         __nscd_unmap (mapped);
+         mapped = NO_MAPPING;
+       }
+
+      goto retry;
+    }
 
   return retval;
 }