Add more tests.
[kopensolaris-gnu/glibc.git] / wcsmbs / mbrtowc.c
index 9e70a0b..6932b04 100644 (file)
-/* Copyright (C) 1996 Free Software Foundation, Inc.
-This file is part of the GNU C Library.
-Contributed by Ulrich Drepper <drepper@gnu.ai.mit.edu>, 1996.
-
-The GNU C Library is free software; you can redistribute it and/or
-modify it under the terms of the GNU Library General Public License as
-published by the Free Software Foundation; either version 2 of the
-License, or (at your option) any later version.
-
-The GNU C Library is distributed in the hope that it will be useful,
-but WITHOUT ANY WARRANTY; without even the implied warranty of
-MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
-Library General Public License for more details.
-
-You should have received a copy of the GNU Library General Public
-License along with the GNU C Library; see the file COPYING.LIB.  If
-not, write to the Free Software Foundation, Inc., 59 Temple Place - Suite 330,
-Boston, MA 02111-1307, USA.  */
-
+/* Copyright (C) 1996, 1997, 1998, 1999, 2000, 2002, 2004
+   Free Software Foundation, Inc.
+   This file is part of the GNU C Library.
+   Contributed by Ulrich Drepper <drepper@gnu.org>, 1996.
+
+   The GNU C Library is free software; you can redistribute it and/or
+   modify it under the terms of the GNU Lesser General Public
+   License as published by the Free Software Foundation; either
+   version 2.1 of the License, or (at your option) any later version.
+
+   The GNU C Library is distributed in the hope that it will be useful,
+   but WITHOUT ANY WARRANTY; without even the implied warranty of
+   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
+   Lesser General Public License for more details.
+
+   You should have received a copy of the GNU Lesser General Public
+   License along with the GNU C Library; if not, write to the Free
+   Software Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA
+   02111-1307 USA.  */
+
+#include <dlfcn.h>
 #include <errno.h>
+#include <gconv.h>
 #include <wchar.h>
+#include <wcsmbsload.h>
+
+#include <assert.h>
 
 #ifndef EILSEQ
-#define EILSEQ EINVAL
+# define EILSEQ EINVAL
 #endif
 
-
-static mbstate_t internal;
+/* This is the private state used if PS is NULL.  */
+static mbstate_t state;
 
 size_t
-mbrtowc (wchar_t *pwc, const char *s, size_t n, mbstate_t *ps)
+__mbrtowc (wchar_t *pwc, const char *s, size_t n, mbstate_t *ps)
 {
-  wchar_t to_wide;
-  size_t used = 0;
-
-  if (ps == NULL)
-    ps = &internal;
-
+  wchar_t buf[1];
+  struct __gconv_step_data data;
+  int status;
+  size_t result;
+  size_t dummy;
+  const unsigned char *inbuf, *endbuf;
+  char *outbuf = (char *) (pwc ?: buf);
+  const struct gconv_fcts *fcts;
+
+  /* Set information for this step.  */
+  data.__invocation_counter = 0;
+  data.__internal_use = 1;
+  data.__flags = __GCONV_IS_LAST;
+  data.__statep = ps ?: &state;
+  data.__trans = NULL;
+
+  /* A first special case is if S is NULL.  This means put PS in the
+     initial state.  */
   if (s == NULL)
     {
-      /* See first paragraph of description in 7.16.6.3.2.  */
-      pwc = NULL;
+      outbuf = (char *) buf;
       s = "";
       n = 1;
     }
 
-  if (n > 0)
+  /* Tell where we want the result.  */
+  data.__outbuf = outbuf;
+  data.__outbufend = outbuf + sizeof (wchar_t);
+
+  /* Get the conversion functions.  */
+  fcts = get_gconv_fcts (_NL_CURRENT_DATA (LC_CTYPE));
+
+  /* Do a normal conversion.  */
+  inbuf = (const unsigned char *) s;
+  endbuf = inbuf + n;
+  if (__builtin_expect (endbuf < inbuf, 0))
+    endbuf = (const unsigned char *) ~(uintptr_t) 0;
+  status = DL_CALL_FCT (fcts->towc->__fct,
+                       (fcts->towc, &data, &inbuf, endbuf,
+                        NULL, &dummy, 0, 1));
+
+  /* There must not be any problems with the conversion but illegal input
+     characters.  The output buffer must be large enough, otherwise the
+     definition of MB_CUR_MAX is not correct.  All the other possible
+     errors also must not happen.  */
+  assert (status == __GCONV_OK || status == __GCONV_EMPTY_INPUT
+         || status == __GCONV_ILLEGAL_INPUT
+         || status == __GCONV_INCOMPLETE_INPUT
+         || status == __GCONV_FULL_OUTPUT);
+
+  if (status == __GCONV_OK || status == __GCONV_EMPTY_INPUT
+      || status == __GCONV_FULL_OUTPUT)
     {
-      if (ps->count == 0)
-       {
-         unsigned char byte = (unsigned char) *s++;
-         ++used;
-
-         /* We must look for a possible first byte of a UTF8 sequence.  */
-         if (byte < 0x80)
-           {
-             /* One byte sequence.  */
-             if (pwc != NULL)
-               *pwc = (wchar_t) byte;
-             return byte ? used : 0;
-           }
-
-         if ((byte & 0xc0) == 0x80 || (byte & 0xfe) == 0xfe)
-           {
-             /* Oh, oh.  An encoding error.  */
-             errno = EILSEQ;
-             return (size_t) -1;
-           }
-
-         if ((byte & 0xe0) == 0xc0)
-           {
-             /* We expect two bytes.  */
-             ps->count = 1;
-             ps->value = byte & 0x1f;
-           }
-         else if ((byte & 0xf0) == 0xe0)
-           {
-             /* We expect three bytes.  */
-             ps->count = 2;
-             ps->value = byte & 0x0f;
-           }
-         else if ((byte & 0xf8) == 0xf0)
-           {
-             /* We expect four bytes.  */
-             ps->count = 3;
-             ps->value = byte & 0x07;
-           }
-         else if ((byte & 0xfc) == 0xf8)
-           {
-             /* We expect five bytes.  */
-             ps->count = 4;
-             ps->value = byte & 0x03;
-           }
-         else
-           {
-             /* We expect six bytes.  */
-             ps->count = 5;
-             ps->value = byte & 0x01;
-           }
-       }
-
-      /* We know we have to handle a multibyte character and there are
-        some more bytes to read.  */
-      while (used < n)
+      if (data.__outbuf != (unsigned char *) outbuf
+         && *(wchar_t *) outbuf == L'\0')
        {
-         /* The second to sixths byte must be of the form 10xxxxxx.  */
-         unsigned char byte = (unsigned char) *s++;
-         ++used;
-
-         if ((byte & 0xc0) != 0x80)
-           {
-             /* Oh, oh.  An encoding error.  */
-             errno = EILSEQ;
-             return (size_t) -1;
-           }
-
-         ps->value <<= 6;
-         ps->value |= byte & 0x3f;
-
-         if (--ps->count == 0)
-           {
-             /* The character is finished.  */
-             if (pwc != NULL)
-               *pwc = (wchar_t) ps->value;
-             return ps->value ? used : 0;
-           }
+         /* The converted character is the NUL character.  */
+         assert (__mbsinit (data.__statep));
+         result = 0;
        }
+      else
+       result = inbuf - (const unsigned char *) s;
+    }
+  else if (status == __GCONV_INCOMPLETE_INPUT)
+    result = (size_t) -2;
+  else
+    {
+      result = (size_t) -1;
+      __set_errno (EILSEQ);
     }
 
-  return (size_t) -2;
+  return result;
 }
+libc_hidden_def (__mbrtowc)
+weak_alias (__mbrtowc, mbrtowc)
+libc_hidden_weak (mbrtowc)