Make sure SRC argument is correct when partial character is read.
[kopensolaris-gnu/glibc.git] / wcsmbs / wcsrtombs.c
1 /* Copyright (C) 1996, 1997 Free Software Foundation, Inc.
2    This file is part of the GNU C Library.
3    Contributed by Ulrich Drepper <drepper@gnu.ai.mit.edu>, 1996.
4
5    The GNU C Library is free software; you can redistribute it and/or
6    modify it under the terms of the GNU Library General Public License as
7    published by the Free Software Foundation; either version 2 of the
8    License, or (at your option) any later version.
9
10    The GNU C Library is distributed in the hope that it will be useful,
11    but WITHOUT ANY WARRANTY; without even the implied warranty of
12    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13    Library General Public License for more details.
14
15    You should have received a copy of the GNU Library General Public
16    License along with the GNU C Library; see the file COPYING.LIB.  If not,
17    write to the Free Software Foundation, Inc., 59 Temple Place - Suite 330,
18    Boston, MA 02111-1307, USA.  */
19
20 #include <errno.h>
21 #include <wchar.h>
22
23 #ifndef EILSEQ
24 #define EILSEQ EINVAL
25 #endif
26
27
28 static const wchar_t encoding_mask[] =
29 {
30   ~0x7ff, ~0xffff, ~0x1fffff, ~0x3ffffff
31 };
32
33 static const unsigned char encoding_byte[] =
34 {
35   0xc0, 0xe0, 0xf0, 0xf8, 0xfc
36 };
37
38 /* We don't need the state really because we don't have shift states
39    to maintain between calls to this function.  */
40 static mbstate_t internal;
41
42 size_t
43 __wcsrtombs (dst, src, len, ps)
44      char *dst;
45      const wchar_t **src;
46      size_t len;
47      mbstate_t *ps;
48 {
49   size_t written = 0;
50   const wchar_t *run = *src;
51
52   if (ps == NULL)
53     ps = &internal;
54
55   if (dst == NULL)
56     /* The LEN parameter has to be ignored if we don't actually write
57        anything.  */
58     len = ~0;
59
60   while (written < len)
61     {
62       wchar_t wc;
63
64       /* Store position of first unprocessed word.  */
65       *src = run;
66
67       wc = *run++;
68
69       if (wc < 0 || wc > 0x7fffffff)
70         {
71           /* This is no correct ISO 10646 character.  */
72           __set_errno (EILSEQ);
73           return (size_t) -1;
74         }
75
76       if (wc == L'\0')
77         {
78           /* Found the end.  */
79           if (dst != NULL)
80             *dst = '\0';
81           ps->count = 0;
82           *src = NULL;
83           return written;
84         }
85       else if (wc < 0x80)
86         {
87           /* It's an one byte sequence.  */
88           if (dst != NULL)
89             *dst++ = (char) wc;
90           ++written;
91         }
92       else
93         {
94           size_t step;
95
96           for (step = 2; step < 6; ++step)
97             if ((wc & encoding_mask[step - 2]) == 0)
98               break;
99
100           if (written + step >= len)
101             /* Too long.  */
102             break;
103
104           if (dst != NULL)
105             {
106               size_t cnt = step;
107
108               dst[0] = encoding_byte[cnt - 2];
109
110               --cnt;
111               do
112                 {
113                   dst[cnt] = 0x80 | (wc & 0x3f);
114                   wc >>= 6;
115                 }
116               while (--cnt > 0);
117               dst[0] |= wc;
118
119               dst += step;
120             }
121
122           written += step;
123         }
124     }
125
126   /* Store position of first unprocessed word.  */
127   *src = run;
128
129   /* Signal that we finished correctly.  */
130   ps->count = 0;
131
132   return written;
133 }
134 weak_alias (__wcsrtombs, wcsrtombs)