32437c12f59e79b2dca700ec71ca586ccac7eab7
[kopensolaris-gnu/glibc.git] / locale / programs / localedef.c
1 /* Copyright (C) 1995, 1996, 1997, 1998 Free Software Foundation, Inc.
2    This file is part of the GNU C Library.
3    Contributed by Ulrich Drepper <drepper@gnu.ai.mit.edu>, 1995.
4
5    The GNU C Library is free software; you can redistribute it and/or
6    modify it under the terms of the GNU Library General Public License as
7    published by the Free Software Foundation; either version 2 of the
8    License, or (at your option) any later version.
9
10    The GNU C Library is distributed in the hope that it will be useful,
11    but WITHOUT ANY WARRANTY; without even the implied warranty of
12    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13    Library General Public License for more details.
14
15    You should have received a copy of the GNU Library General Public
16    License along with the GNU C Library; see the file COPYING.LIB.  If not,
17    write to the Free Software Foundation, Inc., 59 Temple Place - Suite 330,
18    Boston, MA 02111-1307, USA.  */
19
20 #ifdef HAVE_CONFIG_H
21 # include <config.h>
22 #endif
23
24 #include <argp.h>
25 #include <errno.h>
26 #include <fcntl.h>
27 #include <libintl.h>
28 #include <locale.h>
29 #include <stdio.h>
30 #include <stdlib.h>
31 #include <string.h>
32 #include <unistd.h>
33 #include <sys/mman.h>
34 #include <sys/stat.h>
35
36 #include "error.h"
37 #include "charset.h"
38 #include "locfile.h"
39
40 /* Undefine the following line in the production version.  */
41 /* #define NDEBUG 1 */
42 #include <assert.h>
43
44
45 /* List of locale definition files which are used in `copy' instructions.  */
46 struct copy_def_list_t
47 {
48   struct copy_def_list_t *next;
49
50   const char *name;
51   int mask;
52
53   struct localedef_t *locale;
54
55   struct
56   {
57     void *data;
58     size_t len;
59   } binary[6];
60 };
61
62
63 /* List of copied locales.  */
64 struct copy_def_list_t *copy_list;
65
66 /* If this is defined be POSIX conform.  */
67 int posix_conformance;
68
69 /* If not zero give a lot more messages.  */
70 int verbose;
71
72 /* If not zero suppress warnings and information messages.  */
73 int be_quiet;
74
75 /* If not zero force output even if warning were issued.  */
76 static int force_output;
77
78 /* Name of the character map file.  */
79 static const char *charmap_file;
80
81 /* Name of the locale definition file.  */
82 static const char *input_file;
83
84 /* Name of the UCS file.  */
85 static const char *ucs_csn;
86
87
88 /* Name and version of program.  */
89 static void print_version (FILE *stream, struct argp_state *state);
90 void (*argp_program_version_hook) (FILE *, struct argp_state *) = print_version;
91
92 #define OPT_POSIX 1
93 #define OPT_QUIET 2
94
95 /* Definitions of arguments for argp functions.  */
96 static const struct argp_option options[] =
97 {
98   { NULL, 0, NULL, 0, N_("Input Files:") },
99   { "charmap", 'f', "FILE", 0,
100     N_("Symbolic character names defined in FILE") },
101   { "inputfile", 'i', "FILE", 0, N_("Source definitions are found in FILE") },
102   { "code-set-name", 'u', "NAME", OPTION_HIDDEN,
103     N_("Specify code set for mapping ISO 10646 elements") },
104   { "repertoire-map", 'u', NAME, 0,
105     N_("file containing mapping from symbolic names to UCS4 values") },
106
107   { NULL, 0, NULL, 0, N_("Output control:") },
108   { "force", 'c', NULL, 0,
109     N_("Create output even if warning messages were issued") },
110   { "posix", OPT_POSIX, NULL, 0, N_("Be strictly POSIX conform") },
111   { "quiet", OPT_QUIET, NULL, 0,
112     N_("Suppress warnings and information messages") },
113   { "verbose", 'v', NULL, 0, N_("Print more messages") },
114   { NULL, 0, NULL, 0, NULL }
115 };
116
117 /* Short description of program.  */
118 static const char doc[] = N_("Compile locale specification");
119
120 /* Strings for arguments in help texts.  */
121 static const char args_doc[] = N_("NAME");
122
123 /* Prototype for option handler.  */
124 static error_t parse_opt (int key, char *arg, struct argp_state *state);
125
126 /* Function to print some extra text in the help message.  */
127 static char *more_help (int key, const char *text, void *input);
128
129 /* Data structure to communicate with argp functions.  */
130 static struct argp argp =
131 {
132   options, parse_opt, args_doc, doc, NULL, more_help
133 };
134
135
136 /* Prototypes for global functions.  */
137 void *xmalloc (size_t __n);
138
139 /* Prototypes for local functions.  */
140 static void error_print (void);
141 static const char *construct_output_path (char *path);
142 static const char *normalize_codeset (const char *codeset, size_t name_len);
143
144
145 int
146 main (int argc, char *argv[])
147 {
148   const char *output_path;
149   int cannot_write_why;
150   struct charset_t *charset;
151   struct localedef_t *localedef;
152   struct copy_def_list_t *act_add_locdef;
153   int remaining;
154
155   /* Set initial values for global variables.  */
156   copy_list = NULL;
157   posix_conformance = getenv ("POSIXLY_CORRECT") != NULL;
158   error_print_progname = error_print;
159
160   /* Set locale.  Do not set LC_ALL because the other categories must
161      not be affected (according to POSIX.2).  */
162   setlocale (LC_MESSAGES, "");
163   setlocale (LC_CTYPE, "");
164
165   /* Initialize the message catalog.  */
166   textdomain (_libc_intl_domainname);
167
168   /* Parse and process arguments.  */
169   argp_err_exit_status = 4;
170   argp_parse (&argp, argc, argv, 0, &remaining, NULL);
171
172   /* POSIX.2 requires to be verbose about missing characters in the
173      character map.  */
174   verbose |= posix_conformance;
175
176   if (argc - remaining != 1)
177     {
178       /* We need exactly one non-option parameter.  */
179       argp_help (&argp, stdout, ARGP_HELP_SEE | ARGP_HELP_EXIT_ERR,
180                  program_invocation_short_name);
181       exit (4);
182     }
183
184   /* The parameter describes the output path of the constructed files.
185      If the described files cannot be written return a NULL pointer.  */
186   output_path  = construct_output_path (argv[remaining]);
187   cannot_write_why = errno;
188
189   /* Now that the parameters are processed we have to reset the local
190      ctype locale.  (P1003.2 4.35.5.2)  */
191   setlocale (LC_CTYPE, "POSIX");
192
193   /* Look whether the system really allows locale definitions.  POSIX
194      defines error code 3 for this situation so I think it must be
195      a fatal error (see P1003.2 4.35.8).  */
196   if (sysconf (_SC_2_LOCALEDEF) < 0)
197     error (3, 0, _("FATAL: system does not define `_POSIX2_LOCALEDEF'"));
198
199   /* Process charmap file.  */
200   charset = charmap_read (charmap_file);
201
202   /* Now read the locale file.  */
203   localedef = locfile_read (input_file, charset);
204   if (localedef->failed != 0)
205     error (4, errno, _("cannot open locale definition file `%s'"), input_file);
206
207   /* Perhaps we saw some `copy' instructions.  Process the given list.
208      We use a very simple algorithm: we look up the list from the
209      beginning every time.  */
210   do
211     {
212       int cat;
213
214       for (act_add_locdef = copy_list; act_add_locdef != NULL;
215            act_add_locdef = act_add_locdef->next)
216         {
217           for (cat = LC_CTYPE; cat <= LC_MESSAGES; ++cat)
218             if ((act_add_locdef->mask & (1 << cat)) != 0)
219               {
220                 act_add_locdef->mask &= ~(1 << cat);
221                 break;
222               }
223           if (cat <= LC_MESSAGES)
224             break;
225         }
226
227       if (act_add_locdef != NULL)
228         {
229           int avail = 0;
230
231           if (act_add_locdef->locale == NULL)
232             act_add_locdef->locale = locfile_read (act_add_locdef->name,
233                                                    charset);
234
235           if (! act_add_locdef->locale->failed)
236             {
237               avail = act_add_locdef->locale->categories[cat].generic != NULL;
238               if (avail)
239                 {
240                   localedef->categories[cat].generic
241                     = act_add_locdef->locale->categories[cat].generic;
242                   localedef->avail |= 1 << cat;
243                 }
244             }
245
246           if (! avail)
247             {
248               static const char *locale_names[] =
249               {
250                 "LC_COLLATE", "LC_CTYPE", "LC_MONETARY",
251                 "LC_NUMERIC", "LC_TIME", "LC_MESSAGES"
252               };
253               char *fname;
254               int fd;
255               struct stat st;
256
257               asprintf (&fname, LOCALEDIR "/%s/%s", act_add_locdef->name,
258                         locale_names[cat]);
259               fd = open (fname, O_RDONLY);
260               if (fd == -1)
261                 {
262                   free (fname);
263
264                   asprintf (&fname, LOCALEDIR "/%s/%s/SYS_%s",
265                             act_add_locdef->name, locale_names[cat],
266                             locale_names[cat]);
267
268                   fd = open (fname, O_RDONLY);
269                   if (fd == -1)
270                     error (5, 0, _("\
271 locale file `%s', used in `copy' statement, not found"),
272                            act_add_locdef->name);
273                 }
274
275               if (fstat (fd, &st) < 0)
276                 error (5, errno, _("\
277 cannot `stat' locale file `%s'"),
278                        fname);
279
280               localedef->len[cat] = st.st_size;
281               localedef->categories[cat].generic
282                 = mmap (NULL, st.st_size, PROT_READ, MAP_PRIVATE, fd, 0);
283
284               if (localedef->categories[cat].generic == MAP_FAILED)
285                 {
286                   size_t left = st.st_size;
287                   void *read_ptr;
288
289                   localedef->categories[cat].generic
290                     = xmalloc (st.st_size);
291                   read_ptr = localedef->categories[cat].generic;
292
293                   do
294                     {
295                       long int n;
296                       n = read (fd, read_ptr, left);
297                       if (n == -1)
298                         error (5, errno, _("cannot read locale file `%s'"),
299                                fname);
300                       read_ptr += n;
301                       left -= n;
302                     }
303                   while (left > 0);
304                 }
305
306               close (fd);
307               free (fname);
308
309               localedef->binary |= 1 << cat;
310             }
311         }
312     }
313   while (act_add_locdef != NULL);
314
315   /* Check the categories we processed in source form.  */
316   check_all_categories (localedef, charset);
317
318   /* We are now able to write the data files.  If warning were given we
319      do it only if it is explicitly requested (--force).  */
320   if (error_message_count == 0 || force_output != 0)
321     {
322       if (cannot_write_why != 0)
323         error (4, cannot_write_why, _("cannot write output files to `%s'"),
324                output_path);
325       else
326         write_all_categories (localedef, charset, output_path);
327     }
328   else
329     error (4, 0, _("no output file produced because warning were issued"));
330
331   /* This exit status is prescribed by POSIX.2 4.35.7.  */
332   exit (error_message_count != 0);
333 }
334
335
336 /* Handle program arguments.  */
337 static error_t
338 parse_opt (int key, char *arg, struct argp_state *state)
339 {
340   switch (key)
341     {
342     case OPT_QUIET:
343       be_quiet = 1;
344       break;
345     case OPT_POSIX:
346       posix_conformance = 1;
347       break;
348     case 'c':
349       force_output = 1;
350       break;
351     case 'f':
352       charmap_file = arg;
353       break;
354     case 'i':
355       input_file = arg;
356       break;
357     case 'u':
358       ucs_csn = arg;
359       break;
360     case 'v':
361       verbose = 1;
362       break;
363     default:
364       return ARGP_ERR_UNKNOWN;
365     }
366   return 0;
367 }
368
369
370 static char *
371 more_help (int key, const char *text, void *input)
372 {
373   char *cp;
374
375   switch (key)
376     {
377     case ARGP_KEY_HELP_EXTRA:
378       /* We print some extra information.  */
379       asprintf (&cp, gettext ("\
380 System's directory for character maps: %s\n\
381                        locale files  : %s\n\
382 %s"),
383                 CHARMAP_PATH, LOCALE_PATH, gettext ("\
384 Report bugs using the `glibcbug' script to <bugs@gnu.org>.\n"));
385       return cp;
386     default:
387       break;
388     }
389   return (char *) text;
390 }
391
392 /* Print the version information.  */
393 static void
394 print_version (FILE *stream, struct argp_state *state)
395 {
396   fprintf (stream, "localedef (GNU %s) %s\n", PACKAGE, VERSION);
397   fprintf (stream, gettext ("\
398 Copyright (C) %s Free Software Foundation, Inc.\n\
399 This is free software; see the source for copying conditions.  There is NO\n\
400 warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.\n\
401 "), "1995, 1996, 1997");
402   fprintf (stream, gettext ("Written by %s.\n"), "Ulrich Drepper");
403 }
404
405
406 void
407 def_to_process (const char *name, int category)
408 {
409   struct copy_def_list_t *new, **rp;
410
411   for (rp = &copy_list; *rp != NULL; rp = &(*rp)->next)
412     if (strcmp (name, (*rp)->name) == 0)
413       break;
414
415   if (*rp == NULL)
416     {
417       size_t cnt;
418
419       *rp = (struct copy_def_list_t *) xmalloc (sizeof (**rp));
420
421       (*rp)->next = NULL;
422       (*rp)->name = name;
423       (*rp)->mask = 0;
424       (*rp)->locale = NULL;
425
426       for (cnt = 0; cnt < 6; ++cnt)
427         {
428           (*rp)->binary[cnt].data = NULL;
429           (*rp)->binary[cnt].len = 0;
430         }
431     }
432   new = *rp;
433
434   if ((new->mask & category) != 0)
435     /* We already have the information.  This cannot happen.  */
436     error (5, 0, _("\
437 category data requested more than once: should not happen"));
438
439   new->mask |= category;
440 }
441
442
443 /* The address of this function will be assigned to the hook in the error
444    functions.  */
445 static void
446 error_print ()
447 {
448   /* We don't want the program name to be printed in messages.  Emacs'
449      compile.el does not like this.  */
450 }
451
452
453 /* The parameter to localedef describes the output path.  If it does
454    contain a '/' character it is a relative path.  Otherwise it names the
455    locale this definition is for.  */
456 static const char *
457 construct_output_path (char *path)
458 {
459   const char *normal = NULL;
460   char *result;
461
462   if (strchr (path, '/') == NULL)
463     {
464       /* This is a system path.  First examine whether the locale name
465          contains a reference to the codeset.  This should be
466          normalized.  */
467       char *startp, *endp;
468
469       startp = path;
470       /* We must be prepared for finding a CEN name or a location of
471          the introducing `.' where it is not possible anymore.  */
472       while (*startp != '\0' && *startp != '@' && *startp != '.'
473              && *startp != '+' && *startp != ',')
474         ++startp;
475       if (*startp == '.')
476         {
477           /* We found a codeset specification.  Now find the end.  */
478           endp = ++startp;
479           while (*endp != '\0' && *endp != '@')
480             ++endp;
481
482           if (endp > startp)
483             normal = normalize_codeset (startp, endp - startp);
484         }
485       else
486         /* This is to keep gcc quiet.  */
487         endp = NULL;
488
489       /* We put an additional '\0' at the end of the string because at
490          the end of the function we need another byte for the trailing
491          '/'.  */
492       if (normal == NULL)
493         asprintf (&result, "%s/%s%c", LOCALEDIR, path, '\0');
494       else
495         asprintf (&result, "%s/%.*s%s%s%c", LOCALEDIR, startp - path, path,
496                   normal, endp, '\0');
497     }
498   else
499     {
500       /* This is a user path.  Please note the additional byte in the
501          memory allocation.  */
502       result = xmalloc (strlen (path) + 2);
503       strcpy (result, path);
504     }
505
506   errno = 0;
507
508   if (euidaccess (result, W_OK) == -1)
509     /* Perhaps the directory does not exist now.  Try to create it.  */
510     if (errno == ENOENT)
511       {
512         errno = 0;
513         mkdir (result, 0777);
514       }
515
516   strcat (result, "/");
517
518   return result;
519 }
520
521 /* Normalize codeset name.  There is no standard for the codeset
522    names.  Normalization allows the user to use any of the common
523    names.  */
524 static const char *
525 normalize_codeset (codeset, name_len)
526      const char *codeset;
527      size_t name_len;
528 {
529   int len = 0;
530   int only_digit = 1;
531   char *retval;
532   char *wp;
533   size_t cnt;
534
535   for (cnt = 0; cnt < name_len; ++cnt)
536     if (isalnum (codeset[cnt]))
537       {
538         ++len;
539
540         if (isalpha (codeset[cnt]))
541           only_digit = 0;
542       }
543
544   retval = (char *) malloc ((only_digit ? 3 : 0) + len + 1);
545
546   if (retval != NULL)
547     {
548       if (only_digit)
549         wp = stpcpy (retval, "iso");
550       else
551         wp = retval;
552
553       for (cnt = 0; cnt < name_len; ++cnt)
554         if (isalpha (codeset[cnt]))
555           *wp++ = tolower (codeset[cnt]);
556         else if (isdigit (codeset[cnt]))
557           *wp++ = codeset[cnt];
558
559       *wp = '\0';
560     }
561
562   return (const char *) retval;
563 }