Unify messages.
[kopensolaris-gnu/glibc.git] / locale / programs / localedef.c
1 /* Copyright (C) 1995, 1996, 1997, 1998, 1999 Free Software Foundation, Inc.
2    This file is part of the GNU C Library.
3    Contributed by Ulrich Drepper <drepper@gnu.ai.mit.edu>, 1995.
4
5    The GNU C Library is free software; you can redistribute it and/or
6    modify it under the terms of the GNU Library General Public License as
7    published by the Free Software Foundation; either version 2 of the
8    License, or (at your option) any later version.
9
10    The GNU C Library is distributed in the hope that it will be useful,
11    but WITHOUT ANY WARRANTY; without even the implied warranty of
12    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13    Library General Public License for more details.
14
15    You should have received a copy of the GNU Library General Public
16    License along with the GNU C Library; see the file COPYING.LIB.  If not,
17    write to the Free Software Foundation, Inc., 59 Temple Place - Suite 330,
18    Boston, MA 02111-1307, USA.  */
19
20 #ifdef HAVE_CONFIG_H
21 # include <config.h>
22 #endif
23
24 #include <argp.h>
25 #include <errno.h>
26 #include <fcntl.h>
27 #include <libintl.h>
28 #include <locale.h>
29 #include <stdio.h>
30 #include <stdlib.h>
31 #include <string.h>
32 #include <unistd.h>
33 #ifdef _POSIX2_LOCALEDEF
34 # include <sys/mman.h>
35 #endif
36 #include <sys/stat.h>
37
38 #include "error.h"
39 #include "charset.h"
40 #include "locfile.h"
41 #include "locales.h"
42
43 /* Undefine the following line in the production version.  */
44 /* #define NDEBUG 1 */
45 #include <assert.h>
46
47
48 /* This is a special entry of the copylist.  For all categories we don't
49    have a definition we use the data for the POSIX locale.  */
50 struct copy_def_list_t copy_posix =
51 {
52   next: NULL,
53   name: "POSIX",
54   mask: (1 << LC_ALL) - 1,
55   locale: NULL
56 };
57
58
59 /* List of copied locales.  */
60 struct copy_def_list_t *copy_list;
61
62 /* If this is defined be POSIX conform.  */
63 int posix_conformance;
64
65 /* If not zero give a lot more messages.  */
66 int verbose;
67
68 /* If not zero suppress warnings and information messages.  */
69 int be_quiet;
70
71 /* If not zero force output even if warning were issued.  */
72 static int force_output;
73
74 /* Name of the character map file.  */
75 static const char *charmap_file;
76
77 /* Name of the locale definition file.  */
78 static const char *input_file;
79
80 /* Name of the repertoire map file.  */
81 const char *repertoiremap;
82
83
84 /* Name and version of program.  */
85 static void print_version (FILE *stream, struct argp_state *state);
86 void (*argp_program_version_hook) (FILE *, struct argp_state *) = print_version;
87
88 #define OPT_POSIX 1
89 #define OPT_QUIET 2
90
91 /* Definitions of arguments for argp functions.  */
92 static const struct argp_option options[] =
93 {
94   { NULL, 0, NULL, 0, N_("Input Files:") },
95   { "charmap", 'f', N_("FILE"), 0,
96     N_("Symbolic character names defined in FILE") },
97   { "inputfile", 'i', N_("FILE"), 0,
98     N_("Source definitions are found in FILE") },
99   { "repertoire-map", 'u', N_("FILE"), 0,
100     N_("FILE contains mapping from symbolic names to UCS4 values") },
101
102   { NULL, 0, NULL, 0, N_("Output control:") },
103   { "force", 'c', NULL, 0,
104     N_("Create output even if warning messages were issued") },
105   { "posix", OPT_POSIX, NULL, 0, N_("Be strictly POSIX conform") },
106   { "quiet", OPT_QUIET, NULL, 0,
107     N_("Suppress warnings and information messages") },
108   { "verbose", 'v', NULL, 0, N_("Print more messages") },
109   { NULL, 0, NULL, 0, NULL }
110 };
111
112 /* Short description of program.  */
113 static const char doc[] = N_("Compile locale specification");
114
115 /* Strings for arguments in help texts.  */
116 static const char args_doc[] = N_("NAME");
117
118 /* Prototype for option handler.  */
119 static error_t parse_opt (int key, char *arg, struct argp_state *state);
120
121 /* Function to print some extra text in the help message.  */
122 static char *more_help (int key, const char *text, void *input);
123
124 /* Data structure to communicate with argp functions.  */
125 static struct argp argp =
126 {
127   options, parse_opt, args_doc, doc, NULL, more_help
128 };
129
130
131 /* Prototypes for global functions.  */
132 void *xmalloc (size_t __n);
133
134 /* Prototypes for local functions.  */
135 static void error_print (void);
136 static const char *construct_output_path (char *path);
137 static const char *normalize_codeset (const char *codeset, size_t name_len);
138
139
140 int
141 main (int argc, char *argv[])
142 {
143   const char *output_path;
144   int cannot_write_why;
145   struct charset_t *charset;
146   struct localedef_t *localedef;
147   struct copy_def_list_t *act_add_locdef;
148   int remaining;
149
150   /* Set initial values for global variables.  */
151   posix_conformance = getenv ("POSIXLY_CORRECT") != NULL;
152   error_print_progname = error_print;
153
154   /* Set locale.  Do not set LC_ALL because the other categories must
155      not be affected (according to POSIX.2).  */
156   setlocale (LC_MESSAGES, "");
157   setlocale (LC_CTYPE, "");
158
159   /* Initialize the message catalog.  */
160   textdomain (_libc_intl_domainname);
161
162   /* Parse and process arguments.  */
163   argp_err_exit_status = 4;
164   argp_parse (&argp, argc, argv, 0, &remaining, NULL);
165
166   /* POSIX.2 requires to be verbose about missing characters in the
167      character map.  */
168   verbose |= posix_conformance;
169
170   if (argc - remaining != 1)
171     {
172       /* We need exactly one non-option parameter.  */
173       argp_help (&argp, stdout, ARGP_HELP_SEE | ARGP_HELP_EXIT_ERR,
174                  program_invocation_short_name);
175       exit (4);
176     }
177
178   /* The parameter describes the output path of the constructed files.
179      If the described files cannot be written return a NULL pointer.  */
180   output_path  = construct_output_path (argv[remaining]);
181   cannot_write_why = errno;
182
183   /* Now that the parameters are processed we have to reset the local
184      ctype locale.  (P1003.2 4.35.5.2)  */
185   setlocale (LC_CTYPE, "POSIX");
186
187   /* Look whether the system really allows locale definitions.  POSIX
188      defines error code 3 for this situation so I think it must be
189      a fatal error (see P1003.2 4.35.8).  */
190   if (sysconf (_SC_2_LOCALEDEF) < 0)
191     error (3, 0, _("FATAL: system does not define `_POSIX2_LOCALEDEF'"));
192
193   /* Process charmap file.  */
194   charset = charmap_read (charmap_file);
195
196   /* Now read the locale file.  */
197   localedef = locfile_read (input_file, charset);
198   if (localedef->failed != 0)
199     error (4, errno, _("cannot open locale definition file `%s'"), input_file);
200
201   /* Make sure all categories are defined.  */
202   copy_posix.next = copy_list;
203   copy_list = &copy_posix;
204
205   /* Perhaps we saw some `copy' instructions.  Process the given list.
206      We use a very simple algorithm: we look up the list from the
207      beginning every time.  */
208   do
209     {
210       int cat;
211
212       for (act_add_locdef = copy_list; act_add_locdef != NULL;
213            act_add_locdef = act_add_locdef->next)
214         {
215           for (cat = LC_CTYPE; cat <= LC_MESSAGES; ++cat)
216             if ((act_add_locdef->mask & (1 << cat)) != 0)
217               {
218                 act_add_locdef->mask &= ~(1 << cat);
219                 break;
220               }
221           if (cat <= LC_MESSAGES)
222             break;
223         }
224
225       if (act_add_locdef != NULL)
226         {
227           int avail = 0;
228
229           if (act_add_locdef->locale == NULL)
230             {
231               /* Saving the mask is an ugly trick to prevent the reader
232                  from modifying `copy_posix' if we currently process it.  */
233               int save_mask = act_add_locdef->mask;
234               act_add_locdef->locale = locfile_read (act_add_locdef->name,
235                                                      charset);
236               act_add_locdef->mask = save_mask;
237             }
238
239           if (! act_add_locdef->locale->failed)
240             {
241               avail = act_add_locdef->locale->categories[cat].generic != NULL;
242               if (avail)
243                 {
244                   localedef->categories[cat].generic
245                     = act_add_locdef->locale->categories[cat].generic;
246                   localedef->avail |= 1 << cat;
247                 }
248             }
249
250           if (! avail)
251             {
252               static const char *locale_names[] =
253               {
254                 "LC_COLLATE", "LC_CTYPE", "LC_MONETARY",
255                 "LC_NUMERIC", "LC_TIME", "LC_MESSAGES"
256               };
257               char *fname;
258               int fd;
259               struct stat st;
260
261               asprintf (&fname, LOCALEDIR "/%s/%s", act_add_locdef->name,
262                         locale_names[cat]);
263               fd = open (fname, O_RDONLY);
264               if (fd == -1)
265                 {
266                   free (fname);
267
268                   asprintf (&fname, LOCALEDIR "/%s/%s/SYS_%s",
269                             act_add_locdef->name, locale_names[cat],
270                             locale_names[cat]);
271
272                   fd = open (fname, O_RDONLY);
273                   if (fd == -1)
274                     error (5, 0, _("\
275 locale file `%s', used in `copy' statement, not found"),
276                            act_add_locdef->name);
277                 }
278
279               if (fstat (fd, &st) < 0)
280                 error (5, errno, _("\
281 cannot `stat' locale file `%s'"),
282                        fname);
283
284               localedef->len[cat] = st.st_size;
285 #ifdef _POSIX_MAPPED_FILES
286               localedef->categories[cat].generic
287                 = mmap (NULL, st.st_size, PROT_READ, MAP_PRIVATE, fd, 0);
288
289               if (localedef->categories[cat].generic == MAP_FAILED)
290 #endif  /* _POSIX_MAPPED_FILES */
291                 {
292                   size_t left = st.st_size;
293                   void *read_ptr;
294
295                   localedef->categories[cat].generic
296                     = xmalloc (st.st_size);
297                   read_ptr = localedef->categories[cat].generic;
298
299                   do
300                     {
301                       long int n;
302                       n = read (fd, read_ptr, left);
303                       if (n == -1)
304                         error (5, errno, _("cannot read locale file `%s'"),
305                                fname);
306                       read_ptr += n;
307                       left -= n;
308                     }
309                   while (left > 0);
310                 }
311
312               close (fd);
313               free (fname);
314
315               localedef->binary |= 1 << cat;
316             }
317         }
318     }
319   while (act_add_locdef != NULL);
320
321   /* Check the categories we processed in source form.  */
322   check_all_categories (localedef, charset);
323
324   /* We are now able to write the data files.  If warning were given we
325      do it only if it is explicitly requested (--force).  */
326   if (error_message_count == 0 || force_output != 0)
327     {
328       if (cannot_write_why != 0)
329         error (4, cannot_write_why, _("cannot write output files to `%s'"),
330                output_path);
331       else
332         write_all_categories (localedef, charset, output_path);
333     }
334   else
335     error (4, 0, _("no output file produced because warning were issued"));
336
337   /* This exit status is prescribed by POSIX.2 4.35.7.  */
338   exit (error_message_count != 0);
339 }
340
341
342 /* Handle program arguments.  */
343 static error_t
344 parse_opt (int key, char *arg, struct argp_state *state)
345 {
346   switch (key)
347     {
348     case OPT_QUIET:
349       be_quiet = 1;
350       break;
351     case OPT_POSIX:
352       posix_conformance = 1;
353       break;
354     case 'c':
355       force_output = 1;
356       break;
357     case 'f':
358       charmap_file = arg;
359       break;
360     case 'i':
361       input_file = arg;
362       break;
363     case 'u':
364       repertoiremap = arg;
365       break;
366     case 'v':
367       verbose = 1;
368       break;
369     default:
370       return ARGP_ERR_UNKNOWN;
371     }
372   return 0;
373 }
374
375
376 static char *
377 more_help (int key, const char *text, void *input)
378 {
379   char *cp;
380
381   switch (key)
382     {
383     case ARGP_KEY_HELP_EXTRA:
384       /* We print some extra information.  */
385       asprintf (&cp, gettext ("\
386 System's directory for character maps : %s\n\
387                        repertoire maps: %s\n\
388                        locale path    : %s\n\
389 %s"),
390                 CHARMAP_PATH, REPERTOIREMAP_PATH, LOCALE_PATH, gettext ("\
391 Report bugs using the `glibcbug' script to <bugs@gnu.org>.\n"));
392       return cp;
393     default:
394       break;
395     }
396   return (char *) text;
397 }
398
399 /* Print the version information.  */
400 static void
401 print_version (FILE *stream, struct argp_state *state)
402 {
403   fprintf (stream, "localedef (GNU %s) %s\n", PACKAGE, VERSION);
404   fprintf (stream, gettext ("\
405 Copyright (C) %s Free Software Foundation, Inc.\n\
406 This is free software; see the source for copying conditions.  There is NO\n\
407 warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.\n\
408 "), "1999");
409   fprintf (stream, gettext ("Written by %s.\n"), "Ulrich Drepper");
410 }
411
412
413 void
414 def_to_process (const char *name, int category)
415 {
416   struct copy_def_list_t *new, **rp;
417
418   for (rp = &copy_list; *rp != NULL; rp = &(*rp)->next)
419     if (strcmp (name, (*rp)->name) == 0)
420       break;
421
422   if (*rp == NULL)
423     {
424       size_t cnt;
425
426       *rp = (struct copy_def_list_t *) xmalloc (sizeof (**rp));
427
428       (*rp)->next = NULL;
429       (*rp)->name = name;
430       (*rp)->mask = 0;
431       (*rp)->locale = NULL;
432
433       for (cnt = 0; cnt < 6; ++cnt)
434         {
435           (*rp)->binary[cnt].data = NULL;
436           (*rp)->binary[cnt].len = 0;
437         }
438     }
439   new = *rp;
440
441   if ((new->mask & category) != 0)
442     /* We already have the information.  This cannot happen.  */
443     error (5, 0, _("\
444 category data requested more than once: should not happen"));
445
446   new->mask |= category;
447 }
448
449
450 /* The address of this function will be assigned to the hook in the error
451    functions.  */
452 static void
453 error_print ()
454 {
455   /* We don't want the program name to be printed in messages.  Emacs'
456      compile.el does not like this.  */
457 }
458
459
460 /* The parameter to localedef describes the output path.  If it does
461    contain a '/' character it is a relative path.  Otherwise it names the
462    locale this definition is for.  */
463 static const char *
464 construct_output_path (char *path)
465 {
466   const char *normal = NULL;
467   char *result;
468
469   if (strchr (path, '/') == NULL)
470     {
471       /* This is a system path.  First examine whether the locale name
472          contains a reference to the codeset.  This should be
473          normalized.  */
474       char *startp, *endp;
475
476       startp = path;
477       /* We must be prepared for finding a CEN name or a location of
478          the introducing `.' where it is not possible anymore.  */
479       while (*startp != '\0' && *startp != '@' && *startp != '.'
480              && *startp != '+' && *startp != ',')
481         ++startp;
482       if (*startp == '.')
483         {
484           /* We found a codeset specification.  Now find the end.  */
485           endp = ++startp;
486           while (*endp != '\0' && *endp != '@')
487             ++endp;
488
489           if (endp > startp)
490             normal = normalize_codeset (startp, endp - startp);
491         }
492       else
493         /* This is to keep gcc quiet.  */
494         endp = NULL;
495
496       /* We put an additional '\0' at the end of the string because at
497          the end of the function we need another byte for the trailing
498          '/'.  */
499       if (normal == NULL)
500         asprintf (&result, "%s/%s%c", LOCALEDIR, path, '\0');
501       else
502         asprintf (&result, "%s/%.*s%s%s%c", LOCALEDIR, startp - path, path,
503                   normal, endp, '\0');
504     }
505   else
506     {
507       /* This is a user path.  Please note the additional byte in the
508          memory allocation.  */
509       result = xmalloc (strlen (path) + 2);
510       strcpy (result, path);
511     }
512
513   errno = 0;
514
515   if (euidaccess (result, W_OK) == -1)
516     /* Perhaps the directory does not exist now.  Try to create it.  */
517     if (errno == ENOENT)
518       {
519         errno = 0;
520         mkdir (result, 0777);
521       }
522
523   strcat (result, "/");
524
525   return result;
526 }
527
528 /* Normalize codeset name.  There is no standard for the codeset
529    names.  Normalization allows the user to use any of the common
530    names.  */
531 static const char *
532 normalize_codeset (codeset, name_len)
533      const char *codeset;
534      size_t name_len;
535 {
536   int len = 0;
537   int only_digit = 1;
538   char *retval;
539   char *wp;
540   size_t cnt;
541
542   for (cnt = 0; cnt < name_len; ++cnt)
543     if (isalnum (codeset[cnt]))
544       {
545         ++len;
546
547         if (isalpha (codeset[cnt]))
548           only_digit = 0;
549       }
550
551   retval = (char *) malloc ((only_digit ? 3 : 0) + len + 1);
552
553   if (retval != NULL)
554     {
555       if (only_digit)
556         wp = stpcpy (retval, "iso");
557       else
558         wp = retval;
559
560       for (cnt = 0; cnt < name_len; ++cnt)
561         if (isalpha (codeset[cnt]))
562           *wp++ = _tolower (codeset[cnt]);
563         else if (isdigit (codeset[cnt]))
564           *wp++ = codeset[cnt];
565
566       *wp = '\0';
567     }
568
569   return (const char *) retval;
570 }