Update.
[kopensolaris-gnu/glibc.git] / PROJECTS
1 Open jobs for finishing GNU libc:
2 ---------------------------------
3 Status: February 2001
4
5 If you have time and talent to take over any of the jobs below please
6 contact <bug-glibc@gnu.org>.
7
8 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
9 \f
10 [ 1] Port to new platforms or test current version on formerly supported
11      platforms.
12
13 **** See http://www.gnu.org/software/libc/porting.html for more details.
14
15
16 [ 2] Test compliance with standards.  If you have access to recent
17      standards (IEEE, ISO, ANSI, X/Open, ...) and/or test suites you
18      could do some checks as the goal is to be compliant with all
19      standards if they do not contradict each other.
20
21
22 [ 3] The IMHO opinion most important task is to write a more complete
23      test suite.  We cannot get too many people working on this.  It is
24      not difficult to write a test, find a definition of the function
25      which I normally can provide, if necessary, and start writing tests
26      to test for compliance.  Beside this, take a look at the sources
27      and write tests which in total test as many paths of execution as
28      possible.
29
30
31 [ 4] Write translations for the GNU libc message for the so far
32      unsupported languages.  GNU libc is fully internationalized and
33      users can immediately benefit from this.
34
35      Take a look at the matrix in
36         ftp://ftp.gnu.org/pub/gnu/ABOUT-NLS
37      for the current status (of course better use a mirror of ftp.gnu.org).
38
39
40 [ 8] If you enjoy assembler programming (as I do --drepper :-) you might
41      be interested in writing optimized versions for some functions.
42      Especially the string handling functions can be optimized a lot.
43
44      Take a look at
45
46         Faster String Functions
47         Henry Spencer, University of Toronto
48         Usenix Winter '92, pp. 419--428
49
50      or just ask.  Currently mostly i?86 and Alpha optimized versions
51      exist.  Please ask before working on this to avoid duplicate
52      work.
53
54
55 [10] Extend regex and/or rx to work with wide characters and complete
56      implementation of character class and collation class handling.
57
58      It is planned to do a complete rewrite.
59
60 ***  We have now multibyte character support.  But a rewrite is still
61      necessary.
62
63
64 [11] Write access function for netmasks, bootparams, and automount
65      databases for nss_files and nss_db module.
66      The functions should be embedded in the nss scheme.  This is not
67      hard and not all services must be supported at once.
68
69
70 [15] Cleaning up the header files.  Ideally, each header style should
71      follow the "good examples".  Each variable and function should have
72      a short description of the function and its parameters.  The prototypes
73      should always contain variable names which can help to identify their
74      meaning; better than
75
76                 int foo (int, int, int, int);
77
78      Blargh!
79
80 ***  The conformtest.pl tool helps cleaning the namespace.  As far as
81      known the prototypes all contain parameter names.  But maybe some
82      comments can be improved.
83
84
85 [16] The libio stream file functions should be extended in a way to use
86      mmap to map the file and use it as the buffer to user sees.  For
87      read-only streams this should be rather easy and it avoids all read()
88      calls.
89
90      A more sophisticated solution would use mmap also for writing.  The
91      standards do not demand that the file on the disk is always in the
92      correct form so it would be possible to enlarge it always according
93      to the page size and install the correct length only for fclose() and
94      fflush() calls.
95
96
97 [18] Based on the sprof program we need tools to analyze the output.  The
98      result should be a link map which specifies in which order the .o
99      files are placed in the shared object.  This should help to improve
100      code locality and result in a smaller foorprint (in code and data
101      memory) since less pages are only used in small parts.
102
103
104 [19] A user-level STREAMS implementation should be available if the
105      kernel does not provide the support.
106
107 ***  This is a much lower priority job now that STREAMS are optional in
108      XPG.
109
110
111 [20] More conversion modules for iconv(3).  Existing modules should be
112      extended to do things like transliteration if this is wanted.
113      For often used conversion a direct conversion function should be
114      available.
115
116
117 [21] The nscd program and the stubs in the libc should be changed so
118      that each program uses only one socket connect.  Take a look at
119         http://www.cygnus.com/~drepper/nscd.html
120
121      An alternative approach is to use an mmap()ed file.  The idea is
122      the following:
123      - the nscd creates the hash tables and the information it stores
124        in it in a mmap()ed region.  This means no pointers must be
125        used, only offsets.
126      OR
127        if POSIX shared memory is available use a named shared memory
128        region to put the data in
129      - each program using NSS functionality tries to open the file
130        with the data.
131      - by checking some timestamp (which the nscd renews frequently)
132        the programs can test whether the file is still valid
133      - if the file is valid look through the nscd and locate the
134        appropriate hash table for the database and lookup the data.
135        If it is included we are set.
136      - if the data is not yet in the database we contact the nscd using
137        the currently implemented methods.
138
139
140 [23] The `strptime' function needs to be completed.  This includes among
141      other things that it must get teached about timezones.  The solution
142      envisioned is to extract the timezones from the ADO timezone
143      specifications.  Special care must be given names which are used
144      multiple times.  Here the precedence should (probably) be according
145      to the geograhical distance.  E.g., the timezone EST should be
146      treated as the `Eastern Australia Time' instead of the US `Eastern
147      Standard Time' if the current TZ variable is set to, say,
148      Australia/Canberra or if the current locale is en_AU.
149
150
151 [25] Sun's nscd version implements a feature where the nscd keeps N entries
152      for each database current.  I.e., if an entries lifespan is over and
153      it is one of the N entries to be kept the nscd updates the information
154      instead of removing the entry.
155
156      How to decide about which N entries to keep has to be examined.
157      Factors should be number of uses (of course), influenced by aging.
158      Just imagine a computer used by several people.  The IDs of the current
159      user should be preferred even if the last user spent more time.
160
161
162 [27] We need a second test suite with tests which cannot run during a normal
163      `make check' run.  This test suite can require root priviledges and
164      can test things like DNS (i.e., require network access),
165      user-interaction, networking in general, and probably many other things.