76f7cea5c5078ee7f47019b1644b3dbb544a9c06
[kopensolaris-gnu/glibc.git] / resolv / res_comp.c
1 /*
2  * ++Copyright++ 1985, 1993
3  * -
4  * Copyright (c) 1985, 1993
5  *    The Regents of the University of California.  All rights reserved.
6  *
7  * Redistribution and use in source and binary forms, with or without
8  * modification, are permitted provided that the following conditions
9  * are met:
10  * 1. Redistributions of source code must retain the above copyright
11  *    notice, this list of conditions and the following disclaimer.
12  * 2. Redistributions in binary form must reproduce the above copyright
13  *    notice, this list of conditions and the following disclaimer in the
14  *    documentation and/or other materials provided with the distribution.
15  * 3. All advertising materials mentioning features or use of this software
16  *    must display the following acknowledgement:
17  *      This product includes software developed by the University of
18  *      California, Berkeley and its contributors.
19  * 4. Neither the name of the University nor the names of its contributors
20  *    may be used to endorse or promote products derived from this software
21  *    without specific prior written permission.
22  *
23  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
24  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
25  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
26  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
27  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
28  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
29  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
30  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
31  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
32  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
33  * SUCH DAMAGE.
34  * -
35  * Portions Copyright (c) 1993 by Digital Equipment Corporation.
36  *
37  * Permission to use, copy, modify, and distribute this software for any
38  * purpose with or without fee is hereby granted, provided that the above
39  * copyright notice and this permission notice appear in all copies, and that
40  * the name of Digital Equipment Corporation not be used in advertising or
41  * publicity pertaining to distribution of the document or software without
42  * specific, written prior permission.
43  *
44  * THE SOFTWARE IS PROVIDED "AS IS" AND DIGITAL EQUIPMENT CORP. DISCLAIMS ALL
45  * WARRANTIES WITH REGARD TO THIS SOFTWARE, INCLUDING ALL IMPLIED WARRANTIES
46  * OF MERCHANTABILITY AND FITNESS.   IN NO EVENT SHALL DIGITAL EQUIPMENT
47  * CORPORATION BE LIABLE FOR ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL
48  * DAMAGES OR ANY DAMAGES WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR
49  * PROFITS, WHETHER IN AN ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS
50  * ACTION, ARISING OUT OF OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS
51  * SOFTWARE.
52  * -
53  * --Copyright--
54  */
55
56 #if defined(LIBC_SCCS) && !defined(lint)
57 static char sccsid[] = "@(#)res_comp.c  8.1 (Berkeley) 6/4/93";
58 static char rcsid[] = "$Id$";
59 #endif /* LIBC_SCCS and not lint */
60
61 #include <sys/types.h>
62 #include <sys/param.h>
63 #include <netinet/in.h>
64 #include <arpa/nameser.h>
65
66 #include <stdio.h>
67 #include <resolv.h>
68 #include <ctype.h>
69
70 #if defined(BSD) && (BSD >= 199103)
71 # include <unistd.h>
72 # include <string.h>
73 #else
74 # include "../conf/portability.h"
75 #endif
76
77 static int      dn_find __P((u_char *exp_dn, u_char *msg,
78                              u_char **dnptrs, u_char **lastdnptr));
79
80 /*
81  * Expand compressed domain name 'comp_dn' to full domain name.
82  * 'msg' is a pointer to the begining of the message,
83  * 'eomorig' points to the first location after the message,
84  * 'exp_dn' is a pointer to a buffer of size 'length' for the result.
85  * Return size of compressed name or -1 if there was an error.
86  */
87 int
88 dn_expand(msg, eomorig, comp_dn, exp_dn, length)
89         const u_char *msg, *eomorig, *comp_dn;
90         char *exp_dn;
91         int length;
92 {
93         register const u_char *cp;
94         register char *dn;
95         register int n, c;
96         char *eom;
97         int len = -1, checked = 0;
98
99         dn = exp_dn;
100         cp = comp_dn;
101         eom = exp_dn + length;
102         /*
103          * fetch next label in domain name
104          */
105         while (n = *cp++) {
106                 /*
107                  * Check for indirection
108                  */
109                 switch (n & INDIR_MASK) {
110                 case 0:
111                         if (dn != exp_dn) {
112                                 if (dn >= eom)
113                                         return (-1);
114                                 *dn++ = '.';
115                         }
116                         if (dn+n >= eom)
117                                 return (-1);
118                         checked += n + 1;
119                         while (--n >= 0) {
120                                 if (((c = *cp++) == '.') || (c == '\\')) {
121                                         if (dn + n + 2 >= eom)
122                                                 return (-1);
123                                         *dn++ = '\\';
124                                 }
125                                 *dn++ = c;
126                                 if (cp >= eomorig)      /* out of range */
127                                         return (-1);
128                         }
129                         break;
130
131                 case INDIR_MASK:
132                         if (len < 0)
133                                 len = cp - comp_dn + 1;
134                         cp = msg + (((n & 0x3f) << 8) | (*cp & 0xff));
135                         if (cp < msg || cp >= eomorig)  /* out of range */
136                                 return (-1);
137                         checked += 2;
138                         /*
139                          * Check for loops in the compressed name;
140                          * if we've looked at the whole message,
141                          * there must be a loop.
142                          */
143                         if (checked >= eomorig - msg)
144                                 return (-1);
145                         break;
146
147                 default:
148                         return (-1);                    /* flag error */
149                 }
150         }
151         *dn = '\0';
152         if (len < 0)
153                 len = cp - comp_dn;
154         return (len);
155 }
156
157 /*
158  * Compress domain name 'exp_dn' into 'comp_dn'.
159  * Return the size of the compressed name or -1.
160  * 'length' is the size of the array pointed to by 'comp_dn'.
161  * 'dnptrs' is a list of pointers to previous compressed names. dnptrs[0]
162  * is a pointer to the beginning of the message. The list ends with NULL.
163  * 'lastdnptr' is a pointer to the end of the arrary pointed to
164  * by 'dnptrs'. Side effect is to update the list of pointers for
165  * labels inserted into the message as we compress the name.
166  * If 'dnptr' is NULL, we don't try to compress names. If 'lastdnptr'
167  * is NULL, we don't update the list.
168  */
169 int
170 dn_comp(exp_dn, comp_dn, length, dnptrs, lastdnptr)
171         const char *exp_dn;
172         u_char *comp_dn, **dnptrs, **lastdnptr;
173         int length;
174 {
175         register u_char *cp, *dn;
176         register int c, l;
177         u_char **cpp, **lpp, *sp, *eob;
178         u_char *msg;
179
180         dn = (u_char *)exp_dn;
181         cp = comp_dn;
182         eob = cp + length;
183         lpp = cpp = NULL;
184         if (dnptrs != NULL) {
185                 if ((msg = *dnptrs++) != NULL) {
186                         for (cpp = dnptrs; *cpp != NULL; cpp++)
187                                 ;
188                         lpp = cpp;      /* end of list to search */
189                 }
190         } else
191                 msg = NULL;
192         for (c = *dn++; c != '\0'; ) {
193                 /* look to see if we can use pointers */
194                 if (msg != NULL) {
195                         if ((l = dn_find(dn-1, msg, dnptrs, lpp)) >= 0) {
196                                 if (cp+1 >= eob)
197                                         return (-1);
198                                 *cp++ = (l >> 8) | INDIR_MASK;
199                                 *cp++ = l % 256;
200                                 return (cp - comp_dn);
201                         }
202                         /* not found, save it */
203                         if (lastdnptr != NULL && cpp < lastdnptr-1) {
204                                 *cpp++ = cp;
205                                 *cpp = NULL;
206                         }
207                 }
208                 sp = cp++;      /* save ptr to length byte */
209                 do {
210                         if (c == '.') {
211                                 c = *dn++;
212                                 break;
213                         }
214                         if (c == '\\') {
215                                 if ((c = *dn++) == '\0')
216                                         break;
217                         }
218                         if (cp >= eob) {
219                                 if (msg != NULL)
220                                         *lpp = NULL;
221                                 return (-1);
222                         }
223                         *cp++ = c;
224                 } while ((c = *dn++) != '\0');
225                 /* catch trailing '.'s but not '..' */
226                 if ((l = cp - sp - 1) == 0 && c == '\0') {
227                         cp--;
228                         break;
229                 }
230                 if (l <= 0 || l > MAXLABEL) {
231                         if (msg != NULL)
232                                 *lpp = NULL;
233                         return (-1);
234                 }
235                 *sp = l;
236         }
237         if (cp >= eob) {
238                 if (msg != NULL)
239                         *lpp = NULL;
240                 return (-1);
241         }
242         *cp++ = '\0';
243         return (cp - comp_dn);
244 }
245
246 /*
247  * Skip over a compressed domain name. Return the size or -1.
248  */
249 int
250 __dn_skipname(comp_dn, eom)
251         const u_char *comp_dn, *eom;
252 {
253         register const u_char *cp;
254         register int n;
255
256         cp = comp_dn;
257         while (cp < eom && (n = *cp++)) {
258                 /*
259                  * check for indirection
260                  */
261                 switch (n & INDIR_MASK) {
262                 case 0:                 /* normal case, n == len */
263                         cp += n;
264                         continue;
265                 case INDIR_MASK:        /* indirection */
266                         cp++;
267                         break;
268                 default:                /* illegal type */
269                         return (-1);
270                 }
271                 break;
272         }
273         if (cp > eom)
274                 return (-1);
275         return (cp - comp_dn);
276 }
277
278 static int
279 mklower(ch)
280         register int ch;
281 {
282         if (isascii(ch) && isupper(ch))
283                 return (tolower(ch));
284         return (ch);
285 }
286
287 /*
288  * Search for expanded name from a list of previously compressed names.
289  * Return the offset from msg if found or -1.
290  * dnptrs is the pointer to the first name on the list,
291  * not the pointer to the start of the message.
292  */
293 static int
294 dn_find(exp_dn, msg, dnptrs, lastdnptr)
295         u_char *exp_dn, *msg;
296         u_char **dnptrs, **lastdnptr;
297 {
298         register u_char *dn, *cp, **cpp;
299         register int n;
300         u_char *sp;
301
302         for (cpp = dnptrs; cpp < lastdnptr; cpp++) {
303                 dn = exp_dn;
304                 sp = cp = *cpp;
305                 while (n = *cp++) {
306                         /*
307                          * check for indirection
308                          */
309                         switch (n & INDIR_MASK) {
310                         case 0:         /* normal case, n == len */
311                                 while (--n >= 0) {
312                                         if (*dn == '.')
313                                                 goto next;
314                                         if (*dn == '\\')
315                                                 dn++;
316                                         if (mklower(*dn++) != mklower(*cp++))
317                                                 goto next;
318                                 }
319                                 if ((n = *dn++) == '\0' && *cp == '\0')
320                                         return (sp - msg);
321                                 if (n == '.')
322                                         continue;
323                                 goto next;
324
325                         case INDIR_MASK:        /* indirection */
326                                 cp = msg + (((n & 0x3f) << 8) | *cp);
327                                 break;
328
329                         default:        /* illegal type */
330                                 return (-1);
331                         }
332                 }
333                 if (*dn == '\0')
334                         return (sp - msg);
335         next:   ;
336         }
337         return (-1);
338 }
339
340 /*
341  * Verify that a domain name uses an acceptable character set.
342  */
343
344 /*
345  * Note the conspicuous absence of ctype macros in these definitions.  On
346  * non-ASCII hosts, we can't depend on string literals or ctype macros to
347  * tell us anything about network-format data.  The rest of the BIND system
348  * is not careful about this, but for some reason, we're doing it right here.
349  */
350 #define PERIOD 0x2e
351 #define hyphenchar(c) ((c) == 0x2d)
352 #define bslashchar(c) ((c) == 0x5c)
353 #define periodchar(c) ((c) == PERIOD)
354 #define asterchar(c) ((c) == 0x2a)
355 #define alphachar(c) (((c) >= 0x41 && (c) <= 0x5a) \
356                    || ((c) >= 0x61 && (c) <= 0x7a))
357 #define digitchar(c) ((c) >= 0x30 && (c) <= 0x39)
358
359 #define borderchar(c) (alphachar(c) || digitchar(c))
360 #define middlechar(c) (borderchar(c) || hyphenchar(c))
361 #define domainchar(c) ((c) > 0x20 && (c) < 0x7f)
362
363 int
364 res_hnok(dn)
365         const char *dn;
366 {
367         int ppch = '\0', pch = PERIOD, ch = *dn++;
368
369         while (ch != '\0') {
370                 int nch = *dn++;
371
372                 if (periodchar(ch)) {
373                         /* NULL */;
374                 } else if (periodchar(pch)) {
375                         if (!borderchar(ch))
376                                 return (0);
377                 } else if (periodchar(nch) || nch == '\0') {
378                         if (!borderchar(ch))
379                                 return (0);
380                 } else {
381                         if (!middlechar(ch))
382                                 return (0);
383                 }
384                 ppch = pch, pch = ch, ch = nch;
385         }
386         return (1);
387 }
388
389 /*
390  * hostname-like (A, MX, WKS) owners can have "*" as their first label
391  * but must otherwise be as a host name.
392  */
393 int
394 res_ownok(dn)
395         const char *dn;
396 {
397         if (asterchar(dn[0]) && periodchar(dn[1]))
398                 dn += 2;
399         return (res_hnok(dn));
400 }
401
402 /*
403  * SOA RNAMEs and RP RNAMEs can have any printable character in their first
404  * label, but the rest of the name has to look like a host name.
405  */
406 int
407 res_mailok(dn)
408         const char *dn;
409 {
410         int ch, escaped = 0;
411
412         /* "." is a valid missing representation */
413         if (*dn == '\0')
414                 return(1);
415
416         /* otherwise <label>.<hostname> */
417         while ((ch = *dn++) != '\0') {
418                 if (!domainchar(ch))
419                         return (0);
420                 if (!escaped && periodchar(ch))
421                         break;
422                 if (escaped)
423                         escaped = 0;
424                 else if (bslashchar(ch))
425                         escaped = 1;
426         }
427         if (periodchar(ch))
428                 return (res_hnok(dn));
429         return(0);
430 }
431
432 /*
433  * This function is quite liberal, since RFC 1034's character sets are only
434  * recommendations.
435  */
436 int
437 res_dnok(dn)
438         const char *dn;
439 {
440         int ch;
441
442         while ((ch = *dn++) != '\0')
443                 if (!domainchar(ch))
444                         return (0);
445         return (1);
446 }
447
448 /*
449  * Routines to insert/extract short/long's.
450  */
451
452 u_int16_t
453 _getshort(msgp)
454         register const u_char *msgp;
455 {
456         register u_int16_t u;
457
458         GETSHORT(u, msgp);
459         return (u);
460 }
461
462 #ifdef NeXT
463 /*
464  * nExt machines have some funky library conventions, which we must maintain.
465  */
466 u_int16_t
467 res_getshort(msgp)
468         register const u_char *msgp;
469 {
470         return (_getshort(msgp));
471 }
472 #endif
473
474 u_int32_t
475 _getlong(msgp)
476         register const u_char *msgp;
477 {
478         register u_int32_t u;
479
480         GETLONG(u, msgp);
481         return (u);
482 }
483
484 void
485 #if defined(__STDC__) || defined(__cplusplus)
486 __putshort(register u_int16_t s, register u_char *msgp) /* must match proto */
487 #else
488 __putshort(s, msgp)
489         register u_int16_t s;
490         register u_char *msgp;
491 #endif
492 {
493         PUTSHORT(s, msgp);
494 }
495
496 void
497 __putlong(l, msgp)
498         register u_int32_t l;
499         register u_char *msgp;
500 {
501         PUTLONG(l, msgp);
502 }
503
504 #ifdef ultrix
505 /* ultrix 4.0 had some icky packaging in its libc.a.  alias for it here.
506  * there is more gunk of this kind over in res_debug.c.
507  */
508 #undef putshort
509 void
510 #if defined(__STDC__) || defined(__cplusplus)
511 putshort(register u_short s, register u_char *msgp)
512 #else
513 putshort(s, msgp)
514         register u_short s;
515         register u_char *msgp;
516 #endif
517 {
518         __putshort(s, msgp);
519 }
520 #undef putlong
521 void
522 putlong(l, msgp)
523         register u_int32_t l;
524         register u_char *msgp;
525 {
526         __putlong(l, msgp);
527 }
528
529 #undef dn_comp
530 int
531 dn_comp(exp_dn, comp_dn, length, dnptrs, lastdnptr)
532         const char *exp_dn;
533         u_char *comp_dn, **dnptrs, **lastdnptr;
534         int length;
535 {
536         return (__dn_comp(exp_dn, comp_dn, length, dnptrs, lastdnptr));
537 }
538
539 #undef dn_expand
540 int
541 dn_expand(msg, eomorig, comp_dn, exp_dn, length)
542         const u_char *msg, *eomorig, *comp_dn;
543         char *exp_dn;
544         int length;
545 {
546         return (__dn_expand(msg, eomorig, comp_dn, exp_dn, length));
547 }
548
549 #undef dn_skipname
550 dn_skipname(comp_dn, eom)
551         const u_char *comp_dn, *eom;
552 {
553         return (__dn_skipname(comp_dn, eom));
554 }
555 #endif /* Ultrix 4.0 hackery */