(__pthread_lock): Add memory barriers.
[kopensolaris-gnu/glibc.git] / linuxthreads / spinlock.c
1 /* Linuxthreads - a simple clone()-based implementation of Posix        */
2 /* threads for Linux.                                                   */
3 /* Copyright (C) 1998 Xavier Leroy (Xavier.Leroy@inria.fr)              */
4 /*                                                                      */
5 /* This program is free software; you can redistribute it and/or        */
6 /* modify it under the terms of the GNU Library General Public License  */
7 /* as published by the Free Software Foundation; either version 2       */
8 /* of the License, or (at your option) any later version.               */
9 /*                                                                      */
10 /* This program is distributed in the hope that it will be useful,      */
11 /* but WITHOUT ANY WARRANTY; without even the implied warranty of       */
12 /* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the        */
13 /* GNU Library General Public License for more details.                 */
14
15 /* Internal locks */
16
17 #include <errno.h>
18 #include <sched.h>
19 #include <time.h>
20 #include "pthread.h"
21 #include "internals.h"
22 #include "spinlock.h"
23 #include "restart.h"
24
25 /* The status field of a fastlock has the following meaning:
26      0: fastlock is free
27      1: fastlock is taken, no thread is waiting on it
28   ADDR: fastlock is taken, ADDR is address of thread descriptor for
29         first waiting thread, other waiting threads are linked via
30         their p_nextlock field.
31    The waiting list is not sorted by priority order.
32    Actually, we always insert at top of list (sole insertion mode
33    that can be performed without locking).
34    For __pthread_unlock, we perform a linear search in the list
35    to find the highest-priority, oldest waiting thread.
36    This is safe because there are no concurrent __pthread_unlock
37    operations -- only the thread that locked the mutex can unlock it. */
38
39 void internal_function __pthread_lock(struct _pthread_fastlock * lock,
40                                       pthread_descr self)
41 {
42   long oldstatus, newstatus;
43   int spurious_wakeup_count = 0;
44
45   do {
46     oldstatus = lock->__status;
47     if (oldstatus == 0) {
48       newstatus = 1;
49     } else {
50       if (self == NULL)
51         self = thread_self();
52       newstatus = (long) self;
53     }
54     if (self != NULL) {
55       ASSERT(self->p_nextlock == NULL);
56       THREAD_SETMEM(self, p_nextlock, (pthread_descr) oldstatus);
57       /* Make sure the store in p_nextlock completes before performing
58          the compare-and-swap */
59       MEMORY_BARRIER();
60     }
61   } while(! compare_and_swap(&lock->__status, oldstatus, newstatus,
62                              &lock->__spinlock));
63
64   /* Suspend with guard against spurious wakeup. 
65      This can happen in pthread_cond_timedwait_relative, when the thread
66      wakes up due to timeout and is still on the condvar queue, and then
67      locks the queue to remove itself. At that point it may still be on the
68      queue, and may be resumed by a condition signal. */
69
70   if (oldstatus != 0) {
71     for (;;) {
72       suspend(self);
73       if (self->p_nextlock != NULL) {
74         /* Count resumes that don't belong to us. */
75         spurious_wakeup_count++;
76         continue;
77       }
78       break;
79     }
80   }
81
82   /* Put back any resumes we caught that don't belong to us. */
83   while (spurious_wakeup_count--)
84     restart(self);
85 }
86
87 void internal_function __pthread_unlock(struct _pthread_fastlock * lock)
88 {
89   long oldstatus;
90   pthread_descr thr, * ptr, * maxptr;
91   int maxprio;
92
93 again:
94   oldstatus = lock->__status;
95   if (oldstatus == 0 || oldstatus == 1) {
96     /* No threads are waiting for this lock.  Please note that we also
97        enter this case if the lock is not taken at all.  If this wouldn't
98        be done here we would crash further down.  */
99     if (! compare_and_swap(&lock->__status, oldstatus, 0, &lock->__spinlock))
100       goto again;
101     return;
102   }
103   /* Find thread in waiting queue with maximal priority */
104   ptr = (pthread_descr *) &lock->__status;
105   thr = (pthread_descr) oldstatus;
106   maxprio = 0;
107   maxptr = ptr;
108   while (thr != (pthread_descr) 1) {
109     if (thr->p_priority >= maxprio) {
110       maxptr = ptr;
111       maxprio = thr->p_priority;
112     }
113     ptr = &(thr->p_nextlock);
114     /* Prevent reordering of the load of lock->__status above and the
115        load of *ptr below, as well as reordering of *ptr between
116        several iterations of the while loop.  Some processors (e.g.
117        multiprocessor Alphas) could perform such reordering even though
118        the loads are dependent. */
119     MEMORY_BARRIER();
120     thr = *ptr;
121   }
122   /* Prevent reordering of the load of lock->__status above and
123      thr->p_nextlock below */
124   MEMORY_BARRIER();
125   /* Remove max prio thread from waiting list. */
126   if (maxptr == (pthread_descr *) &lock->__status) {
127     /* If max prio thread is at head, remove it with compare-and-swap
128        to guard against concurrent lock operation */
129     thr = (pthread_descr) oldstatus;
130     if (! compare_and_swap(&lock->__status,
131                            oldstatus, (long)(thr->p_nextlock),
132                            &lock->__spinlock))
133       goto again;
134   } else {
135     /* No risk of concurrent access, remove max prio thread normally */
136     thr = *maxptr;
137     *maxptr = thr->p_nextlock;
138   }
139   /* Prevent reordering of store to *maxptr above and store to thr->p_nextlock
140      below */
141   MEMORY_BARRIER();
142   /* Wake up the selected waiting thread */
143   thr->p_nextlock = NULL;
144   restart(thr);
145 }
146
147 /* Compare-and-swap emulation with a spinlock */
148
149 #ifdef TEST_FOR_COMPARE_AND_SWAP
150 int __pthread_has_cas = 0;
151 #endif
152
153 #if !defined HAS_COMPARE_AND_SWAP || defined TEST_FOR_COMPARE_AND_SWAP
154
155 static void __pthread_acquire(int * spinlock);
156
157 int __pthread_compare_and_swap(long * ptr, long oldval, long newval,
158                                int * spinlock)
159 {
160   int res;
161   if (testandset(spinlock)) __pthread_acquire(spinlock);
162   if (*ptr == oldval) {
163     *ptr = newval; res = 1;
164   } else {
165     res = 0;
166   }
167   /* Prevent reordering of store to *ptr above and store to *spinlock below */
168   MEMORY_BARRIER();
169   *spinlock = 0;
170   return res;
171 }
172
173 /* This function is called if the inlined test-and-set
174    in __pthread_compare_and_swap() failed */
175
176 /* The retry strategy is as follows:
177    - We test and set the spinlock MAX_SPIN_COUNT times, calling
178      sched_yield() each time.  This gives ample opportunity for other
179      threads with priority >= our priority to make progress and
180      release the spinlock.
181    - If a thread with priority < our priority owns the spinlock,
182      calling sched_yield() repeatedly is useless, since we're preventing
183      the owning thread from making progress and releasing the spinlock.
184      So, after MAX_SPIN_LOCK attemps, we suspend the calling thread
185      using nanosleep().  This again should give time to the owning thread
186      for releasing the spinlock.
187      Notice that the nanosleep() interval must not be too small,
188      since the kernel does busy-waiting for short intervals in a realtime
189      process (!).  The smallest duration that guarantees thread
190      suspension is currently 2ms.
191    - When nanosleep() returns, we try again, doing MAX_SPIN_COUNT
192      sched_yield(), then sleeping again if needed. */
193
194 static void __pthread_acquire(int * spinlock)
195 {
196   int cnt = 0;
197   struct timespec tm;
198
199   while (testandset(spinlock)) {
200     if (cnt < MAX_SPIN_COUNT) {
201       sched_yield();
202       cnt++;
203     } else {
204       tm.tv_sec = 0;
205       tm.tv_nsec = SPIN_SLEEP_DURATION;
206       nanosleep(&tm, NULL);
207       cnt = 0;
208     }
209   }
210 }
211
212 #endif