pthread_barrier_wait implementation for Linux/SH.
authordrepper <drepper>
Mon, 10 Feb 2003 09:17:47 +0000 (09:17 +0000)
committerdrepper <drepper>
Mon, 10 Feb 2003 09:17:47 +0000 (09:17 +0000)
nptl/sysdeps/unix/sysv/linux/sh/pthread_barrier_wait.S [new file with mode: 0644]

diff --git a/nptl/sysdeps/unix/sysv/linux/sh/pthread_barrier_wait.S b/nptl/sysdeps/unix/sysv/linux/sh/pthread_barrier_wait.S
new file mode 100644 (file)
index 0000000..eead7c6
--- /dev/null
@@ -0,0 +1,164 @@
+/* Copyright (C) 2003 Free Software Foundation, Inc.
+   This file is part of the GNU C Library.
+
+   The GNU C Library is free software; you can redistribute it and/or
+   modify it under the terms of the GNU Lesser General Public
+   License as published by the Free Software Foundation; either
+   version 2.1 of the License, or (at your option) any later version.
+
+   The GNU C Library is distributed in the hope that it will be useful,
+   but WITHOUT ANY WARRANTY; without even the implied warranty of
+   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
+   Lesser General Public License for more details.
+
+   You should have received a copy of the GNU Lesser General Public
+   License along with the GNU C Library; if not, write to the Free
+   Software Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA
+   02111-1307 USA.  */
+
+#include <sysdep.h>
+#include "lowlevel-atomic.h"
+
+#define SYS_futex      240
+#define FUTEX_WAIT     0
+#define FUTEX_WAKE     1
+
+#define CURR_EVENT     0
+#define MUTEX          4
+#define LEFT           8
+#define        INIT_COUNT      12
+
+
+       .text
+
+       .globl  pthread_barrier_wait
+       .type   pthread_barrier_wait,@function
+       .align  5
+pthread_barrier_wait:
+       mov.l   r9, @-r15
+       mov.l   r8, @-r15
+       sts.l   pr, @-r15
+       mov     r4, r8
+
+       /* Get the mutex.  */
+       mov     #-1, r3
+       XADD (r3, @(MUTEX,r8), r2)
+       tst     r3, r3
+       bf      1f
+
+       /* One less waiter.  If this was the last one needed wake
+          everybody.  */
+2:
+       mov.l   @(LEFT,r8), r0
+       add     #-1, r0
+       mov.l   r0, @(LEFT,r8)
+       tst     r0, r0
+       bt      3f
+
+       /* There are more threads to come.  */
+       mov.l   @(CURR_EVENT,r8), r6
+
+       /* Release the mutex.  */
+       INC (@(MUTEX,r8), r2)
+       cmp/pl  r2
+       bf      6f
+7:
+       /* Wait for the remaining threads.  The call will return immediately
+          if the CURR_EVENT memory has meanwhile been changed.  */
+       mov     r8, r4
+#if CURR_EVENT != 0
+       add     #CURR_EVENT, r4
+#endif
+       mov     #FUTEX_WAIT, r5
+       mov     #0, r7
+8:
+       mov     #SYS_futex, r3
+       extu.b  r3, r3
+       trapa   #0x14
+       SYSCALL_INST_PAD
+
+       /* Don't return on spurious wakeups.  The syscall does not change
+          any register except r0 so there is no need to reload any of
+          them.  */
+       mov.l   @(CURR_EVENT,r8), r0
+       cmp/eq  r0, r6
+       bt      8b
+
+       mov     #0, r0          /* != PTHREAD_BARRIER_SERIAL_THREAD */
+       lds.l   @r15+, pr
+       mov.l   @r15+, r8
+       rts
+        mov.l  @r15+, r9
+
+3:     
+       /* The necessary number of threads arrived.  */
+       mov.l   @(INIT_COUNT,r8), r0
+       mov.l   r0, @(LEFT,r8)
+       mov.l   @(CURR_EVENT,r8), r1
+       add     #1, r1
+       mov.l   r1, @(CURR_EVENT,r8)
+
+       /* Wake up all waiters.  The count is a signed number in the kernel
+          so 0x7fffffff is the highest value.  */
+       mov.l   .Lall, r6
+       mov     r8, r4
+#if CURR_EVENT != 0
+       add     #CURR_EVENT, r4
+#endif
+       mov     #0, r7
+       mov     #FUTEX_WAKE, r5
+       mov     #SYS_futex, r3
+       extu.b  r3, r3
+       trapa   #0x14
+       SYSCALL_INST_PAD
+
+       /* Release the mutex.  */
+       INC (@(MUTEX,r8), r2)
+       cmp/pl  r2
+       bf      4f
+5:
+       mov     #-1, r0         /* == PTHREAD_BARRIER_SERIAL_THREAD */
+       lds.l   @r15+, pr
+       mov.l   @r15+, r8
+       ret
+        mov.l  @r15+, r9
+
+1:
+       mov     r2, r4
+       mov     r8, r5
+       mov.l   .Lwait0, r1
+       bsrf    r1
+        add    #MUTEX, r5
+.Lwait0b:
+       bra     2b
+        nop
+
+4:
+       mov     r8, r4
+       mov.l   .Lwake0, r1
+       bsrf    r1
+        add    #MUTEX, r4
+.Lwake0b:
+       bra     5b
+        nop
+
+6:
+       mov     r6, r9
+       mov     r8, r4
+       mov.l   .Lwake1, r1
+       bsrf    r1
+        add    #MUTEX, r4
+.Lwake1b:
+       bra     7b
+        mov    r9, r6
+
+       .align  2
+.Lall:
+       .long   0x7fffffff
+.Lwait0:
+       .long   __lll_lock_wait-.Lwait0b
+.Lwake0:
+       .long   __lll_unlock_wake-.Lwake0b
+.Lwake1:
+       .long   __lll_unlock_wake-.Lwake1b      
+       .size   pthread_barrier_wait,.-pthread_barrier_wait