2011-05-03 Stuart Henderson <shenders@gcc.gnu.org>
authorStuart Henderson <shenders@gcc.gnu.org>
Tue, 3 May 2011 16:24:59 +0000 (16:24 +0000)
committerStuart Henderson <shenders@gcc.gnu.org>
Tue, 3 May 2011 16:24:59 +0000 (16:24 +0000)
        From Bernd Schmidt
        * config/bfin/t-bfin (LIB1ASMFUNCS): Add muldi3 and umulsi3_highpart.
        * config/bfin/t-bfin-elf (LIB1ASMFUNCS): Add muldi3.
        * config/bfin/t-bfin-linux (LIB1ASMFUNCS): Add muldi3.
        * config/bfin/t-bfin-uclinux (LIB1ASMFUNCS): Add muldi3.
        * config/bfin/lib1funcs.asm (___muldi3): New function.

From-SVN: r173323

gcc/ChangeLog
gcc/config/bfin/lib1funcs.asm
gcc/config/bfin/t-bfin
gcc/config/bfin/t-bfin-elf
gcc/config/bfin/t-bfin-linux
gcc/config/bfin/t-bfin-uclinux

index 6817e7b13b5b4321219fd9a57a783bbc4e2ac588..8124e2289d7247bf29b7dcf98bc181919bec88c2 100644 (file)
@@ -1,3 +1,12 @@
+2011-05-03  Stuart Henderson  <shenders@gcc.gnu.org>
+
+       From Bernd Schmidt
+       * config/bfin/t-bfin (LIB1ASMFUNCS): Add muldi3 and umulsi3_highpart.
+       * config/bfin/t-bfin-elf (LIB1ASMFUNCS): Add muldi3.
+       * config/bfin/t-bfin-linux (LIB1ASMFUNCS): Add muldi3.
+       * config/bfin/t-bfin-uclinux (LIB1ASMFUNCS): Add muldi3.
+       * config/bfin/lib1funcs.asm (___muldi3): New function.
+
 2011-05-03  Nathan Froyd  <froydnj@codesourcery.com>
 
        * config/stormy16/stormy16 (xstormy16_init_builtins): Call
index 4e15ad23068fd970ff24604ff316f99f8878a840..c7bf4f3f05c4fcfd2f9352a9e632d1497cf83b70 100644 (file)
@@ -144,3 +144,68 @@ ___smulsi3_highpart:
        R0 = (A0 += A1);
        RTS;
 #endif
+
+#ifdef L_muldi3
+.align 2
+.global ___muldi3;
+.type ___muldi3, STT_FUNC;
+
+/*
+          R1:R0 * R3:R2
+        = R1.h:R1.l:R0.h:R0.l * R3.h:R3.l:R2.h:R2.l
+[X]     = (R1.h * R3.h) * 2^96
+[X]       + (R1.h * R3.l + R1.l * R3.h) * 2^80
+[X]       + (R1.h * R2.h + R1.l * R3.l + R3.h * R0.h) * 2^64
+[T1]      + (R1.h * R2.l + R3.h * R0.l + R1.l * R2.h + R3.l * R0.h) * 2^48
+[T2]      + (R1.l * R2.l + R3.l * R0.l + R0.h * R2.h) * 2^32
+[T3]      + (R0.l * R2.h + R2.l * R0.h) * 2^16
+[T4]      + (R0.l * R2.l)
+
+       We can discard the first three lines marked "X" since we produce
+       only a 64 bit result.  So, we need ten 16-bit multiplies.
+
+       Individual mul-acc results:
+[E1]    =  R1.h * R2.l + R3.h * R0.l + R1.l * R2.h + R3.l * R0.h
+[E2]    =  R1.l * R2.l + R3.l * R0.l + R0.h * R2.h
+[E3]    =  R0.l * R2.h + R2.l * R0.h
+[E4]    =  R0.l * R2.l
+
+       We also need to add high parts from lower-level results to higher ones:
+       E[n]c = E[n] + (E[n+1]c >> 16), where E4c := E4
+
+       One interesting property is that all parts of the result that depend
+       on the sign of the multiplication are discarded.  Those would be the
+       multiplications involving R1.h and R3.h, but only the top 16 bit of
+       the 32 bit result depend on the sign, and since R1.h and R3.h only
+       occur in E1, the top half of these results is cut off.
+       So, we can just use FU mode for all of the 16-bit multiplies, and
+       ignore questions of when to use mixed mode.  */
+
+___muldi3:
+       /* [SP] technically is part of the caller's frame, but we can
+          use it as scratch space.  */
+       A0 = R2.H * R1.L, A1 = R2.L * R1.H (FU) || R3 = [SP + 12];      /* E1 */
+       A0 += R3.H * R0.L, A1 += R3.L * R0.H (FU) || [SP] = R4;         /* E1 */
+       A0 += A1;                                                       /* E1 */
+       R4 = A0.w;
+       A0 = R0.l * R3.l (FU);                                          /* E2 */
+       A0 += R2.l * R1.l (FU);                                         /* E2 */
+
+       A1 = R2.L * R0.L (FU);                                          /* E4 */
+       R3 = A1.w;
+       A1 = A1 >> 16;                                                  /* E3c */
+       A0 += R2.H * R0.H, A1 += R2.L * R0.H (FU);                      /* E2, E3c */
+       A1 += R0.L * R2.H (FU);                                         /* E3c */
+       R0 = A1.w;
+       A1 = A1 >> 16;                                                  /* E2c */
+       A0 += A1;                                                       /* E2c */
+       R1 = A0.w;
+
+       /* low(result) = low(E3c):low(E4) */
+       R0 = PACK (R0.l, R3.l);
+       /* high(result) = E2c + (E1 << 16) */
+       R1.h = R1.h + R4.l (NS) || R4 = [SP];
+       RTS;
+
+.size ___muldi3, .-___muldi3
+#endif
index 37b6871c1dcae43741375b4843828b4ae1cb19cc..90ee8f2c1f7df0ebdd85aa54653de434e4604ba8 100644 (file)
@@ -19,7 +19,8 @@
 ## Target part of the Makefile
 
 LIB1ASMSRC = bfin/lib1funcs.asm
-LIB1ASMFUNCS = _divsi3 _udivsi3 _umodsi3 _modsi3
+LIB1ASMFUNCS = _divsi3 _udivsi3 _umodsi3 _modsi3 _muldi3 _umulsi3_highpart
+LIB1ASMFUNCS += _smulsi3_highpart
 
 EXTRA_PARTS = crtbegin.o crtend.o crti.o crtn.o
 
index 39209f628ef7238cbd51fa530554b9ed42da31b1..da242a08a21b63bee0222cac647a41560969097d 100644 (file)
@@ -19,7 +19,7 @@
 ## Target part of the Makefile
 
 LIB1ASMSRC = bfin/lib1funcs.asm
-LIB1ASMFUNCS = _divsi3 _udivsi3 _umodsi3 _modsi3 _umulsi3_highpart
+LIB1ASMFUNCS = _divsi3 _udivsi3 _umodsi3 _modsi3 _muldi3 _umulsi3_highpart
 LIB1ASMFUNCS += _smulsi3_highpart
 
 FPBIT = fp-bit.c
index f7ba9550128078b841259cce76862d579bcbc847..daa1e059ce4644610023c11f78a093f5cc45724d 100644 (file)
@@ -19,7 +19,7 @@
 ## Target part of the Makefile
 
 LIB1ASMSRC = bfin/lib1funcs.asm
-LIB1ASMFUNCS = _divsi3 _udivsi3 _umodsi3 _modsi3 _umulsi3_highpart
+LIB1ASMFUNCS = _divsi3 _udivsi3 _umodsi3 _modsi3 _muldi3 _umulsi3_highpart
 LIB1ASMFUNCS += _smulsi3_highpart
 
 FPBIT = fp-bit.c
index eb6d2253eb0292480a882cfe752341d75dce58f0..0be258f2f1169bdfa49a79c3c79aa463de2f888f 100644 (file)
@@ -19,7 +19,7 @@
 ## Target part of the Makefile
 
 LIB1ASMSRC = bfin/lib1funcs.asm
-LIB1ASMFUNCS = _divsi3 _udivsi3 _umodsi3 _modsi3 _umulsi3_highpart
+LIB1ASMFUNCS = _divsi3 _udivsi3 _umodsi3 _modsi3 _muldi3 _umulsi3_highpart
 LIB1ASMFUNCS += _smulsi3_highpart
 
 FPBIT = fp-bit.c