X86: Implement the media sqrt instructions.
authorGabe Black <gblack@eecs.umich.edu>
Tue, 18 Aug 2009 01:34:19 +0000 (18:34 -0700)
committerGabe Black <gblack@eecs.umich.edu>
Tue, 18 Aug 2009 01:34:19 +0000 (18:34 -0700)
src/arch/x86/isa/decoder/two_byte_opcodes.isa
src/arch/x86/isa/insts/simd128/floating_point/arithmetic/square_root.py

index 4c608264cfdc7ca1f6621ab70f899cef9bee58fe..faf9389a404f6d56883ab1194b34ef6c6e56eb8d 100644 (file)
                 // no prefix
                 0x0: decode OPCODE_OP_BOTTOM3 {
                     0x0: movmskps_Gd_VRo();
-                    0x1: sqrtps_Vo_Wo();
+                    0x1: Inst::SQRTPS(Vo,Wo);
                     0x2: rqsrtps_Vo_Wo();
                     0x3: rcpps_Vo_Wo();
                     0x4: Inst::ANDPS(Vo,Wo);
                 }
                 // repe (0xF3)
                 0x4: decode OPCODE_OP_BOTTOM3 {
-                    0x1: sqrtss_Vd_Wd();
+                    0x1: Inst::SQRTSS(Vd,Wd);
                     0x2: rsqrtss_Vd_Wd();
                     0x3: rcpss_Vd_Wd();
                     default: Inst::UD2();
                 // operand size (0x66)
                 0x1: decode OPCODE_OP_BOTTOM3 {
                     0x0: movmskpd_Gd_VRo();
-                    0x1: sqrtpd_Vo_Wo();
+                    0x1: Inst::SQRTPD(Vo,Wo);
                     0x4: Inst::ANDPD(Vo,Wo);
                     0x5: Inst::ANDNPD(Vo,Wo);
                     0x6: Inst::ORPD(Vo,Wo);
                 format Inst {
                     // repne (0xF2)
                     0x8: decode OPCODE_OP_BOTTOM3 {
-                        0x1: SQRTSD(Vq,Wq);
+                        0x1: Inst::SQRTSD(Vq,Wq);
                         default: UD2();
                     }
                     default: UD2();
index 1591eee8ed10edd3a34ed663d520ab18c33e8210..fdeb30ddc22f8049cc283994e9b8c377299c531b 100644 (file)
 # Authors: Gabe Black
 
 microcode = '''
-# SQRTPS
-# SQRTPD
-# SQRTSS
+def macroop SQRTSS_XMM_XMM {
+    msqrt xmml, xmmlm, size=4, ext=1
+};
+
+def macroop SQRTSS_XMM_M {
+    ldfp ufp1, seg, sib, disp, dataSize=8
+    msqrt xmml, ufp1, size=4, ext=1
+};
+
+def macroop SQRTSS_XMM_P {
+    rdip t7
+    ldfp ufp1, seg, riprel, disp, dataSize=8
+    msqrt xmml, ufp1, size=4, ext=1
+};
+
+def macroop SQRTPS_XMM_XMM {
+    msqrt xmml, xmmlm, size=4, ext=0
+    msqrt xmmh, xmmhm, size=4, ext=0
+};
+
+def macroop SQRTPS_XMM_M {
+    ldfp ufp1, seg, sib, "DISPLACEMENT", dataSize=8
+    ldfp ufp2, seg, sib, "DISPLACEMENT + 8", dataSize=8
+    msqrt xmml, ufp1, size=4, ext=0
+    msqrt xmmh, ufp2, size=4, ext=0
+};
+
+def macroop SQRTPS_XMM_P {
+    rdip t7
+    ldfp ufp1, seg, riprel, "DISPLACEMENT", dataSize=8
+    ldfp ufp2, seg, riprel, "DISPLACEMENT + 8", dataSize=8
+    msqrt xmml, ufp1, size=4, ext=0
+    msqrt xmmh, ufp2, size=4, ext=0
+};
 
 def macroop SQRTSD_XMM_XMM {
-    sqrtfp xmml, xmml, xmmlm
+    msqrt xmml, xmmlm, size=8, ext=1
 };
 
 def macroop SQRTSD_XMM_M {
     ldfp ufp1, seg, sib, disp, dataSize=8
-    sqrtfp xmml, xmml, ufp1
+    msqrt xmml, ufp1, size=8, ext=1
 };
 
 def macroop SQRTSD_XMM_P {
     rdip t7
     ldfp ufp1, seg, riprel, disp, dataSize=8
-    sqrtfp xmml, xmml, ufp1
+    msqrt xmml, ufp1, size=8, ext=1
+};
+
+def macroop SQRTPD_XMM_XMM {
+    msqrt xmml, xmmlm, size=8, ext=0
+    msqrt xmmh, xmmhm, size=8, ext=0
+};
+
+def macroop SQRTPD_XMM_M {
+    ldfp ufp1, seg, sib, "DISPLACEMENT", dataSize=8
+    ldfp ufp2, seg, sib, "DISPLACEMENT + 8", dataSize=8
+    msqrt xmml, ufp1, size=8, ext=0
+    msqrt xmmh, ufp2, size=8, ext=0
+};
+
+def macroop SQRTPD_XMM_P {
+    rdip t7
+    ldfp ufp1, seg, riprel, "DISPLACEMENT", dataSize=8
+    ldfp ufp2, seg, riprel, "DISPLACEMENT + 8", dataSize=8
+    msqrt xmml, ufp1, size=8, ext=0
+    msqrt xmmh, ufp2, size=8, ext=0
 };
 '''