add SIMD comparison section
authorLuke Kenneth Casson Leighton <lkcl@lkcl.net>
Mon, 16 Apr 2018 08:03:05 +0000 (09:03 +0100)
committerLuke Kenneth Casson Leighton <lkcl@lkcl.net>
Mon, 16 Apr 2018 08:03:05 +0000 (09:03 +0100)
simple_v_extension.mdwn

index 0ee3985baa66917a573c2e0a261d80ca2910384e..6788ed7890d3c5ba8f0f0973f2e0043db5615a1e 100644 (file)
@@ -1171,8 +1171,9 @@ get good performance.  Unfortunately that makes it quite seductive...
 * minus: EVEN BIGGER proliferation of SIMD ISA if the functionality of
   8, 16, 32 or 64-bit reordering is built-in to the SIMD instruction.
   For example: add (high|low) 16-bits of r1 to (low|high) of r2 requires
-  two separate and distinct instructions: one for (r1:low r2:high) and
-  one for (r1:high r2:low) *per function*.
+  four separate and distinct instructions: one for (r1:low r2:high),
+  one for (r1:high r2:low), one for (r1:high r2:high) and one for
+  (r1:low r2:low) *per function*.
 * minus: EVEN BIGGER proliferation of SIMD ISA if there is a mismatch
   between operand and result bit-widths.  In combination with high/low
   proliferation the situation is made even worse.