(no commit message)
authorlkcl <lkcl@web>
Tue, 22 Dec 2020 05:22:46 +0000 (05:22 +0000)
committerIkiWiki <ikiwiki.info>
Tue, 22 Dec 2020 05:22:46 +0000 (05:22 +0000)
openpower/sv/svp_rewrite/svp64.mdwn

index 3e25674e1a77987527f00119c01f089b0fc4f1bb..68d59a81a176d3370aa6e02f2311cc7ba457d3a2 100644 (file)
@@ -510,11 +510,14 @@ As mentioned above, OE=1 is not applicable in SV, freeing this bit for alternati
 
 Likewise, `lq` (Load Quad), and Load/Store Multiple make no sense to have because they are not only provided by SV, the SV alternatives may be predicated as well, making them far better suited to use in function calls and context-switching.
 
-This leaves several Major Opcodes free for use by SV to fit alternative instructions: Vector Product, Vector Normalise, [[sv/mv.swizzle]], Texture LD/ST operations, and others critical to an efficient, effective 3D GPU and VPU ISA. With such instructions being included as standard in other commercially-successful GPU ISAs it is likewise critical that a 3D GPU/VPU based on svp64 also have such instructions.
+Additionally, some v3.0/1 instructions simply make no sense at all in a Vector context: `twi` and `tdi` fall into this category, as do branch operations.  Here there is simply no point trying to Vectorise them: the standard OpenPOWER v3.0/1 instructions should be called instead.
+
+Fortuitously this leaves several Major Opcodes free for use by SV to fit alternative instructions: Vector Product, Vector Normalise, [[sv/mv.swizzle]], Texture LD/ST operations, and others critical to an efficient, effective 3D GPU and VPU ISA. With such instructions being included as standard in other commercially-successful GPU ISAs it is likewise critical that a 3D GPU/VPU based on svp64 also have such instructions.
 
 Note however that svp64 is stand-alone and is in no way critically dependent on the existence or provision of 3D GPU or VPU instructions. These should be considered extensions, and their discussion and specification is out of scope for this document.
 
-Note, again: this is *only* under svp64 prefixing.  Standard v3.0B / v3.1B is *not* altered by svp64.
+Note, again: this is *only* under svp64 prefixing.  Standard v3.0B / v3.1B is *not* altered by svp64 in any way.
+
 ## Twin Predication
 
 This is a novel concept that allows predication to be applied to a single