freedreno/a6xx: Define the register fields for polygon fill mode.

[mesa.git] / src / freedreno / registers / a6xx.xml
diff --git a/src/freedreno/registers/a6xx.xml b/src/freedreno/registers/a6xx.xml

index ff723941f313c5fe4de2dc00acf7c83050c7548c..32a5c0778557ceeb2c6f783c647f8613c45d4d30 100644 (file)
--- a/src/freedreno/registers/a6xx.xml
+++ b/src/freedreno/registers/a6xx.xml
@@ -6,57 +6,6 @@ xsi:schemaLocation="http://nouveau.freedesktop.org/ rules-ng.xsd">
  <import file="adreno/adreno_common.xml"/>
  <import file="adreno/adreno_pm4.xml"/>
  
-<!-- these might be same as a5xx -->
-<enum name="a6xx_color_fmt">
-       <value value="0x02" name="RB6_A8_UNORM"/>
-       <value value="0x03" name="RB6_R8_UNORM"/>
-       <value value="0x04" name="RB6_R8_SNORM"/>
-       <value value="0x05" name="RB6_R8_UINT"/>
-       <value value="0x06" name="RB6_R8_SINT"/>
-       <value value="0x08" name="RB6_R4G4B4A4_UNORM"/>
-       <value value="0x0a" name="RB6_R5G5B5A1_UNORM"/>
-       <value value="0x0e" name="RB6_R5G6B5_UNORM"/>
-       <value value="0x0f" name="RB6_R8G8_UNORM"/>
-       <value value="0x10" name="RB6_R8G8_SNORM"/>
-       <value value="0x11" name="RB6_R8G8_UINT"/>
-       <value value="0x12" name="RB6_R8G8_SINT"/>
-       <value value="0x15" name="RB6_R16_UNORM"/>
-       <value value="0x16" name="RB6_R16_SNORM"/>
-       <value value="0x17" name="RB6_R16_FLOAT"/>
-       <value value="0x18" name="RB6_R16_UINT"/>
-       <value value="0x19" name="RB6_R16_SINT"/>
-       <value value="0x30" name="RB6_R8G8B8A8_UNORM"/>
-       <value value="0x31" name="RB6_R8G8B8X8_UNORM"/> <!-- 32 bpp format, samples 1 for alpha -->
-       <value value="0x32" name="RB6_R8G8B8A8_SNORM"/>
-       <value value="0x33" name="RB6_R8G8B8A8_UINT"/>
-       <value value="0x34" name="RB6_R8G8B8A8_SINT"/>
-       <value value="0x36" name="RB6_R10G10B10A2_FLOAT16"/>  <!-- float16 for 2d blit? -->
-       <value value="0x37" name="RB6_R10G10B10A2_UNORM"/>  <!-- GL_RGB10_A2 -->
-       <value value="0x3a" name="RB6_R10G10B10A2_UINT"/>   <!-- GL_RGB10_A2UI -->
-       <value value="0x42" name="RB6_R11G11B10_FLOAT"/>    <!-- GL_R11F_G11F_B10F -->
-       <value value="0x43" name="RB6_R16G16_UNORM"/>
-       <value value="0x44" name="RB6_R16G16_SNORM"/>
-       <value value="0x45" name="RB6_R16G16_FLOAT"/>
-       <value value="0x46" name="RB6_R16G16_UINT"/>
-       <value value="0x47" name="RB6_R16G16_SINT"/>
-       <value value="0x4a" name="RB6_R32_FLOAT"/>
-       <value value="0x4b" name="RB6_R32_UINT"/>
-       <value value="0x4c" name="RB6_R32_SINT"/>
-       <value value="0x60" name="RB6_R16G16B16A16_UNORM"/>
-       <value value="0x61" name="RB6_R16G16B16A16_SNORM"/>
-       <value value="0x62" name="RB6_R16G16B16A16_FLOAT"/>
-       <value value="0x63" name="RB6_R16G16B16A16_UINT"/>
-       <value value="0x64" name="RB6_R16G16B16A16_SINT"/>
-       <value value="0x67" name="RB6_R32G32_FLOAT"/>
-       <value value="0x68" name="RB6_R32G32_UINT"/>
-       <value value="0x69" name="RB6_R32G32_SINT"/>
-       <value value="0x82" name="RB6_R32G32B32A32_FLOAT"/>
-       <value value="0x83" name="RB6_R32G32B32A32_UINT"/>
-       <value value="0x84" name="RB6_R32G32B32A32_SINT"/>
-       <value value="0x91" name="RB6_Z24_UNORM_S8_UINT_AS_R8G8B8A8"/>
-       <value value="0xa0" name="RB6_Z24_UNORM_S8_UINT"/>
-</enum>
-
  <!-- these might be same as a5xx -->
  <enum name="a6xx_tile_mode">
         <value name="TILE6_LINEAR" value="0"/>
@@ -64,187 +13,158 @@ xsi:schemaLocation="http://nouveau.freedesktop.org/ rules-ng.xsd">
         <value name="TILE6_3" value="3"/>
  </enum>
  
-<!-- these might be same as a5xx -->
-<enum name="a6xx_vtx_fmt" prefix="chipset">
-       <value value="0x03" name="VFMT6_8_UNORM"/>
-       <value value="0x04" name="VFMT6_8_SNORM"/>
-       <value value="0x05" name="VFMT6_8_UINT"/>
-       <value value="0x06" name="VFMT6_8_SINT"/>
-
-       <value value="0x0f" name="VFMT6_8_8_UNORM"/>
-       <value value="0x10" name="VFMT6_8_8_SNORM"/>
-       <value value="0x11" name="VFMT6_8_8_UINT"/>
-       <value value="0x12" name="VFMT6_8_8_SINT"/>
-
-       <value value="0x15" name="VFMT6_16_UNORM"/>
-       <value value="0x16" name="VFMT6_16_SNORM"/>
-       <value value="0x17" name="VFMT6_16_FLOAT"/>
-       <value value="0x18" name="VFMT6_16_UINT"/>
-       <value value="0x19" name="VFMT6_16_SINT"/>
-
-       <value value="0x21" name="VFMT6_8_8_8_UNORM"/>
-       <value value="0x22" name="VFMT6_8_8_8_SNORM"/>
-       <value value="0x23" name="VFMT6_8_8_8_UINT"/>
-       <value value="0x24" name="VFMT6_8_8_8_SINT"/>
-
-       <value value="0x30" name="VFMT6_8_8_8_8_UNORM"/>
-       <value value="0x32" name="VFMT6_8_8_8_8_SNORM"/>
-       <value value="0x33" name="VFMT6_8_8_8_8_UINT"/>
-       <value value="0x34" name="VFMT6_8_8_8_8_SINT"/>
-
-       <value value="0x36" name="VFMT6_10_10_10_2_UNORM"/>
-       <value value="0x39" name="VFMT6_10_10_10_2_SNORM"/>
-       <value value="0x3a" name="VFMT6_10_10_10_2_UINT"/>
-       <value value="0x3b" name="VFMT6_10_10_10_2_SINT"/>
-
-       <value value="0x42" name="VFMT6_11_11_10_FLOAT"/>
-
-       <value value="0x43" name="VFMT6_16_16_UNORM"/>
-       <value value="0x44" name="VFMT6_16_16_SNORM"/>
-       <value value="0x45" name="VFMT6_16_16_FLOAT"/>
-       <value value="0x46" name="VFMT6_16_16_UINT"/>
-       <value value="0x47" name="VFMT6_16_16_SINT"/>
-
-       <value value="0x48" name="VFMT6_32_UNORM"/>
-       <value value="0x49" name="VFMT6_32_SNORM"/>
-       <value value="0x4a" name="VFMT6_32_FLOAT"/>
-       <value value="0x4b" name="VFMT6_32_UINT"/>
-       <value value="0x4c" name="VFMT6_32_SINT"/>
-       <value value="0x4d" name="VFMT6_32_FIXED"/>
-
-       <value value="0x58" name="VFMT6_16_16_16_UNORM"/>
-       <value value="0x59" name="VFMT6_16_16_16_SNORM"/>
-       <value value="0x5a" name="VFMT6_16_16_16_FLOAT"/>
-       <value value="0x5b" name="VFMT6_16_16_16_UINT"/>
-       <value value="0x5c" name="VFMT6_16_16_16_SINT"/>
-
-       <value value="0x60" name="VFMT6_16_16_16_16_UNORM"/>
-       <value value="0x61" name="VFMT6_16_16_16_16_SNORM"/>
-       <value value="0x62" name="VFMT6_16_16_16_16_FLOAT"/>
-       <value value="0x63" name="VFMT6_16_16_16_16_UINT"/>
-       <value value="0x64" name="VFMT6_16_16_16_16_SINT"/>
-
-       <value value="0x65" name="VFMT6_32_32_UNORM"/>
-       <value value="0x66" name="VFMT6_32_32_SNORM"/>
-       <value value="0x67" name="VFMT6_32_32_FLOAT"/>
-       <value value="0x68" name="VFMT6_32_32_UINT"/>
-       <value value="0x69" name="VFMT6_32_32_SINT"/>
-       <value value="0x6a" name="VFMT6_32_32_FIXED"/>
-
-       <value value="0x70" name="VFMT6_32_32_32_UNORM"/>
-       <value value="0x71" name="VFMT6_32_32_32_SNORM"/>
-       <value value="0x72" name="VFMT6_32_32_32_UINT"/>
-       <value value="0x73" name="VFMT6_32_32_32_SINT"/>
-       <value value="0x74" name="VFMT6_32_32_32_FLOAT"/>
-       <value value="0x75" name="VFMT6_32_32_32_FIXED"/>
-
-       <value value="0x80" name="VFMT6_32_32_32_32_UNORM"/>
-       <value value="0x81" name="VFMT6_32_32_32_32_SNORM"/>
-       <value value="0x82" name="VFMT6_32_32_32_32_FLOAT"/>
-       <value value="0x83" name="VFMT6_32_32_32_32_UINT"/>
-       <value value="0x84" name="VFMT6_32_32_32_32_SINT"/>
-       <value value="0x85" name="VFMT6_32_32_32_32_FIXED"/>
-</enum>
-
-<enum name="a6xx_tex_fmt">
-       <value value="0x02" name="TFMT6_A8_UNORM"/>
-       <value value="0x03" name="TFMT6_8_UNORM"/>
-       <value value="0x04" name="TFMT6_8_SNORM"/>
-       <value value="0x05" name="TFMT6_8_UINT"/>
-       <value value="0x06" name="TFMT6_8_SINT"/>
-       <value value="0x08" name="TFMT6_4_4_4_4_UNORM"/>
-       <value value="0x0a" name="TFMT6_5_5_5_1_UNORM"/>
-       <value value="0x0e" name="TFMT6_5_6_5_UNORM"/>
-       <value value="0x0f" name="TFMT6_8_8_UNORM"/>
-       <value value="0x10" name="TFMT6_8_8_SNORM"/>
-       <value value="0x11" name="TFMT6_8_8_UINT"/>
-       <value value="0x12" name="TFMT6_8_8_SINT"/>
-       <value value="0x13" name="TFMT6_L8_A8_UNORM"/>
-       <value value="0x15" name="TFMT6_16_UNORM"/>
-       <value value="0x16" name="TFMT6_16_SNORM"/>
-       <value value="0x17" name="TFMT6_16_FLOAT"/>
-       <value value="0x18" name="TFMT6_16_UINT"/>
-       <value value="0x19" name="TFMT6_16_SINT"/>
-       <value value="0x30" name="TFMT6_8_8_8_8_UNORM"/>
-       <value value="0x31" name="TFMT6_8_8_8_UNORM"/>
-       <value value="0x32" name="TFMT6_8_8_8_8_SNORM"/>
-       <value value="0x33" name="TFMT6_8_8_8_8_UINT"/>
-       <value value="0x34" name="TFMT6_8_8_8_8_SINT"/>
-       <value value="0x35" name="TFMT6_9_9_9_E5_FLOAT"/>
-       <value value="0x36" name="TFMT6_10_10_10_2_UNORM"/>
-       <value value="0x3a" name="TFMT6_10_10_10_2_UINT"/>
-       <value value="0x42" name="TFMT6_11_11_10_FLOAT"/>
-       <value value="0x43" name="TFMT6_16_16_UNORM"/>
-       <value value="0x44" name="TFMT6_16_16_SNORM"/>
-       <value value="0x45" name="TFMT6_16_16_FLOAT"/>
-       <value value="0x46" name="TFMT6_16_16_UINT"/>
-       <value value="0x47" name="TFMT6_16_16_SINT"/>
-       <value value="0x4a" name="TFMT6_32_FLOAT"/>
-       <value value="0x4b" name="TFMT6_32_UINT"/>
-       <value value="0x4c" name="TFMT6_32_SINT"/>
-       <value value="0x60" name="TFMT6_16_16_16_16_UNORM"/>
-       <value value="0x61" name="TFMT6_16_16_16_16_SNORM"/>
-       <value value="0x62" name="TFMT6_16_16_16_16_FLOAT"/>
-       <value value="0x63" name="TFMT6_16_16_16_16_UINT"/>
-       <value value="0x64" name="TFMT6_16_16_16_16_SINT"/>
-       <value value="0x67" name="TFMT6_32_32_FLOAT"/>
-       <value value="0x68" name="TFMT6_32_32_UINT"/>
-       <value value="0x69" name="TFMT6_32_32_SINT"/>
-       <value value="0x72" name="TFMT6_32_32_32_UINT"/>
-       <value value="0x73" name="TFMT6_32_32_32_SINT"/>
-       <value value="0x74" name="TFMT6_32_32_32_FLOAT"/>
-       <value value="0x82" name="TFMT6_32_32_32_32_FLOAT"/>
-       <value value="0x83" name="TFMT6_32_32_32_32_UINT"/>
-       <value value="0x84" name="TFMT6_32_32_32_32_SINT"/>
-       <value value="0x91" name="TFMT6_Z24_UNORM_S8_UINT"/>
-       <value value="0xa0" name="TFMT6_X8Z24_UNORM"/>
-
-       <value value="0xab" name="TFMT6_ETC2_RG11_UNORM"/>
-       <value value="0xac" name="TFMT6_ETC2_RG11_SNORM"/>
-       <value value="0xad" name="TFMT6_ETC2_R11_UNORM"/>
-       <value value="0xae" name="TFMT6_ETC2_R11_SNORM"/>
-       <value value="0xaf" name="TFMT6_ETC1"/>
-       <value value="0xb0" name="TFMT6_ETC2_RGB8"/>
-       <value value="0xb1" name="TFMT6_ETC2_RGBA8"/>
-       <value value="0xb2" name="TFMT6_ETC2_RGB8A1"/>
-       <value value="0xb3" name="TFMT6_DXT1"/>
-       <value value="0xb4" name="TFMT6_DXT3"/>
-       <value value="0xb5" name="TFMT6_DXT5"/>
-       <value value="0xb7" name="TFMT6_RGTC1_UNORM"/>
-       <value value="0xb8" name="TFMT6_RGTC1_SNORM"/>
-       <value value="0xbb" name="TFMT6_RGTC2_UNORM"/>
-       <value value="0xbc" name="TFMT6_RGTC2_SNORM"/>
-       <value value="0xbe" name="TFMT6_BPTC_UFLOAT"/>
-       <value value="0xbf" name="TFMT6_BPTC_FLOAT"/>
-       <value value="0xc0" name="TFMT6_BPTC"/>
-       <value value="0xc1" name="TFMT6_ASTC_4x4"/>
-       <value value="0xc2" name="TFMT6_ASTC_5x4"/>
-       <value value="0xc3" name="TFMT6_ASTC_5x5"/>
-       <value value="0xc4" name="TFMT6_ASTC_6x5"/>
-       <value value="0xc5" name="TFMT6_ASTC_6x6"/>
-       <value value="0xc6" name="TFMT6_ASTC_8x5"/>
-       <value value="0xc7" name="TFMT6_ASTC_8x6"/>
-       <value value="0xc8" name="TFMT6_ASTC_8x8"/>
-       <value value="0xc9" name="TFMT6_ASTC_10x5"/>
-       <value value="0xca" name="TFMT6_ASTC_10x6"/>
-       <value value="0xcb" name="TFMT6_ASTC_10x8"/>
-       <value value="0xcc" name="TFMT6_ASTC_10x10"/>
-       <value value="0xcd" name="TFMT6_ASTC_12x10"/>
-       <value value="0xce" name="TFMT6_ASTC_12x12"/>
+<enum name="a6xx_format">
+       <value value="0x02" name="FMT6_A8_UNORM"/>
+       <value value="0x03" name="FMT6_8_UNORM"/>
+       <value value="0x04" name="FMT6_8_SNORM"/>
+       <value value="0x05" name="FMT6_8_UINT"/>
+       <value value="0x06" name="FMT6_8_SINT"/>
+
+       <value value="0x08" name="FMT6_4_4_4_4_UNORM"/>
+       <value value="0x0a" name="FMT6_5_5_5_1_UNORM"/>
+       <value value="0x0c" name="FMT6_1_5_5_5_UNORM"/> <!-- read only -->
+       <value value="0x0e" name="FMT6_5_6_5_UNORM"/>
+
+       <value value="0x0f" name="FMT6_8_8_UNORM"/>
+       <value value="0x10" name="FMT6_8_8_SNORM"/>
+       <value value="0x11" name="FMT6_8_8_UINT"/>
+       <value value="0x12" name="FMT6_8_8_SINT"/>
+       <value value="0x13" name="FMT6_L8_A8_UNORM"/>
+
+       <value value="0x15" name="FMT6_16_UNORM"/>
+       <value value="0x16" name="FMT6_16_SNORM"/>
+       <value value="0x17" name="FMT6_16_FLOAT"/>
+       <value value="0x18" name="FMT6_16_UINT"/>
+       <value value="0x19" name="FMT6_16_SINT"/>
+
+       <value value="0x21" name="FMT6_8_8_8_UNORM"/>
+       <value value="0x22" name="FMT6_8_8_8_SNORM"/>
+       <value value="0x23" name="FMT6_8_8_8_UINT"/>
+       <value value="0x24" name="FMT6_8_8_8_SINT"/>
+
+       <value value="0x30" name="FMT6_8_8_8_8_UNORM"/>
+       <value value="0x31" name="FMT6_8_8_8_X8_UNORM"/> <!-- samples 1 for alpha -->
+       <value value="0x32" name="FMT6_8_8_8_8_SNORM"/>
+       <value value="0x33" name="FMT6_8_8_8_8_UINT"/>
+       <value value="0x34" name="FMT6_8_8_8_8_SINT"/>
+
+       <value value="0x35" name="FMT6_9_9_9_E5_FLOAT"/>
+
+       <value value="0x36" name="FMT6_10_10_10_2_UNORM"/>
+       <value value="0x37" name="FMT6_10_10_10_2_UNORM_DEST"/>
+       <value value="0x39" name="FMT6_10_10_10_2_SNORM"/>
+       <value value="0x3a" name="FMT6_10_10_10_2_UINT"/>
+       <value value="0x3b" name="FMT6_10_10_10_2_SINT"/>
+
+       <value value="0x42" name="FMT6_11_11_10_FLOAT"/>
+
+       <value value="0x43" name="FMT6_16_16_UNORM"/>
+       <value value="0x44" name="FMT6_16_16_SNORM"/>
+       <value value="0x45" name="FMT6_16_16_FLOAT"/>
+       <value value="0x46" name="FMT6_16_16_UINT"/>
+       <value value="0x47" name="FMT6_16_16_SINT"/>
+
+       <value value="0x48" name="FMT6_32_UNORM"/>
+       <value value="0x49" name="FMT6_32_SNORM"/>
+       <value value="0x4a" name="FMT6_32_FLOAT"/>
+       <value value="0x4b" name="FMT6_32_UINT"/>
+       <value value="0x4c" name="FMT6_32_SINT"/>
+       <value value="0x4d" name="FMT6_32_FIXED"/>
+
+       <value value="0x58" name="FMT6_16_16_16_UNORM"/>
+       <value value="0x59" name="FMT6_16_16_16_SNORM"/>
+       <value value="0x5a" name="FMT6_16_16_16_FLOAT"/>
+       <value value="0x5b" name="FMT6_16_16_16_UINT"/>
+       <value value="0x5c" name="FMT6_16_16_16_SINT"/>
+
+       <value value="0x60" name="FMT6_16_16_16_16_UNORM"/>
+       <value value="0x61" name="FMT6_16_16_16_16_SNORM"/>
+       <value value="0x62" name="FMT6_16_16_16_16_FLOAT"/>
+       <value value="0x63" name="FMT6_16_16_16_16_UINT"/>
+       <value value="0x64" name="FMT6_16_16_16_16_SINT"/>
+
+       <value value="0x65" name="FMT6_32_32_UNORM"/>
+       <value value="0x66" name="FMT6_32_32_SNORM"/>
+       <value value="0x67" name="FMT6_32_32_FLOAT"/>
+       <value value="0x68" name="FMT6_32_32_UINT"/>
+       <value value="0x69" name="FMT6_32_32_SINT"/>
+       <value value="0x6a" name="FMT6_32_32_FIXED"/>
+
+       <value value="0x70" name="FMT6_32_32_32_UNORM"/>
+       <value value="0x71" name="FMT6_32_32_32_SNORM"/>
+       <value value="0x72" name="FMT6_32_32_32_UINT"/>
+       <value value="0x73" name="FMT6_32_32_32_SINT"/>
+       <value value="0x74" name="FMT6_32_32_32_FLOAT"/>
+       <value value="0x75" name="FMT6_32_32_32_FIXED"/>
+
+       <value value="0x80" name="FMT6_32_32_32_32_UNORM"/>
+       <value value="0x81" name="FMT6_32_32_32_32_SNORM"/>
+       <value value="0x82" name="FMT6_32_32_32_32_FLOAT"/>
+       <value value="0x83" name="FMT6_32_32_32_32_UINT"/>
+       <value value="0x84" name="FMT6_32_32_32_32_SINT"/>
+       <value value="0x85" name="FMT6_32_32_32_32_FIXED"/>
+
+       <value value="0x8c" name="FMT6_G8R8B8R8_422_UNORM"/>
+       <value value="0x8d" name="FMT6_R8G8R8B8_422_UNORM"/>
+       <value value="0x8e" name="FMT6_R8_G8B8_2PLANE_420_UNORM"/>
+       <value value="0x90" name="FMT6_R8_G8_B8_3PLANE_420_UNORM"/>
+
+       <value value="0x91" name="FMT6_Z24_UNORM_S8_UINT_AS_R8G8B8A8"/>
+
+       <!-- used with the Y plane of FMT6_R8_G8B8_2PLANE_420_UNORM
+            which has different UBWC compression from regular 8_UNORM format -->
+       <value value="0x94" name="FMT6_8_PLANE_UNORM"/>
+
+       <value value="0xa0" name="FMT6_Z24_UNORM_S8_UINT"/>
+
+       <value value="0xab" name="FMT6_ETC2_RG11_UNORM"/>
+       <value value="0xac" name="FMT6_ETC2_RG11_SNORM"/>
+       <value value="0xad" name="FMT6_ETC2_R11_UNORM"/>
+       <value value="0xae" name="FMT6_ETC2_R11_SNORM"/>
+       <value value="0xaf" name="FMT6_ETC1"/>
+       <value value="0xb0" name="FMT6_ETC2_RGB8"/>
+       <value value="0xb1" name="FMT6_ETC2_RGBA8"/>
+       <value value="0xb2" name="FMT6_ETC2_RGB8A1"/>
+       <value value="0xb3" name="FMT6_DXT1"/>
+       <value value="0xb4" name="FMT6_DXT3"/>
+       <value value="0xb5" name="FMT6_DXT5"/>
+       <value value="0xb7" name="FMT6_RGTC1_UNORM"/>
+       <value value="0xb8" name="FMT6_RGTC1_SNORM"/>
+       <value value="0xbb" name="FMT6_RGTC2_UNORM"/>
+       <value value="0xbc" name="FMT6_RGTC2_SNORM"/>
+       <value value="0xbe" name="FMT6_BPTC_UFLOAT"/>
+       <value value="0xbf" name="FMT6_BPTC_FLOAT"/>
+       <value value="0xc0" name="FMT6_BPTC"/>
+       <value value="0xc1" name="FMT6_ASTC_4x4"/>
+       <value value="0xc2" name="FMT6_ASTC_5x4"/>
+       <value value="0xc3" name="FMT6_ASTC_5x5"/>
+       <value value="0xc4" name="FMT6_ASTC_6x5"/>
+       <value value="0xc5" name="FMT6_ASTC_6x6"/>
+       <value value="0xc6" name="FMT6_ASTC_8x5"/>
+       <value value="0xc7" name="FMT6_ASTC_8x6"/>
+       <value value="0xc8" name="FMT6_ASTC_8x8"/>
+       <value value="0xc9" name="FMT6_ASTC_10x5"/>
+       <value value="0xca" name="FMT6_ASTC_10x6"/>
+       <value value="0xcb" name="FMT6_ASTC_10x8"/>
+       <value value="0xcc" name="FMT6_ASTC_10x10"/>
+       <value value="0xcd" name="FMT6_ASTC_12x10"/>
+       <value value="0xce" name="FMT6_ASTC_12x12"/>
  
         <!-- same as X8Z24_UNORM but for sampling stencil (integer, 2nd channel) -->
-       <value value="0xea" name="TFMT6_S8Z24_UINT"/>
-</enum>
+       <value value="0xea" name="FMT6_S8Z24_UINT"/>
+
+       <!-- Not a hw enum, used internally in driver -->
+       <value value="0xff" name="FMT6_NONE"/>
  
-<enum name="a6xx_tex_fetchsize">
-       <value name="TFETCH6_1_BYTE"  value="0"/>
-       <value name="TFETCH6_2_BYTE"  value="1"/>
-       <value name="TFETCH6_4_BYTE"  value="2"/>
-       <value name="TFETCH6_8_BYTE"  value="3"/>
-       <value name="TFETCH6_16_BYTE" value="4"/>
  </enum>
  
  <!-- probably same as a5xx -->
+<enum name="a6xx_polygon_mode">
+       <value name="POLYMODE6_POINTS" value="1"/>
+       <value name="POLYMODE6_LINES" value="2"/>
+       <value name="POLYMODE6_TRIANGLES" value="3"/>
+</enum>
+
  <enum name="a6xx_depth_format">
         <value name="DEPTH6_NONE" value="0"/>
         <value name="DEPTH6_16" value="1"/>
@@ -969,6 +889,44 @@ to upconvert to 32b float internally?
         <value value="0x0"  name="R2D_RAW"/>
  </enum>
  
+<enum name="a6xx_ztest_mode">
+       <doc>Allow early z-test and early-lrz (if applicable)</doc>
+       <value value="0x0" name="A6XX_EARLY_Z"/>
+       <doc>Disable early z-test and early-lrz test (if applicable)</doc>
+       <value value="0x1" name="A6XX_LATE_Z"/>
+       <doc>
+               A special mode that allows early-lrz test but disables
+               early-z test.  Which might sound a bit funny, since
+               lrz-test happens before z-test.  But as long as a couple
+               conditions are maintained this allows using lrz-test in
+               cases where fragment shader has kill/discard:
+
+               1) Disable lrz-write in cases where it is uncertain during
+                  binning pass that a fragment will pass.  Ie.  if frag
+                  shader has-kill, writes-z, or alpha/stencil test is
+                  enabled.  (For correctness, lrz-write must be disabled
+                  when blend is enabled.)  This is analogous to how a
+                  z-prepass works.
+
+               2) Disable lrz-write and test if a depth-test direction
+                  reversal is detected.  Due to condition (1), the contents
+                  of the lrz buffer are a conservative estimation of the
+                  depth buffer during the draw pass.  Meaning that geometry
+                  that we know for certain will not be visible will not pass
+                  lrz-test.  But geometry which may be (or contributes to
+                  blend) will pass the lrz-test.
+
+               This allows us to keep early-lrz-test in cases where the frag
+               shader does not write-z (ie. we know the z-value before FS)
+               and does not have side-effects (image/ssbo writes, etc), but
+               does have kill/discard.  Which turns out to be a common
+               enough case that it is useful to keep early-lrz test against
+               the conservative lrz buffer to discard fragments that we
+               know will definitely not be visible.
+       </doc>
+       <value value="0x2" name="A6XX_EARLY_LRZ_LATE_Z"/>
+</enum>
+
  <domain name="A6XX" width="32">
         <bitset name="A6XX_RBBM_INT_0_MASK" inline="yes">
                 <bitfield name="RBBM_GPU_IDLE" pos="0"/>
@@ -1014,14 +972,48 @@ to upconvert to 32b float internally?
         <reg32 offset="0x0806" name="CP_RB_RPTR"/>
         <reg32 offset="0x0807" name="CP_RB_WPTR"/>
         <reg32 offset="0x0808" name="CP_SQE_CNTL"/>
+       <reg32 offset="0x0812" name="CP_CP2GMU_STATUS">
+               <bitfield name="IFPC" pos="0" type="boolean"/>
+       </reg32>
         <reg32 offset="0x0821" name="CP_HW_FAULT"/>
         <reg32 offset="0x0823" name="CP_INTERRUPT_STATUS"/>
         <reg32 offset="0x0824" name="CP_PROTECT_STATUS"/>
         <reg32 offset="0x0830" name="CP_SQE_INSTR_BASE_LO"/>
         <reg32 offset="0x0831" name="CP_SQE_INSTR_BASE_HI"/>
         <reg32 offset="0x0840" name="CP_MISC_CNTL"/>
-       <reg32 offset="0x08C1" name="CP_ROQ_THRESHOLDS_1"/>
-       <reg32 offset="0x08C2" name="CP_ROQ_THRESHOLDS_2"/>
+       <reg32 offset="0x0844" name="CP_APRIV_CNTL"/>
+       <!-- all the threshold values seem to be in units of quad-dwords: -->
+       <reg32 offset="0x08C1" name="CP_ROQ_THRESHOLDS_1">
+               <doc>
+                       b0..7 seems to contain the size of buffered by not yet processed
+                       RB level cmdstream.. it's possible that it is a low threshold
+                       and b8..15 is a high threshold?
+
+                       b16..23 identifies where IB1 data starts (and RB data ends?)
+
+                       b24..31 identifies where IB2 data starts (and IB1 data ends)
+               </doc>
+               <bitfield name="RB_LO" low="0" high="7" shr="2"/>
+               <bitfield name="RB_HI" low="8" high="15" shr="2"/>
+               <bitfield name="IB1_START" low="16" high="23" shr="2"/>
+               <bitfield name="IB2_START" low="24" high="31" shr="2"/>
+       </reg32>
+       <reg32 offset="0x08C2" name="CP_ROQ_THRESHOLDS_2">
+               <doc>
+                       low bits identify where CP_SET_DRAW_STATE stateobj
+                       processing starts (and IB2 data ends). I'm guessing
+                       b8 is part of this since (from downstream kgsl):
+
+                               /* ROQ sizes are twice as big on a640/a680 than on a630 */
+                               if (adreno_is_a640(adreno_dev) || adreno_is_a680(adreno_dev)) {
+                                       kgsl_regwrite(device, A6XX_CP_ROQ_THRESHOLDS_2, 0x02000140);
+                                       kgsl_regwrite(device, A6XX_CP_ROQ_THRESHOLDS_1, 0x8040362C);
+                               } ...
+               </doc>
+               <bitfield name="SDS_START" low="0" high="8" shr="2"/>
+               <!-- total ROQ size: -->
+               <bitfield name="ROQ_SIZE" low="16" high="31" shr="2"/>
+       </reg32>
         <reg32 offset="0x08C3" name="CP_MEM_POOL_SIZE"/>
         <reg32 offset="0x0841" name="CP_CHICKEN_DBG"/>
         <reg32 offset="0x0842" name="CP_ADDR_MODE_CNTL"/>
@@ -1078,6 +1070,26 @@ to upconvert to 32b float internally?
         <reg32 offset="0x092B" name="CP_IB2_BASE"/>
         <reg32 offset="0x092C" name="CP_IB2_BASE_HI"/>
         <reg32 offset="0x092D" name="CP_IB2_REM_SIZE"/>
+       <!-- SDS == CP_SET_DRAW_STATE: -->
+       <reg32 offset="0x092e" name="CP_SDS_BASE"/>
+       <reg32 offset="0x092f" name="CP_SDS_BASE_HI"/>
+       <reg32 offset="0x092e" name="CP_SDS_REM_SIZE"/>
+       <reg32 offset="0x0931" name="CP_BIN_SIZE_ADDRESS"/>
+       <reg32 offset="0x0932" name="CP_BIN_SIZE_ADDRESS_HI"/>
+       <reg32 offset="0x0934" name="CP_BIN_DATA_ADDR"/>
+       <reg32 offset="0x0935" name="CP_BIN_DATA_ADDR_HI"/>
+       <!--
+       There are probably similar registers for RB and SDS, teasing out SDS will
+       take a slightly better test case..
+        -->
+       <reg32 offset="0x0949" name="CP_CSQ_IB1_STAT">
+               <doc>number of remaining dwords incl current dword being consumed?</doc>
+               <bitfield name="REM" low="16" high="31"/>
+       </reg32>
+       <reg32 offset="0x094a" name="CP_CSQ_IB2_STAT">
+               <doc>number of remaining dwords incl current dword being consumed?</doc>
+               <bitfield name="REM" low="16" high="31"/>
+       </reg32>
         <reg32 offset="0x0980" name="CP_ALWAYS_ON_COUNTER_LO"/>
         <reg32 offset="0x0981" name="CP_ALWAYS_ON_COUNTER_HI"/>
         <reg32 offset="0x098D" name="CP_AHB_CNTL"/>
@@ -1111,7 +1123,9 @@ to upconvert to 32b float internally?
                 <bitfield high="1" low="1" name="CP_AHB_BUSY_CP_MASTER" />
                 <bitfield high="0" low="0" name="CP_AHB_BUSY_CX_MASTER"/>
         </reg32>
-       <reg32 offset="0x0213" name="RBBM_STATUS3"/>
+       <reg32 offset="0x0213" name="RBBM_STATUS3">
+               <bitfield pos="24" name="SMMU_STALLED_ON_FAULT" type="boolean"/>
+       </reg32>
         <reg32 offset="0x0215" name="RBBM_VBIF_GX_RESET_STATUS"/>
         <reg32 offset="0x0400" name="RBBM_PERFCTR_CP_0_LO"/>
         <reg32 offset="0x0401" name="RBBM_PERFCTR_CP_0_HI"/>
@@ -1413,6 +1427,7 @@ to upconvert to 32b float internally?
         <reg32 offset="0xF803" name="RBBM_SECVID_TSB_CNTL"/>
         <reg32 offset="0xF810" name="RBBM_SECVID_TSB_ADDR_MODE_CNTL"/>
         <reg32 offset="0x00010" name="RBBM_VBIF_CLIENT_QOS_CNTL"/>
+       <reg32 offset="0x00011" name="RBBM_GBIF_CLIENT_QOS_CNTL"/>
         <reg32 offset="0x0001f" name="RBBM_INTERFACE_HANG_INT_CNTL"/>
         <reg32 offset="0x00037" name="RBBM_INT_CLEAR_CMD"/>
         <reg32 offset="0x00038" name="RBBM_INT_0_MASK"/>
@@ -1700,6 +1715,11 @@ to upconvert to 32b float internally?
         <reg32 offset="0xAE27" name="SP_PERFCTR_SP_SEL_23"/>
         <reg32 offset="0xB601" name="TPL1_ADDR_MODE_CNTL"/>
         <reg32 offset="0xB604" name="TPL1_NC_MODE_CNTL"/>
+       <reg32 offset="0xB608" name="TPL1_BICUBIC_WEIGHTS_TABLE_0"/>
+       <reg32 offset="0xB609" name="TPL1_BICUBIC_WEIGHTS_TABLE_1"/>
+       <reg32 offset="0xB60A" name="TPL1_BICUBIC_WEIGHTS_TABLE_2"/>
+       <reg32 offset="0xB60B" name="TPL1_BICUBIC_WEIGHTS_TABLE_3"/>
+       <reg32 offset="0xB60C" name="TPL1_BICUBIC_WEIGHTS_TABLE_4"/>
         <reg32 offset="0xB610" name="TPL1_PERFCTR_TP_SEL_0"/>
         <reg32 offset="0xB611" name="TPL1_PERFCTR_TP_SEL_1"/>
         <reg32 offset="0xB612" name="TPL1_PERFCTR_TP_SEL_2"/>
@@ -1778,9 +1798,9 @@ to upconvert to 32b float internally?
                 <bitfield name="WIDTH" low="0" high="7" shr="5" type="uint"/>
                 <bitfield name="HEIGHT" low="8" high="16" shr="4" type="uint"/>
         </reg32>
-       <reg32 offset="0x0c03" name="VSC_SIZE_ADDRESS_LO"/>
-       <reg32 offset="0x0c04" name="VSC_SIZE_ADDRESS_HI"/>
-       <reg64 offset="0x0c03" name="VSC_SIZE_ADDRESS" type="waddress"/>
+       <reg32 offset="0x0c03" name="VSC_DRAW_STRM_SIZE_ADDRESS_LO"/>
+       <reg32 offset="0x0c04" name="VSC_DRAW_STRM_SIZE_ADDRESS_HI"/>
+       <reg64 offset="0x0c03" name="VSC_DRAW_STRM_SIZE_ADDRESS" type="waddress"/>
         <reg32 offset="0x0c06" name="VSC_BIN_COUNT">
                 <bitfield name="NX" low="1" high="10" type="uint"/>
                 <bitfield name="NY" low="11" high="20" type="uint"/>
@@ -1802,33 +1822,25 @@ to upconvert to 32b float internally?
                 </reg32>
         </array>
         <!--
-       compared to a5xx and earlier, we just program the address of the first
-       visibility stream and hw adds (pipe_num * VSC_PIPE_DATA_PITCH)
-
-       TODO now there seem to be two buffers of VSC data (both referenced by
-       CP_SET_BIN_DATA packet.  Not sure what this new DATA2 one is, but seems
-       to have the larger pitch.
-
-       The "DATA2" buffer is probably actually the main visibility stream; it
-       is at least the larger of the two.
-
-       For VSC_DATA_PITCH, 0x20 actually seems to be sufficient (although blob
-       uses something somewhat larger) for many cases, although required value
-       can ramp up somewhat higher.  Values less than 0x20 trigger GPU hangs
-       even with small amount of geometry (so possibly 0x20 is minimum
-       alignment or something like that).  So far I can't seem to find any-
-       thing that needs values larger than 0x20
+       HW binning primitive & draw streams, which enable draws and primitives
+       within a draw to be skipped in the main tile pass.  See:
+       https://github.com/freedreno/freedreno/wiki/Visibility-Stream-Format
+
+       Compared to a5xx and earlier, we just program the address of the first
+       stream and hw adds (pipe_num * VSC_*_STRM_PITCH)
+
+       LIMIT is set to PITCH - 64, to make room for a bit of overflow
          -->
-       <reg32 offset="0x0c30" name="VSC_PIPE_DATA2_ADDRESS_LO"/>
-       <reg32 offset="0x0c31" name="VSC_PIPE_DATA2_ADDRESS_HI"/>
-       <reg64 offset="0x0c30" name="VSC_PIPE_DATA2_ADDRESS" type="waddress"/>
-       <reg32 offset="0x0c32" name="VSC_PIPE_DATA2_PITCH"/>
-       <reg32 offset="0x0c33" name="VSC_PIPE_DATA2_ARRAY_PITCH" shr="4" type="uint"/>
-       <reg32 offset="0x0c34" name="VSC_PIPE_DATA_ADDRESS_LO"/>
-       <reg32 offset="0x0c35" name="VSC_PIPE_DATA_ADDRESS_HI"/>
-       <reg64 offset="0x0c34" name="VSC_PIPE_DATA_ADDRESS" type="waddress"/>
-       <reg32 offset="0x0c36" name="VSC_PIPE_DATA_PITCH"/>
-       <reg32 offset="0x0c37" name="VSC_PIPE_DATA_ARRAY_PITCH" shr="4" type="uint"/>
+       <reg32 offset="0x0c30" name="VSC_PRIM_STRM_ADDRESS_LO"/>
+       <reg32 offset="0x0c31" name="VSC_PRIM_STRM_ADDRESS_HI"/>
+       <reg64 offset="0x0c30" name="VSC_PRIM_STRM_ADDRESS" type="waddress"/>
+       <reg32 offset="0x0c32" name="VSC_PRIM_STRM_PITCH"/>
+       <reg32 offset="0x0c33" name="VSC_PRIM_STRM_LIMIT"/>
+       <reg32 offset="0x0c34" name="VSC_DRAW_STRM_ADDRESS_LO"/>
+       <reg32 offset="0x0c35" name="VSC_DRAW_STRM_ADDRESS_HI"/>
+       <reg64 offset="0x0c34" name="VSC_DRAW_STRM_ADDRESS" type="waddress"/>
+       <reg32 offset="0x0c36" name="VSC_DRAW_STRM_PITCH"/>
+       <reg32 offset="0x0c37" name="VSC_DRAW_STRM_LIMIT"/>
  
         <array offset="0x0c38" name="VSC_STATE" stride="1" length="32">
                 <doc>
@@ -1841,18 +1853,18 @@ to upconvert to 32b float internally?
                 <reg32 offset="0x0" name="REG"/>
         </array>
  
-       <array offset="0x0c58" name="VSC_SIZE2" stride="1" length="32">
+       <array offset="0x0c58" name="VSC_PRIM_STRM_SIZE" stride="1" length="32">
                 <doc>
-                       Has the size of data written to corresponding VSC_DATA2
+                       Has the size of data written to corresponding VSC_PRIM_STRM
                         buffer.
                 </doc>
                 <reg32 offset="0x0" name="REG"/>
         </array>
  
-       <array offset="0x0c78" name="VSC_SIZE" stride="1" length="32">
+       <array offset="0x0c78" name="VSC_DRAW_STRM_SIZE" stride="1" length="32">
                 <doc>
                         Has the size of data written to corresponding VSC pipe, ie.
-                       same thing that is written out to VSC_SIZE_ADDRESS_LO/HI
+                       same thing that is written out to VSC_DRAW_STRM_SIZE_ADDRESS_LO/HI
                 </doc>
                 <reg32 offset="0x0" name="REG"/>
         </array>
@@ -1860,7 +1872,20 @@ to upconvert to 32b float internally?
         <!-- always 0x03200000 ? -->
         <reg32 offset="0x0e12" name="UCHE_UNKNOWN_0E12"/>
  
-       <reg32 offset="0x8000" name="GRAS_UNKNOWN_8000"/>
+       <reg32 offset="0x8000" name="GRAS_CL_CNTL">
+               <bitfield name="CLIP_DISABLE" pos="0" type="boolean"/>
+               <bitfield name="ZNEAR_CLIP_DISABLE" pos="1" type="boolean"/>
+               <bitfield name="ZFAR_CLIP_DISABLE" pos="2" type="boolean"/>
+               <!-- set with depthClampEnable, not clear what it does -->
+               <bitfield name="UNK5" pos="5" type="boolean"/>
+               <!-- controls near z clip behavior (set for vulkan) -->
+               <bitfield name="ZERO_GB_SCALE_Z" pos="6" type="boolean"/>
+               <!-- guess based on a3xx and meaning of bits 8 and 9
+                    if the guess is right then this is related to point sprite clipping -->
+               <bitfield name="VP_CLIP_CODE_IGNORE" pos="7" type="boolean"/>
+               <bitfield name="VP_XFORM_DISABLE" pos="8" type="boolean"/>
+               <bitfield name="PERSP_DIVISION_DISABLE" pos="9" type="boolean"/>
+       </reg32>
         <reg32 offset="0x8001" name="GRAS_UNKNOWN_8001"/>
         <reg32 offset="0x8002" name="GRAS_UNKNOWN_8002"/>
         <reg32 offset="0x8003" name="GRAS_UNKNOWN_8003"/>
@@ -1872,10 +1897,8 @@ to upconvert to 32b float internally?
           <value value="0x3" name="LAYER_2D_ARRAY"/>
         </enum>
  
-       <reg32 offset="0x8004" name="GRAS_LAYER_CNTL">
-               <bitfield name="LAYERED" pos="0" type="boolean"/>
-               <bitfield name="TYPE" low="1" high="2" type="a6xx_layer_type"/>
-       </reg32>
+       <!-- index of highest layer that can be written to via gl_Layer -->
+       <reg32 offset="0x8004" name="GRAS_MAX_LAYER_INDEX" type="uint"/>
  
         <reg32 offset="0x8005" name="GRAS_CNTL">
                 <!-- see also RB_RENDER_CONTROL0 -->
@@ -1891,10 +1914,7 @@ to upconvert to 32b float internally?
                 <bitfield name="SIZE" pos="3" type="boolean"/>
                 <!-- b5 set ofr interpolateAt{Offset,Sample}() if in per-sample mode -->
                 <bitfield name="SIZE_PERSAMP" pos="5" type="boolean"/>
-               <bitfield name="XCOORD" pos="6" type="boolean"/>
-               <bitfield name="YCOORD" pos="7" type="boolean"/>
-               <bitfield name="ZCOORD" pos="8" type="boolean"/>
-               <bitfield name="WCOORD" pos="9" type="boolean"/>
+               <bitfield name="COORD_MASK" low="6" high="9" type="hex"/>
         </reg32>
         <reg32 offset="0x8006" name="GRAS_CL_GUARDBAND_CLIP_ADJ">
                 <bitfield name="HORZ" low="0" high="9" type="uint"/>
@@ -1907,6 +1927,10 @@ to upconvert to 32b float internally?
         <reg32 offset="0x8014" name="GRAS_CL_VPORT_ZOFFSET_0" type="float"/>
         <reg32 offset="0x8015" name="GRAS_CL_VPORT_ZSCALE_0" type="float"/>
  
+       <!-- not clear what it does, mirrors RB_Z_CLAMP_MIN -->
+       <reg32 offset="0x8070" name="GRAS_CL_Z_CLAMP_MIN" type="float"/>
+       <reg32 offset="0x8071" name="GRAS_CL_Z_CLAMP_MAX" type="float"/>
+
         <reg32 offset="0x8090" name="GRAS_SU_CNTL">
                 <bitfield name="CULL_FRONT" pos="0" type="boolean"/>
                 <bitfield name="CULL_BACK" pos="1" type="boolean"/>
@@ -1923,7 +1947,7 @@ to upconvert to 32b float internally?
         <reg32 offset="0x8092" name="GRAS_SU_POINT_SIZE" type="fixed" radix="4"/>
  
         <reg32 offset="0x8094" name="GRAS_SU_DEPTH_PLANE_CNTL">
-               <bitfield name="FRAG_WRITES_Z" pos="0" type="boolean"/>
+               <bitfield name="Z_MODE" low="0" high="1" type="a6xx_ztest_mode"/>
         </reg32>
         <reg32 offset="0x8095" name="GRAS_SU_POLY_OFFSET_SCALE" type="float"/>
         <reg32 offset="0x8096" name="GRAS_SU_POLY_OFFSET_OFFSET" type="float"/>
@@ -1955,12 +1979,25 @@ to upconvert to 32b float internally?
                 <bitfield name="MSAA_DISABLE" pos="2" type="boolean"/>
         </reg32>
  
-       <!-- always 0x0 -->
-       <reg32 offset="0x80a4" name="GRAS_UNKNOWN_80A4"/>
-       <!-- always 0x0 -->
-       <reg32 offset="0x80a5" name="GRAS_UNKNOWN_80A5"/>
-       <!-- always 0x0 -->
-       <reg32 offset="0x80a6" name="GRAS_UNKNOWN_80A6"/>
+       <bitset name="a6xx_sample_config" inline="yes">
+               <bitfield name="LOCATION_ENABLE" pos="1" type="boolean"/>
+       </bitset>
+
+       <bitset name="a6xx_sample_locations" inline="yes">
+               <bitfield name="SAMPLE_0_X" low="0" high="3" radix="4" type="fixed"/>
+               <bitfield name="SAMPLE_0_Y" low="4" high="7" radix="4" type="fixed"/>
+               <bitfield name="SAMPLE_1_X" low="8" high="11" radix="4" type="fixed"/>
+               <bitfield name="SAMPLE_1_Y" low="12" high="15" radix="4" type="fixed"/>
+               <bitfield name="SAMPLE_2_X" low="16" high="19" radix="4" type="fixed"/>
+               <bitfield name="SAMPLE_2_Y" low="20" high="23" radix="4" type="fixed"/>
+               <bitfield name="SAMPLE_3_X" low="24" high="27" radix="4" type="fixed"/>
+               <bitfield name="SAMPLE_3_Y" low="28" high="31" radix="4" type="fixed"/>
+       </bitset>
+
+       <reg32 offset="0x80a4" name="GRAS_SAMPLE_CONFIG" type="a6xx_sample_config"/>
+       <reg32 offset="0x80a5" name="GRAS_SAMPLE_LOCATION_0" type="a6xx_sample_locations"/>
+       <reg32 offset="0x80a6" name="GRAS_SAMPLE_LOCATION_1" type="a6xx_sample_locations"/>
+
         <!-- always 0x0 -->
         <reg32 offset="0x80af" name="GRAS_UNKNOWN_80AF"/>
  
@@ -1981,13 +2018,13 @@ to upconvert to 32b float internally?
                 <bitfield name="LRZ_WRITE" pos="1" type="boolean"/>
                 <doc>update MAX instead of MIN value, ie. GL_GREATER/GL_GEQUAL</doc>
                 <bitfield name="GREATER" pos="2" type="boolean"/>
-               <bitfield name="UNK3" pos="3" type="boolean"/>
+               <bitfield name="FC_ENABLE" pos="3" type="boolean"/>
                 <!-- set when depth-test + depth-write enabled -->
                 <bitfield name="Z_TEST_ENABLE" pos="4" type="boolean"/>
         </reg32>
         <reg32 offset="0x8101" name="GRAS_UNKNOWN_8101"/>
         <reg32 offset="0x8102" name="GRAS_2D_BLIT_INFO">
-               <bitfield name="COLOR_FORMAT" low="0" high="7" type="a6xx_color_fmt"/>
+               <bitfield name="COLOR_FORMAT" low="0" high="7" type="a6xx_format"/>
         </reg32>
         <reg32 offset="0x8103" name="GRAS_LRZ_BUFFER_BASE_LO"/>
         <reg32 offset="0x8104" name="GRAS_LRZ_BUFFER_BASE_HI"/>
@@ -1996,8 +2033,40 @@ to upconvert to 32b float internally?
                 <bitfield name="PITCH" low="0" high="10" shr="5" type="uint"/>
                 <bitfield name="ARRAY_PITCH" low="11" high="21" shr="5" type="uint"/> <!-- ??? -->
         </reg32>
+
+       <!--
+       The LRZ "fast clear" buffer is initialized to zero's by blob, and
+       read/written when GRAS_LRZ_CNTL.FC_ENABLE (b3) is set.  It appears
+       to store 1b/block.  It appears that '0' means block has original
+       depth clear value, and '1' means that the corresponding block in
+       LRZ has been modified.  Ignoring alignment/padding, the size is
+       given by the formula:
+
+               // calculate LRZ size from depth size:
+               if (nr_samples == 4) {
+                       width *= 2;
+                       height *= 2;
+               } else if (nr_samples == 2) {
+                       height *= 2;
+               }
+
+               lrz_width = div_round_up(width, 8);
+               lrz_heigh = div_round_up(height, 8);
+
+               // calculate # of blocks:
+               nblocksx = div_round_up(lrz_width, 16);
+               nblocksy = div_round_up(lrz_height, 4);
+
+               // fast-clear buffer is 1bit/block:
+               fc_sz = div_round_up(nblocksx * nblocksy, 8);
+
+       In practice the blob seems to switch off FC_ENABLE once the size
+       increases beyond 1 page.  Not sure if that is an actual limit or
+       not.
+        -->
         <reg32 offset="0x8106" name="GRAS_LRZ_FAST_CLEAR_BUFFER_BASE_LO"/>
         <reg32 offset="0x8107" name="GRAS_LRZ_FAST_CLEAR_BUFFER_BASE_HI"/>
+       <reg32 offset="0x8106" name="GRAS_LRZ_FAST_CLEAR_BUFFER_BASE" type="waddress"/>
  
         <reg32 offset="0x8109" name="GRAS_SAMPLE_CNTL">
                 <bitfield name="PER_SAMP_MODE" pos="0" type="boolean"/>
@@ -2017,7 +2086,7 @@ to upconvert to 32b float internally?
         <bitset name="a6xx_2d_blit_cntl" inline="yes">
                 <bitfield name="ROTATE" low="0" high="2" type="a6xx_rotation"/>
                 <bitfield name="SOLID_COLOR" pos="7" type="boolean"/>
-               <bitfield name="COLOR_FORMAT" low="8" high="15" type="a6xx_color_fmt"/>
+               <bitfield name="COLOR_FORMAT" low="8" high="15" type="a6xx_format"/>
                 <bitfield name="SCISSOR" pos="16" type="boolean"/>
  
                 <bitfield name="UNK" low="17" high="18" type="uint"/>
@@ -2079,12 +2148,9 @@ to upconvert to 32b float internally?
                 <bitfield name="MSAA_DISABLE" pos="2" type="boolean"/>
         </reg32>
  
-       <!-- always 0x0 ? -->
-       <reg32 offset="0x8804" name="RB_UNKNOWN_8804"/>
-       <!-- always 0x0 ? -->
-       <reg32 offset="0x8805" name="RB_UNKNOWN_8805"/>
-       <!-- always 0x0 ? -->
-       <reg32 offset="0x8806" name="RB_UNKNOWN_8806"/>
+       <reg32 offset="0x8804" name="RB_SAMPLE_CONFIG" type="a6xx_sample_config"/>
+       <reg32 offset="0x8805" name="RB_SAMPLE_LOCATION_0" type="a6xx_sample_locations"/>
+       <reg32 offset="0x8806" name="RB_SAMPLE_LOCATION_1" type="a6xx_sample_locations"/>
  
         <!--
         note: maybe not actually called RB_RENDER_CONTROLn (since RB_RENDER_CNTL
@@ -2104,10 +2170,7 @@ to upconvert to 32b float internally?
                 <bitfield name="SIZE" pos="3" type="boolean"/>
                 <!-- b5 set ofr interpolateAt{Offset,Sample}() if in per-sample mode -->
                 <bitfield name="SIZE_PERSAMP" pos="5" type="boolean"/>
-               <bitfield name="XCOORD" pos="6" type="boolean"/>
-               <bitfield name="YCOORD" pos="7" type="boolean"/>
-               <bitfield name="ZCOORD" pos="8" type="boolean"/>
-               <bitfield name="WCOORD" pos="9" type="boolean"/>
+               <bitfield name="COORD_MASK" low="6" high="9" type="hex"/>
                 <bitfield name="UNK10" pos="10" type="boolean"/>
         </reg32>
         <reg32 offset="0x880a" name="RB_RENDER_CONTROL1">
@@ -2122,6 +2185,7 @@ to upconvert to 32b float internally?
         </reg32>
  
         <reg32 offset="0x880b" name="RB_FS_OUTPUT_CNTL0">
+               <bitfield name="DUAL_COLOR_IN_ENABLE" pos="0" type="boolean"/>
                 <bitfield name="FRAG_WRITES_Z" pos="1" type="boolean"/>
                 <bitfield name="FRAG_WRITES_SAMPMASK" pos="2" type="boolean"/>
         </reg32>
@@ -2191,7 +2255,7 @@ to upconvert to 32b float internally?
                         <bitfield name="ALPHA_DEST_FACTOR" low="24" high="28" type="adreno_rb_blend_factor"/>
                 </reg32>
                 <reg32 offset="0x2" name="BUF_INFO">
-                       <bitfield name="COLOR_FORMAT" low="0" high="7" type="a6xx_color_fmt"/>
+                       <bitfield name="COLOR_FORMAT" low="0" high="7" type="a6xx_format"/>
                         <bitfield name="COLOR_TILE_MODE" low="8" high="9" type="a6xx_tile_mode"/>
                         <bitfield name="COLOR_SWAP" low="13" high="14" type="a3xx_color_swap"/>
                 </reg32>
@@ -2228,19 +2292,26 @@ to upconvert to 32b float internally?
                 <!-- per-mrt enable bit -->
                 <bitfield name="ENABLE_BLEND" low="0" high="7"/>
                 <bitfield name="INDEPENDENT_BLEND" pos="8" type="boolean"/>
+               <bitfield name="DUAL_COLOR_IN_ENABLE" pos="9" type="boolean"/>
                 <bitfield name="ALPHA_TO_COVERAGE" pos="10" type="boolean"/>
+               <bitfield name="ALPHA_TO_ONE" pos="11" type="boolean"/>
                 <bitfield name="SAMPLE_MASK" low="16" high="31"/>
         </reg32>
         <reg32 offset="0x8870" name="RB_DEPTH_PLANE_CNTL">
-               <bitfield name="FRAG_WRITES_Z" pos="0" type="boolean"/>
+               <bitfield name="Z_MODE" low="0" high="1" type="a6xx_ztest_mode"/>
         </reg32>
  
         <reg32 offset="0x8871" name="RB_DEPTH_CNTL">
                 <bitfield name="Z_ENABLE" pos="0" type="boolean"/>
                 <bitfield name="Z_WRITE_ENABLE" pos="1" type="boolean"/>
                 <bitfield name="ZFUNC" low="2" high="4" type="adreno_compare_func"/>
-               <doc>Z_TEST_ENABLE bit is set for zfunc other than GL_ALWAYS or GL_NEVER</doc>
+               <bitfield name="Z_CLAMP_ENABLE" pos="5" type="boolean"/>
+               <doc>
+               Z_TEST_ENABLE bit is set for zfunc other than GL_ALWAYS or GL_NEVER
+               also set when Z_BOUNDS_ENABLE is set
+               </doc>
                 <bitfield name="Z_TEST_ENABLE" pos="6" type="boolean"/>
+               <bitfield name="Z_BOUNDS_ENABLE" pos="7" type="boolean"/>
         </reg32>
         <!-- duplicates GRAS_SU_DEPTH_BUFFER_INFO: -->
         <reg32 offset="0x8872" name="RB_DEPTH_BUFFER_INFO">
@@ -2258,10 +2329,8 @@ to upconvert to 32b float internally?
         <reg64 offset="0x8875" name="RB_DEPTH_BUFFER_BASE" type="waddress"/>
         <reg32 offset="0x8877" name="RB_DEPTH_BUFFER_BASE_GMEM"/>
  
-       <!-- always 0x0 ? -->
-       <reg32 offset="0x8878" name="RB_UNKNOWN_8878"/>
-       <!-- always 0x0 ? -->
-       <reg32 offset="0x8879" name="RB_UNKNOWN_8879"/>
+       <reg32 offset="0x8878" name="RB_Z_BOUNDS_MIN" type="float"/>
+       <reg32 offset="0x8879" name="RB_Z_BOUNDS_MAX" type="float"/>
  
         <reg32 offset="0x8880" name="RB_STENCIL_CONTROL">
                 <bitfield name="STENCIL_ENABLE" pos="0" type="boolean"/>
@@ -2316,6 +2385,10 @@ to upconvert to 32b float internally?
                 <bitfield name="ENABLE" pos="0" type="boolean"/>
         </reg32>
  
+       <!-- clamps depth value for depth test/write -->
+       <reg32 offset="0x88c0" name="RB_Z_CLAMP_MIN" type="float"/>
+       <reg32 offset="0x88c1" name="RB_Z_CLAMP_MAX" type="float"/>
+
         <reg32 offset="0x88d0" name="RB_UNKNOWN_88D0"/>
         <reg32 offset="0x88d1" name="RB_BLIT_SCISSOR_TL" type="adreno_reg_xy"/>
         <reg32 offset="0x88d2" name="RB_BLIT_SCISSOR_BR" type="adreno_reg_xy"/>
@@ -2329,7 +2402,7 @@ to upconvert to 32b float internally?
                 <bitfield name="TILE_MODE" low="0" high="1" type="a6xx_tile_mode"/>
                 <bitfield name="FLAGS" pos="2" type="boolean"/>
                 <bitfield name="SAMPLES" low="3" high="4" type="a3xx_msaa_samples"/>
-               <bitfield name="COLOR_FORMAT" low="7" high="14" type="a6xx_color_fmt"/>
+               <bitfield name="COLOR_FORMAT" low="7" high="14" type="a6xx_format"/>
                 <bitfield name="COLOR_SWAP" low="5" high="6" type="a3xx_color_swap"/>
         </reg32>
         <reg64 offset="0x88d8" name="RB_BLIT_DST" type="waddress"/>
@@ -2394,27 +2467,30 @@ to upconvert to 32b float internally?
         <reg32 offset="0x8c01" name="RB_UNKNOWN_8C01"/>
  
         <bitset name="a6xx_2d_surf_info" inline="yes">
-               <bitfield name="COLOR_FORMAT" low="0" high="7" type="a6xx_color_fmt"/>
+               <bitfield name="COLOR_FORMAT" low="0" high="7" type="a6xx_format"/>
                 <bitfield name="TILE_MODE" low="8" high="9" type="a6xx_tile_mode"/>
                 <bitfield name="COLOR_SWAP" low="10" high="11" type="a3xx_color_swap"/>
-               <!-- b12 seems to be set when UBWC "FLAGS" buffer enabled -->
                 <bitfield name="FLAGS" pos="12" type="boolean"/>
                 <bitfield name="SRGB" pos="13" type="boolean"/>
                 <!-- the rest is only for src -->
                 <bitfield name="SAMPLES" low="14" high="15" type="a3xx_msaa_samples"/>
                 <bitfield name="FILTER" pos="16" type="boolean"/>
                 <bitfield name="SAMPLES_AVERAGE" pos="18" type="boolean"/>
+               <bitfield name="UNK20" pos="20" type="boolean"/>
+               <bitfield name="UNK22" pos="22" type="boolean"/>
         </bitset>
  
         <reg32 offset="0x8c17" name="RB_2D_DST_INFO" type="a6xx_2d_surf_info"/>
         <reg32 offset="0x8c18" name="RB_2D_DST_LO"/>
         <reg32 offset="0x8c19" name="RB_2D_DST_HI"/>
+       <reg64 offset="0x8c18" name="RB_2D_DST" type="waddress"/>
         <reg32 offset="0x8c1a" name="RB_2D_DST_SIZE">
                 <bitfield name="PITCH" low="0" high="15" shr="6" type="uint"/>
         </reg32>
  
         <reg32 offset="0x8c20" name="RB_2D_DST_FLAGS_LO"/>
         <reg32 offset="0x8c21" name="RB_2D_DST_FLAGS_HI"/>
+       <reg64 offset="0x8c20" name="RB_2D_DST_FLAGS" type="waddress"/>
         <reg32 offset="0x8c22" name="RB_2D_DST_FLAGS_PITCH">
                 <bitfield name="PITCH" low="0" high="10" shr="6" type="uint"/>
                 <bitfield name="ARRAY_PITCH" low="11" high="21" shr="7" type="uint"/>
@@ -2431,7 +2507,19 @@ to upconvert to 32b float internally?
  
         <reg32 offset="0x8e04" name="RB_UNKNOWN_8E04"/>
  
-       <reg32 offset="0x8e07" name="RB_CCU_CNTL"/>  <!-- always 7c400004 or 10000000 -->
+       <reg32 offset="0x8e07" name="RB_CCU_CNTL">
+               <!-- offset into GMEM for something.
+                       important for sysmem path
+                       BLIT_OP_SCALE also writes to GMEM at this offset for GMEM store
+                       blob values for GMEM path (note: close to GMEM size):
+                       a618: 0x7c000 a630/a640: 0xf8000 a650: 0x114000
+                       SYSMEM path values:
+                       a618: 0x10000 a630/a640: 0x20000 a650: 0x30000
+               -->
+               <bitfield name="OFFSET" low="23" high="31" shr="12" type="hex"/>
+               <bitfield name="GMEM" pos="22" type="boolean"/> <!-- set for GMEM path -->
+               <bitfield name="UNK2" pos="2" type="boolean"/> <!-- sometimes set with GMEM? -->
+       </reg32>
  
         <reg32 offset="0x9100" name="VPC_UNKNOWN_9100"/>
  
@@ -2448,7 +2536,9 @@ to upconvert to 32b float internally?
  
         <reg32 offset="0x9106" name="VPC_UNKNOWN_9106"/>
         <reg32 offset="0x9107" name="VPC_UNKNOWN_9107"/>
-       <reg32 offset="0x9108" name="VPC_UNKNOWN_9108"/>
+       <reg32 offset="0x9108" name="VPC_POLYGON_MODE">
+               <bitfield name="MODE" low="0" high="1" type="a6xx_polygon_mode"/>
+       </reg32>
  
         <array offset="0x9200" name="VPC_VARYING_INTERP" stride="1" length="8">
                 <reg32 offset="0x0" name="MODE"/>
@@ -2483,11 +2573,13 @@ to upconvert to 32b float internally?
         <reg32 offset="0x9219" name="VPC_SO_STREAM_COUNTS_HI"/>
  
         <array offset="0x921a" name="VPC_SO" stride="7" length="4">
+               <reg64 offset="0" name="BUFFER_BASE" type="waddress"/>
                 <reg32 offset="0" name="BUFFER_BASE_LO"/>
                 <reg32 offset="1" name="BUFFER_BASE_HI"/>
                 <reg32 offset="2" name="BUFFER_SIZE"/>
                 <reg32 offset="3" name="NCOMP"/>  <!-- component count -->
                 <reg32 offset="4" name="BUFFER_OFFSET"/>
+               <reg64 offset="5" name="FLUSH_BASE" type="waddress"/>
                 <reg32 offset="5" name="FLUSH_BASE_LO"/>
                 <reg32 offset="6" name="FLUSH_BASE_HI"/>
         </array>
@@ -2548,7 +2640,10 @@ to upconvert to 32b float internally?
  
         <reg32 offset="0x9304" name="VPC_CNTL_0">
                 <bitfield name="NUMNONPOSVAR" low="0" high="7" type="uint"/>
+               <!-- for fixed-function (i.e. no GS) gl_PrimitiveID in FS -->
+               <bitfield name="PRIMIDLOC" low="8" high="15" type="uint"/>
                 <bitfield name="VARYING" pos="16" type="boolean"/>
+               <bitfield name="UNKLOC" low="24" high="31" type="uint"/>
         </reg32>
  
         <reg32 offset="0x9305" name="VPC_SO_BUF_CNTL">
@@ -2596,10 +2691,17 @@ to upconvert to 32b float internally?
  
         <!-- always 0x1 ? -->
         <reg32 offset="0x9805" name="PC_UNKNOWN_9805"/>
-       <reg32 offset="0x9806" name="PC_UNKNOWN_9806"/>
+
+       <!-- probably a mirror of VFD_CONTROL_6 -->
+       <reg32 offset="0x9806" name="PC_PRIMID_CNTL">
+               <bitfield name="PRIMID_PASSTHRU" pos="0" type="boolean"/>
+       </reg32>
  
         <reg32 offset="0x9980" name="PC_UNKNOWN_9980"/>
-       <reg32 offset="0x9981" name="PC_UNKNOWN_9981"/>
+
+       <reg32 offset="0x9981" name="PC_POLYGON_MODE">
+               <bitfield name="MODE" low="0" high="1" type="a6xx_polygon_mode"/>
+       </reg32>
  
         <reg32 offset="0x9990" name="PC_UNKNOWN_9990"/>
  
@@ -2607,6 +2709,7 @@ to upconvert to 32b float internally?
                 <bitfield name="PRIMITIVE_RESTART" pos="0" type="boolean"/>
                 <!-- maybe?  b1 seems always set, so just assume it is for now: -->
                 <bitfield name="PROVOKING_VTX_LAST" pos="1" type="boolean"/>
+               <bitfield name="TESS_UPPER_LEFT_DOMAIN_ORIGIN" pos="2" type="boolean"/>
         </reg32>
         <reg32 offset="0x9b01" name="PC_PRIMITIVE_CNTL_1">
                 <doc>
@@ -2616,7 +2719,7 @@ to upconvert to 32b float internally?
                         plus # of transform-feedback (streamout) varyings if using the
                         hw streamout (rather than stg instructions in shader)
                 </doc>
-               <bitfield name="STRIDE_IN_VPC" low="0" high="6" type="uint"/>
+               <bitfield name="STRIDE_IN_VPC" low="0" high="7" type="uint"/>
                 <bitfield name="PSIZE" pos="8" type="boolean"/>
         </reg32>
  
@@ -2624,7 +2727,7 @@ to upconvert to 32b float internally?
                 <doc>
                   geometry shader
                 </doc>
-               <bitfield name="STRIDE_IN_VPC" low="0" high="6" type="uint"/>
+               <bitfield name="STRIDE_IN_VPC" low="0" high="7" type="uint"/>
                 <bitfield name="PSIZE" pos="8" type="boolean"/>
                 <bitfield name="LAYER" pos="9" type="boolean"/>
                 <bitfield name="PRIMITIVE_ID" pos="11" type="boolean"/>
@@ -2638,7 +2741,7 @@ to upconvert to 32b float internally?
                         plus # of transform-feedback (streamout) varyings if using the
                         hw streamout (rather than stg instructions in shader)
                 </doc>
-               <bitfield name="STRIDE_IN_VPC" low="0" high="6" type="uint"/>
+               <bitfield name="STRIDE_IN_VPC" low="0" high="7" type="uint"/>
                 <bitfield name="PSIZE" pos="8" type="boolean"/>
         </reg32>
         <reg32 offset="0x9b04" name="PC_PRIMITIVE_CNTL_4">
@@ -2648,7 +2751,7 @@ to upconvert to 32b float internally?
                         plus # of transform-feedback (streamout) varyings if using the
                         hw streamout (rather than stg instructions in shader)
                 </doc>
-               <bitfield name="STRIDE_IN_VPC" low="0" high="6" type="uint"/>
+               <bitfield name="STRIDE_IN_VPC" low="0" high="7" type="uint"/>
                 <bitfield name="PSIZE" pos="8" type="boolean"/>
         </reg32>
  
@@ -2673,11 +2776,22 @@ to upconvert to 32b float internally?
         <reg32 offset="0x9e08" name="PC_TESSFACTOR_ADDR_LO"/>
         <reg32 offset="0x9e09" name="PC_TESSFACTOR_ADDR_HI"/>
  
+       <!-- These match the contents of CP_SET_BIN_DATA (not written directly) -->
+       <reg32 offset="0x9e11" name="PC_VSTREAM_CONTROL">
+               <bitfield name="VSC_SIZE" low="16" high="21" type="uint"/>
+               <bitfield name="VSC_N" low="22" high="26" type="uint"/>
+       </reg32>
+       <reg32 offset="0x9e12" name="PC_BIN_DATA_ADDR2_LO"/>
+       <reg32 offset="0x9e13" name="PC_BIN_DATA_ADDR2_HI"/>
+       <reg32 offset="0x9e14" name="PC_BIN_DATA_ADDR_LO"/>
+       <reg32 offset="0x9e15" name="PC_BIN_DATA_ADDR_HI"/>
+
         <!-- always 0x0 -->
         <reg32 offset="0x9e72" name="PC_UNKNOWN_9E72"/>
  
         <reg32 offset="0xa000" name="VFD_CONTROL_0">
-               <bitfield name="VTXCNT" low="0" high="5" type="uint"/>
+               <bitfield name="FETCH_CNT" low="0" high="5" type="uint"/>
+               <bitfield name="DECODE_CNT" low="8" high="13" type="uint"/>
         </reg32>
         <reg32 offset="0xa001" name="VFD_CONTROL_1">
                 <bitfield name="REGID4VTX" low="0" high="7" type="a3xx_regid"/>
@@ -2699,6 +2813,12 @@ to upconvert to 32b float internally?
                 <bitfield name="REGID_GSHEADER" low="0" high="7" type="a3xx_regid"/>
         </reg32>
         <reg32 offset="0xa006" name="VFD_CONTROL_6">
+               <!--
+                       True if gl_PrimitiveID is read via the FS and there is
+                       no matching write from the GS, and therefore it needs to
+                       be passed through via fixed-function logic.
+               -->
+               <bitfield name="PRIMID_PASSTHRU" pos="0" type="boolean"/>
         </reg32>
  
         <reg32 offset="0xa007" name="VFD_MODE_CNTL">
@@ -2707,11 +2827,17 @@ to upconvert to 32b float internally?
  
         <!-- always 0x0 ? -->
         <reg32 offset="0xa008" name="VFD_UNKNOWN_A008"/>
-       <reg32 offset="0xa009" name="VFD_UNKNOWN_A009"/>
+       <reg32 offset="0xa009" name="VFD_ADD_OFFSET">
+               <!-- add VFD_INDEX_OFFSET to REGID4VTX -->
+               <bitfield name="VERTEX" pos="0" type="boolean"/>
+               <!-- add VFD_INSTANCE_START_OFFSET to REGID4INST -->
+               <bitfield name="INSTANCE" pos="1" type="boolean"/>
+       </reg32>
  
         <reg32 offset="0xa00e" name="VFD_INDEX_OFFSET"/>
         <reg32 offset="0xa00f" name="VFD_INSTANCE_START_OFFSET"/>
         <array offset="0xa010" name="VFD_FETCH" stride="4" length="32">
+               <reg64 offset="0x0" name="BASE" type="address"/>
                 <reg32 offset="0x0" name="BASE_LO"/>
                 <reg32 offset="0x1" name="BASE_HI"/>
                 <reg32 offset="0x2" name="SIZE" type="uint"/>
@@ -2719,10 +2845,11 @@ to upconvert to 32b float internally?
         </array>
         <array offset="0xa090" name="VFD_DECODE" stride="2" length="32">
                 <reg32 offset="0x0" name="INSTR">
-                       <!-- IDX appears to index into VFD_FETCH[] -->
+                       <!-- IDX and byte OFFSET into VFD_FETCH -->
                         <bitfield name="IDX" low="0" high="4" type="uint"/>
+                       <bitfield name="OFFSET" low="5" high="16"/>
                         <bitfield name="INSTANCED" pos="17" type="boolean"/>
-                       <bitfield name="FORMAT" low="20" high="27" type="a6xx_vtx_fmt"/>
+                       <bitfield name="FORMAT" low="20" high="27" type="a6xx_format"/>
                         <bitfield name="SWAP" low="28" high="29" type="a3xx_color_swap"/>
                         <bitfield name="UNK30" pos="30" type="boolean"/>
                         <bitfield name="FLOAT" pos="31" type="boolean"/>
@@ -2767,6 +2894,15 @@ to upconvert to 32b float internally?
         </bitset>
  
         <bitset name="a6xx_sp_xs_config" inline="yes">
+               <!--
+               Each of these are set if the given resource type is used
+               with the Vulkan/bindless binding model.
+               -->
+               <bitfield name="BINDLESS_TEX" pos="0" type="boolean"/>
+               <bitfield name="BINDLESS_SAMP" pos="1" type="boolean"/>
+               <bitfield name="BINDLESS_IBO" pos="2" type="boolean"/>
+               <bitfield name="BINDLESS_UBO" pos="3" type="boolean"/>
+
                 <bitfield name="ENABLED" pos="8" type="boolean"/>
                 <!--
                 number of textures and samplers.. these might be swapped, with GL I
@@ -2778,9 +2914,15 @@ to upconvert to 32b float internally?
         </bitset>
  
         <reg32 offset="0xa800" name="SP_VS_CTRL_REG0" type="a6xx_sp_xs_ctrl_reg0"/>
+       <reg32 offset="0xa801" name="SP_VS_BRANCH_COND" type="hex">
+               <!--
+               bitmask of true/false conditions for VS brac.N instructions,
+               bit N corresponds to brac.N
+                -->
+       </reg32>
         <reg32 offset="0xa802" name="SP_PRIMITIVE_CNTL">
                 <!-- # of VS outputs including pos/psize -->
-               <bitfield name="VSOUT" low="0" high="4" type="uint"/>
+               <bitfield name="VSOUT" low="0" high="5" type="uint"/>
         </reg32>
         <array offset="0xa803" name="SP_VS_OUT" stride="1" length="16">
                 <reg32 offset="0x0" name="REG">
@@ -2852,11 +2994,19 @@ to upconvert to 32b float internally?
         <reg32 offset="0xa864" name="SP_DS_INSTRLEN" type="uint"/>
  
         <reg32 offset="0xa870" name="SP_GS_CTRL_REG0" type="a6xx_sp_xs_ctrl_reg0"/>
-       <reg32 offset="0xa871" name="SP_GS_UNKNOWN_A871"/>
+       <reg32 offset="0xa871" name="SP_GS_PRIM_SIZE">
+               <!-- size of output of previous stage -->
+       </reg32>
+       <reg32 offset="0xa872" name="SP_GS_BRANCH_COND" type="hex">
+               <!--
+               bitmask of true/false conditions for FS brac.N instructions,
+               bit N corresponds to brac.N
+                -->
+       </reg32>
  
         <reg32 offset="0xa873" name="SP_PRIMITIVE_CNTL_GS">
                 <!-- # of VS outputs including pos/psize -->
-               <bitfield name="GSOUT" low="0" high="4" type="uint"/>
+               <bitfield name="GSOUT" low="0" high="5" type="uint"/>
                 <bitfield name="FLAGS_REGID" low="6" high="13" type="a3xx_regid"/>
         </reg32>
  
@@ -2902,13 +3052,11 @@ to upconvert to 32b float internally?
         <reg32 offset="0xa8af" name="SP_GS_TEX_CONST_HI"/>
  
         <reg32 offset="0xa980" name="SP_FS_CTRL_REG0" type="a6xx_sp_xs_ctrl_reg0"/>
-       <reg32 offset="0xa981" name="SP_UNKNOWN_A981">
-               <bitfield name="FACE0" pos="0" type="boolean"/>
-               <bitfield name="FACE1" pos="1" type="boolean"/>
-               <bitfield name="FACE2" pos="2" type="boolean"/>
-               <bitfield name="FACE3" pos="3" type="boolean"/>
-               <bitfield name="FACE4" pos="4" type="boolean"/>
-               <bitfield name="FACE5" pos="5" type="boolean"/>
+       <reg32 offset="0xa981" name="SP_FS_BRANCH_COND" type="hex">
+               <!--
+               bitmask of true/false conditions for FS brac.N instructions,
+               bit N corresponds to brac.N
+                -->
         </reg32>
         <reg32 offset="0xa982" name="SP_UNKNOWN_A982"/>
         <reg32 offset="0xa983" name="SP_FS_OBJ_START_LO"/>
@@ -2917,6 +3065,7 @@ to upconvert to 32b float internally?
         <reg32 offset="0xa989" name="SP_BLEND_CNTL">
                 <bitfield name="ENABLED" pos="0" type="boolean"/>
                 <bitfield name="UNK8" pos="8" type="boolean"/>
+               <bitfield name="DUAL_COLOR_IN_ENABLE" pos="9" type="boolean"/>
                 <bitfield name="ALPHA_TO_COVERAGE" pos="10" type="boolean"/>
         </reg32>
         <reg32 offset="0xa98a" name="SP_SRGB_CNTL">
@@ -2941,6 +3090,7 @@ to upconvert to 32b float internally?
                 <bitfield name="RT7" low="28" high="31"/>
         </reg32>
         <reg32 offset="0xa98c" name="SP_FS_OUTPUT_CNTL0">
+               <bitfield name="DUAL_COLOR_IN_ENABLE" pos="0" type="boolean"/>
                 <bitfield name="DEPTH_REGID" low="8" high="15" type="a3xx_regid"/>
                 <bitfield name="SAMPMASK_REGID" low="16" high="23" type="a3xx_regid"/>
         </reg32>
@@ -2950,7 +3100,7 @@ to upconvert to 32b float internally?
  
         <array offset="0xa996" name="SP_FS_MRT" stride="1" length="8">
                 <reg32 offset="0" name="REG">
-                       <bitfield name="COLOR_FORMAT" low="0" high="7" type="a6xx_color_fmt"/>
+                       <bitfield name="COLOR_FORMAT" low="0" high="7" type="a6xx_format"/>
                         <bitfield name="COLOR_SINT" pos="8" type="boolean"/>
                         <bitfield name="COLOR_UINT" pos="9" type="boolean"/>
                 </reg32>
@@ -2974,11 +3124,22 @@ to upconvert to 32b float internally?
                         <!--
                         CMD seems always 0x4??  3d, textureProj, textureLod seem to
                         skip pre-fetch.. TODO test texelFetch
+                        CMD is 0x6 when the Vulkan mode is enabled, and
+                        TEX_ID/SAMP_ID refer to the descriptor sets while the
+                        indices come from SP_FS_BINDLESS_PREFETCH[n]
                          -->
                         <bitfield name="CMD" low="27" high="31"/>
                 </reg32>
         </array>
  
+       <!-- TODO confirm that this is actually an array -->
+       <array offset="0xa9a3" name="SP_FS_BINDLESS_PREFETCH" stride="1" length="4">
+               <reg32 offset="0" name="CMD">
+                       <bitfield name="SAMP_ID" low="0" high="7" type="uint"/>
+                       <bitfield name="TEX_ID" low="16" high="23" type="uint"/>
+               </reg32>
+       </array>
+
         <reg32 offset="0xa9a7" name="SP_FS_TEX_COUNT" type="uint"/>
  
         <!-- always 0x0 ? -->
@@ -3001,6 +3162,10 @@ to upconvert to 32b float internally?
         <reg32 offset="0xa9e6" name="SP_CS_TEX_CONST_LO"/>
         <reg32 offset="0xa9e7" name="SP_CS_TEX_CONST_HI"/>
  
+       <array offset="0xa9e8" name="SP_CS_BINDLESS_BASE" stride="2" length="5">
+               <reg64 offset="0" name="ADDR" type="waddress"/>
+       </array>
+
         <array offset="0xa98e" name="SP_FS_OUTPUT" stride="1" length="8">
                 <doc>per MRT</doc>
                 <reg32 offset="0x0" name="REG">
@@ -3028,6 +3193,10 @@ to upconvert to 32b float internally?
         <reg32 offset="0xab04" name="SP_FS_CONFIG" type="a6xx_sp_xs_config"/>
         <reg32 offset="0xab05" name="SP_FS_INSTRLEN" type="uint"/>
  
+       <array offset="0xab10" name="SP_BINDLESS_BASE" stride="2" length="5">
+               <reg64 offset="0" name="ADDR" type="waddress"/>
+       </array>
+
         <!--
         Combined IBO state for 3d pipe, used for Image and SSBO write/atomic
         instructions VS/HS/DS/GS/FS.  See SP_CS_IBO_* for compute shaders.
@@ -3045,7 +3214,7 @@ to upconvert to 32b float internally?
                 <bitfield name="UINT" pos="2" type="boolean"/>
                 <!-- looks like HW only cares about the base type of this format,
                      which matches the ifmt? -->
-               <bitfield name="COLOR_FORMAT" low="3" high="10" type="a6xx_color_fmt"/>
+               <bitfield name="COLOR_FORMAT" low="3" high="10" type="a6xx_format"/>
                 <!-- set when ifmt is R2D_UNORM8_SRGB -->
                 <bitfield name="SRGB" pos="11" type="boolean"/>
                 <!-- some sort of channel mask, not sure what it is for -->
@@ -3061,6 +3230,12 @@ to upconvert to 32b float internally?
         <!-- always 0x3f ? -->
         <reg32 offset="0xae0f" name="SP_UNKNOWN_AE0F"/>
  
+       <!--
+       The downstream kernel calls the debug cluster of registers
+       "a6xx_sp_ps_tp_cluster" but this actually specifies the border
+       color base for compute shaders.
+       -->
+       <reg64 offset="0xb180" name="SP_PS_TP_BORDER_COLOR_BASE_ADDR" type="address"/>
         <!-- always 0x0 ? -->
         <reg32 offset="0xb182" name="SP_UNKNOWN_B182"/>
         <reg32 offset="0xb183" name="SP_UNKNOWN_B183"/>
@@ -3076,10 +3251,12 @@ to upconvert to 32b float internally?
         </reg32>
  
         <!-- looks to work in the same way as a5xx: -->
+       <reg64 offset="0xb302" name="SP_TP_BORDER_COLOR_BASE_ADDR" type="address"/>
         <reg32 offset="0xb302" name="SP_TP_BORDER_COLOR_BASE_ADDR_LO"/>
         <reg32 offset="0xb303" name="SP_TP_BORDER_COLOR_BASE_ADDR_HI"/>
-       <!-- always 0x0 ? -->
-       <reg32 offset="0xb304" name="SP_TP_UNKNOWN_B304"/>
+       <reg32 offset="0xb304" name="SP_TP_SAMPLE_CONFIG" type="a6xx_sample_config"/>
+       <reg32 offset="0xb305" name="SP_TP_SAMPLE_LOCATION_0" type="a6xx_sample_locations"/>
+       <reg32 offset="0xb306" name="SP_TP_SAMPLE_LOCATION_1" type="a6xx_sample_locations"/>
  
         <reg32 offset="0xb309" name="SP_TP_UNKNOWN_B309"/>
  
@@ -3095,12 +3272,14 @@ to upconvert to 32b float internally?
         </reg32>
         <reg32 offset="0xb4c2" name="SP_PS_2D_SRC_LO"/>
         <reg32 offset="0xb4c3" name="SP_PS_2D_SRC_HI"/>
+       <reg64 offset="0xb4c2" name="SP_PS_2D_SRC" type="waddress"/>
         <reg32 offset="0xb4c4" name="SP_PS_2D_SRC_PITCH">
            <bitfield name="PITCH" low="9" high="24" shr="6" type="uint"/>
         </reg32>
  
         <reg32 offset="0xb4ca" name="SP_PS_2D_SRC_FLAGS_LO"/>
         <reg32 offset="0xb4cb" name="SP_PS_2D_SRC_FLAGS_HI"/>
+       <reg64 offset="0xb4ca" name="SP_PS_2D_SRC_FLAGS" type="waddress"/>
         <reg32 offset="0xb4cc" name="SP_PS_2D_SRC_FLAGS_PITCH">
                 <bitfield name="PITCH" low="0" high="10" shr="6" type="uint"/>
                 <bitfield name="ARRAY_PITCH" low="11" high="21" shr="7" type="uint"/>
@@ -3190,6 +3369,11 @@ to upconvert to 32b float internally?
         <reg32 offset="0xb99a" name="HLSQ_CS_KERNEL_GROUP_Y"/>
         <reg32 offset="0xb99b" name="HLSQ_CS_KERNEL_GROUP_Z"/>
  
+       <!-- mirror of SP_CS_BINDLESS_BASE -->
+       <array offset="0xb9c0" name="HLSQ_CS_BINDLESS_BASE" stride="2" length="5">
+               <reg64 offset="0" name="ADDR" type="waddress"/>
+       </array>
+
         <!-- probably: -->
         <reg32 offset="0xbb08" name="HLSQ_UPDATE_CNTL"/>
  
@@ -3198,6 +3382,11 @@ to upconvert to 32b float internally?
         <!-- always 0x0 ? -->
         <reg32 offset="0xbb11" name="HLSQ_UNKNOWN_BB11"/>
  
+       <!-- mirror of SP_BINDLESS_BASE -->
+       <array offset="0xbb20" name="HLSQ_BINDLESS_BASE" stride="2" length="5">
+               <reg64 offset="0" name="ADDR" type="waddress"/>
+       </array>
+
         <!-- always 0x80 ? -->
         <reg32 offset="0xbe00" name="HLSQ_UNKNOWN_BE00"/>
         <!-- always 0x0 ? -->
@@ -3214,6 +3403,7 @@ to upconvert to 32b float internally?
                 <value name="A6XX_TEX_NEAREST" value="0"/>
                 <value name="A6XX_TEX_LINEAR" value="1"/>
                 <value name="A6XX_TEX_ANISO" value="2"/>
+               <value name="A6XX_TEX_CUBIC" value="3"/> <!-- a650 only -->
         </enum>
         <enum name="a6xx_tex_clamp"> <!-- same as a4xx? -->
                 <value name="A6XX_TEX_REPEAT" value="0"/>
@@ -3229,6 +3419,12 @@ to upconvert to 32b float internally?
                 <value name="A6XX_TEX_ANISO_8" value="3"/>
                 <value name="A6XX_TEX_ANISO_16" value="4"/>
         </enum>
+       <enum name="a6xx_reduction_mode">
+               <value name="A6XX_REDUCTION_MODE_AVERAGE" value="0"/>
+               <value name="A6XX_REDUCTION_MODE_MIN" value="1"/>
+               <value name="A6XX_REDUCTION_MODE_MAX" value="2"/>
+       </enum>
+
         <reg32 offset="0" name="0">
                 <bitfield name="MIPFILTER_LINEAR_NEAR" pos="0" type="boolean"/>
                 <bitfield name="XY_MAG" low="1" high="2" type="a6xx_tex_filter"/>
@@ -3240,6 +3436,8 @@ to upconvert to 32b float internally?
                 <bitfield name="LOD_BIAS" low="19" high="31" type="fixed" radix="8"/><!-- no idea how many bits for real -->
         </reg32>
         <reg32 offset="1" name="1">
+               <!-- bit 0 always set with vulkan? -->
+               <bitfield name="UNK0" pos="0" type="boolean"/>
                 <bitfield name="COMPARE_FUNC" low="1" high="3" type="adreno_compare_func"/>
                 <bitfield name="CUBEMAPSEAMLESSFILTOFF" pos="4" type="boolean"/>
                 <bitfield name="UNNORM_COORDS" pos="5" type="boolean"/>
@@ -3248,7 +3446,9 @@ to upconvert to 32b float internally?
                 <bitfield name="MIN_LOD" low="20" high="31" type="ufixed" radix="8"/>
         </reg32>
         <reg32 offset="2" name="2">
-               <bitfield name="BCOLOR_OFFSET" low="0" high="31"/>
+               <bitfield name="REDUCTION_MODE" low="0" high="1" type="a6xx_reduction_mode"/>
+               <bitfield name="CHROMA_LINEAR" pos="5" type="boolean"/>
+               <bitfield name="BCOLOR_OFFSET" low="7" high="31" shr="7"/>
         </reg32>
         <reg32 offset="3" name="3"/>
  </domain>
@@ -3277,8 +3477,11 @@ to upconvert to 32b float internally?
                 <bitfield name="SWIZ_Z" low="10" high="12" type="a6xx_tex_swiz"/>
                 <bitfield name="SWIZ_W" low="13" high="15" type="a6xx_tex_swiz"/>
                 <bitfield name="MIPLVLS" low="16" high="19" type="uint"/>
+               <!-- overlaps with MIPLVLS -->
+               <bitfield name="CHROMA_MIDPOINT_X" pos="16" type="boolean"/>
+               <bitfield name="CHROMA_MIDPOINT_Y" pos="18" type="boolean"/>
                 <bitfield name="SAMPLES" low="20" high="21" type="a3xx_msaa_samples"/>
-               <bitfield name="FMT" low="22" high="29" type="a6xx_tex_fmt"/>
+               <bitfield name="FMT" low="22" high="29" type="a6xx_format"/>
                 <bitfield name="SWAP" low="30" high="31" type="a3xx_color_swap"/>
         </reg32>
         <reg32 offset="1" name="1">
@@ -3294,7 +3497,8 @@ to upconvert to 32b float internally?
                 behavior of texture in dEQP-GLES31.functional.texture.texture_buffer.render.as_fragment_texture.buffer_size_131071
                  -->
                 <bitfield name="UNK4" pos="4" type="boolean"/>
-               <bitfield name="FETCHSIZE" low="0" high="3" type="a6xx_tex_fetchsize"/>
+                <!-- minimum pitch (for mipmap levels): log2(pitchalign / 64) -->
+               <bitfield name="PITCHALIGN" low="0" high="3" type="uint"/>
                 <doc>Pitch in bytes (so actually stride)</doc>
                 <bitfield name="PITCH" low="7" high="28" type="uint"/>
                 <bitfield name="TYPE" low="29" high="30" type="a6xx_tex_type"/>
@@ -3317,6 +3521,10 @@ to upconvert to 32b float internally?
                 <bitfield name="TILE_ALL" pos="27" type="boolean"/>
                 <bitfield name="FLAG" pos="28" type="boolean"/>
         </reg32>
+       <!-- for 2-3 plane format, BASE is flag buffer address (if enabled)
+            the address of the non-flag base buffer is determined automatically,
+            and must follow the flag buffer
+        -->
         <reg32 offset="4" name="4">
                 <bitfield name="BASE_LO" low="5" high="31" shr="5"/>
         </reg32>
@@ -3324,13 +3532,18 @@ to upconvert to 32b float internally?
                 <bitfield name="BASE_HI" low="0" high="16"/>
                 <bitfield name="DEPTH" low="17" high="29" type="uint"/>
         </reg32>
-       <reg32 offset="6" name="6"/>
+       <reg32 offset="6" name="6">
+               <!-- pitch for plane 2 / plane 3 -->
+               <bitfield name="PLANE_PITCH" low="8" high="31" type="uint"/>
+       </reg32>
+       <!-- 7/8 is plane 2 address for planar formats -->
         <reg32 offset="7" name="7">
                 <bitfield name="FLAG_LO" low="5" high="31" shr="5"/>
         </reg32>
         <reg32 offset="8" name="8">
                 <bitfield name="FLAG_HI" low="0" high="16"/>
         </reg32>
+       <!-- 9/10 is plane 3 address for planar formats -->
         <reg32 offset="9" name="9">
                 <bitfield name="FLAG_BUFFER_ARRAY_PITCH" low="0" high="16" shr="4" type="uint"/>
         </reg32>
@@ -3359,7 +3572,7 @@ with a better name.
                 used but if they are good chance position is same as TEX_CONST
                  -->
                 <bitfield name="TILE_MODE" low="0" high="1" type="a6xx_tile_mode"/>
-               <bitfield name="FMT" low="22" high="29" type="a6xx_tex_fmt"/>
+               <bitfield name="FMT" low="22" high="29" type="a6xx_format"/>
         </reg32>
         <reg32 offset="1" name="1">
                 <bitfield name="WIDTH" low="0" high="14" type="uint"/>
@@ -3418,19 +3631,7 @@ with a better name.
         </reg32>
         <reg32 offset="1" name="1">
                 <bitfield name="BASE_HI" low="0" high="16"/>
-               <!-- size probably in high bits -->
-       </reg32>
-</domain>
-
-<domain name="CP_UNK_A6XX_55" width="32">
-       <reg32 offset="0" name="0">
-               <bitfield name="BASE_LO" low="0" high="31"/>
-       </reg32>
-       <reg32 offset="1" name="1">
-               <bitfield name="BASE_HI" low="0" high="16"/>
-       </reg32>
-       <reg32 offset="2" name="2">
-               <bitfield name="SIZE" low="0" high="15"/>
+               <bitfield name="SIZE" low="17" high="31"/> <!-- size in vec4 (4xDWORD) units -->
         </reg32>
  </domain>