i965/gs: Move vertex_count != 0 check up a level; skip one caller.
authorKenneth Graunke <kenneth@whitecape.org>
Thu, 2 Jul 2015 00:01:24 +0000 (17:01 -0700)
committerKenneth Graunke <kenneth@whitecape.org>
Sat, 11 Jul 2015 01:21:15 +0000 (18:21 -0700)
commit0edb084f9d0444c451a08fd2ed7daee2eb8a6f4a
tree793d2323e6812f17686e346b40c58bbe08180993
parent0fae4e451bc60de1138729d20e03100e93cc6f38
i965/gs: Move vertex_count != 0 check up a level; skip one caller.

Paul's original code had emit_control_data_bits() skip the URB write if
vertex_count was 0.  This meant wrapping every control data write in a
conditional write.

We accumulate control data bits in a single UD (32-bit) register.  For
simple shaders that don't emit many vertices, the control data header
will be <= 32-bits long, so we only need to write it once at the end of
the shader.

For shaders with larger headers, we write out batches of control data
bits at EmitVertex(), when (vertex_count * bits_per_vertex) % 32 == 0.
On the first EmitVertex() call, the above expression will evaluate to
true simply because vertex_count == 0.  But we want to avoid emitting
the control data bits, because we haven't accumulated 32-bits worth yet.

In other words, the vertex_count != 0 check is really only necessary in
the EmitVertex() batching case, not the end-of-thread case.

This saves a CMP/IF/ENDIF in every shader that uses EndPrimitive() or
multiple streams.  The only downside is that a shader which emits no
vertices at all will execute an additional URB write---but such shaders
are pointless and not worth optimizing.

Signed-off-by: Kenneth Graunke <kenneth@whitecape.org>
Reviewed-by: Matt Turner <mattst88@gmail.com>
src/mesa/drivers/dri/i965/brw_vec4_gs_visitor.cpp