i965: Provide sse2 version for rgba8 <-> bgra8 swizzle
authorRoland Scheidegger <sroland@vmware.com>
Fri, 29 Jan 2016 02:18:36 +0000 (03:18 +0100)
committerRoland Scheidegger <sroland@vmware.com>
Tue, 2 Feb 2016 04:58:19 +0000 (05:58 +0100)
commitab30426e335116e29473faaafe8b57ec760516ee
treeb638e2beca9982eaba8f9d9dc45307addd77f9e1
parent116e4dc995af27e5fbd218240785fc4422feeb1c
i965: Provide sse2 version for rgba8 <-> bgra8 swizzle

The existing code used ssse3, and because it isn't compiled in a separate
file compiled with that, it is usually not used (that, of course, could
be fixed...), whereas sse2 is always present at least with 64bit builds.
This should be pretty much as fast as the pshufb version, albeit those
code paths aren't really used on chips without llc in any case.

v2: fix andnot argument order, add comments
v3: use pshuflw/hw instead of shifts (suggested by Matt Turner), cut comments

Reviewed-by: Matt Turner <mattst88@gmail.com>
src/mesa/drivers/dri/i965/intel_mipmap_tree.c
src/mesa/drivers/dri/i965/intel_tiled_memcpy.c