<div style="line-height:1.7;color:#000000;font-size:14px;font-family:arial"><div><br></div><pre><br>At 2014-06-28 01:02:27,"Derek Buitenhuis" <derek.buitenhuis@gmail.com> wrote:
>On 6/27/2014 4:05 PM, chen wrote:
>> I can't understand what's your means. could you tell me more?
>> 
>> I use some SSSE3 instruction and process 16 pixels every loop.
>
>I meant keep both sse2 and ssse3 variants. Not sure if x86inc.asm macros
>help with this or not.
>
I use ssse3 instruction PSHUFB to replace 3 SSE2 instructions, the x86inc macro can't handle it.</pre><pre>After patch, this function is faster ~20% and codeCoeffNxN ~7% speedup, so I don't worry about old CPU's performance.</pre><pre><br></pre></div>