<div style="line-height:1.7;color:#000000;font-size:14px;font-family:arial"><div>right</div><div> </div><div>some comment:</div><div>'psignb X, [pb_128]' equal to 'psubb X, 0, X', in AVX2, second type faster, in SSE4, choice depends on IACA report</div><div> </div><div>in PMINSW, you buffer ZERO into M0, and use pw_1023 directly, could you try buffer  pw_1023 and use PXOR to get ZERO?</div><pre><br>At 2015-06-22 20:50:32,dnyaneshwar@multicorewareinc.com wrote:
>SAO_EO_0        8.97x    974.03          8740.81
>SAO_EO_1        10.18x   492.67          5017.42
>SAO_EO_1_2Rows  11.21x   900.82          10095.86
>SAO_EO_2[0]     6.27x    207.22          1298.92
>SAO_EO_2[1]     8.92x    555.20          4949.69
>SAO_EO_3[0]     4.97x    236.72          1177.29
>SAO_EO_3[1]     8.67x    551.14          4778.67
>SAO_BO_0        7.50x    23127.89        173346.66
>_______________________________________________
>x265-devel mailing list
>x265-devel@videolan.org
>https://mailman.videolan.org/listinfo/x265-devel
</pre></div>