<div style="line-height:1.7;color:#000000;font-size:14px;font-family:arial"><DIV>At 2013-11-13 14:53:27,nabajit@multicorewareinc.com wrote:<BR>># HG changeset patch<BR>># User Nabajit Deka<BR>># Date 1384325281 -19800<BR>>#      Wed Nov 13 12:18:01 2013 +0530<BR>># Node ID 017763dc543d091170082eccf7b42a0c47c453ff<BR>># Parent  c4ca80d19105ccf1ba2ec14dd65915f2820a660d<BR>>asm: Replaced SSE4 instructions with SSE2 and general purpose instructions for chroma vsp filter functions.<BR>><BR>>diff -r c4ca80d19105 -r 017763dc543d source/common/x86/ipfilter8.asm<BR>>--- a/source/common/x86/ipfilter8.asm  Tue Nov 12 19:10:23 2013 +0530<BR>>+++ b/source/common/x86/ipfilter8.asm Wed Nov 13 12:18:01 2013 +0530<BR>>@@ -3183,11 +3183,16 @@<BR>>     packssdw  m0, m2<BR>>     packuswb  m0, m0<BR>> <BR>>-    pextrw    [r2], m0, 0<BR>>-    pextrw    [r2 + r3], m0, 1<BR>>-    pextrw    [r2 + 2 * r3], m0, 2<BR>>+    movd      r5d, m0<BR>>+    mov       [r2], r5w<BR>>+    shr       r5d, 16<BR>>+    mov       [r2 + r3], r5w<BR>>+    pshufd    m0, m0, 1<BR>>+    movd      r5d, m0<BR>pshufd + movd is slower than pextrd</DIV>
<DIV> </DIV>
<DIV>>+    mov       [r2 + 2 * r3], r5w<BR>>+    shr       r5d, 16<BR>>     lea       r2, [r2 + 2 * r3]<BR>>-    pextrw    [r2 + r3], m0, 3<BR>>+    mov       [r2 + r3], r5w<BR>> <BR>>     lea       r2, [r2 + 2 * r3]<BR>> <BR></DIV></div>