<div style="line-height:1.7;color:#000000;font-size:14px;font-family:arial"><DIV>code is right, but need uncrustify it, ex: add r3, r3<BR></DIV>
<DIV>t 2013-11-08 21:32:05,praveen@multicorewareinc.com wrote:<BR>># HG changeset patch<BR>># User Praveen Tiwari<BR>># Date 1383917516 -19800<BR>># Node ID 662664f0863b38b838a15867745c5564f574fb09<BR>># Parent  227a5666e08869d36e07a75f3db95dd94c774715<BR>>blockcopy_sp_16xN, optimized asm code<BR>><BR>>diff -r 227a5666e088 -r 662664f0863b source/common/x86/blockcopy8.asm<BR>>--- a/source/common/x86/blockcopy8.asm  Fri Nov 08 17:38:24 2013 +0530<BR>>+++ b/source/common/x86/blockcopy8.asm        Fri Nov 08 19:01:56 2013 +0530<BR>>@@ -1325,51 +1325,38 @@<BR>> ;-----------------------------------------------------------------------------<BR>> %macro BLOCKCOPY_SP_W16_H4 2<BR>> INIT_XMM sse2<BR>>-cglobal blockcopy_sp_%1x%2, 4, 7, 7, dest, destStride, src, srcStride<BR>>+cglobal blockcopy_sp_%1x%2, 4, 5, 8, dest, destStride, src, srcStride<BR>> <BR>>-mov         r6d,    %2<BR>>+mov             r4d,     %2/4<BR>> <BR>>-add        r3,      r3<BR>>-<BR>>-mova       m0,      [tab_Vm]<BR>>+add             r3,      r3<BR>> <BR>> .loop<BR>>-     movu       m1,      [r2]<BR>>-     movu       m2,      [r2 + 16]<BR>>-     movu       m3,      [r2 + r3]<BR>>-     movu       m4,      [r2 + r3 + 16]<BR>>-     movu       m5,      [r2 + 2 * r3]<BR>>-     movu       m6,      [r2 + 2 * r3 + 16]<BR>>+     movu       m0,      [r2]<BR>>+     movu       m1,      [r2 + 16]<BR>>+     movu       m2,      [r2 + r3]<BR>>+     movu       m3,      [r2 + r3 + 16]<BR>>+     movu       m4,      [r2 + 2 * r3]<BR>>+     movu       m5,      [r2 + 2 * r3 + 16]<BR>>+     lea        r2,      [r2 + 2 * r3]<BR>>+     movu       m6,      [r2 + r3]<BR>>+     movu       m7,      [r2 + r3 + 16]<BR>> <BR>>-     pshufb     m1,      m0<BR>>-     pshufb     m2,      m0<BR>>-     pshufb     m3,      m0<BR>>-     pshufb     m4,      m0<BR>>-     pshufb     m5,      m0<BR>>-     pshufb     m6,      m0<BR>>+     packuswb   m0,      m1<BR>>+     packuswb   m2,      m3<BR>>+     packuswb   m4,      m5<BR>>+     packuswb   m6,      m7<BR>> <BR>>-     movh       [r0],              m1<BR>>-     movh       [r0 + 8],          m2<BR>>-     movh       [r0 + r1],         m3<BR>>-     movh       [r0 + r1 + 8],     m4<BR>>-     movh       [r0 + 2 * r1],     m5<BR>>-     movh       [r0 + 2 * r1 + 8], m6<BR>>+     movu       [r0],              m0<BR>>+     movu       [r0 + r1],         m2<BR>>+     movu       [r0 + 2 * r1],     m4<BR>>+     lea        r0,                [r0 + 2 * r1]<BR>>+     movu       [r0 + r1],         m6<BR>> <BR>>-     lea        r4,      [r2 + 2 * r3]<BR>>-     movu       m1,      [r4 + r3]<BR>>-     movu       m2,      [r4 + r3 + 16]<BR>>+     lea        r0,                [r0 + 2 * r1]<BR>>+     lea        r2,                [r2 + 2 * r3]<BR>> <BR>>-     pshufb     m1,      m0<BR>>-     pshufb     m2,      m0<BR>>-<BR>>-     lea        r5,            [r0 + 2 * r1]<BR>>-     movh       [r5 + r1],     m1<BR>>-     movh       [r5 + r1 + 8], m2<BR>>-<BR>>-     lea        r0,              [r5 + 2 * r1]<BR>>-     lea        r2,              [r4 + 2 * r3]<BR>>-<BR>>-     sub        r6d,             4<BR>>+     dec        r4d<BR>>      jnz        .loop<BR>> <BR>> RET<BR>>_______________________________________________<BR>>x265-devel mailing list<BR>>x265-devel@videolan.org<BR>>https://mailman.videolan.org/listinfo/x265-devel<BR></DIV></div>