<div style="line-height:1.7;color:#000000;font-size:14px;font-family:arial"><div>right<br>At 2015-02-03 20:25:48,praveen@multicorewareinc.com wrote:<br>># HG changeset patch<br>># User Praveen Tiwari<br>># Date 1422966338 -19800<br>># Node ID 3fc854e9e1b07e490c1422635dffea7b62e911c9<br>># Parent  bfc9a2d99e20568cb43d9fba0133735009793b00<br>>blockcopy_pp_8x12: sse2 asm code optimization<br>><br>>improved, 235.05c -> 158.79c<br>><br>>diff -r bfc9a2d99e20 -r 3fc854e9e1b0 source/common/x86/blockcopy8.asm<br>>--- a/source/common/x86/blockcopy8.asm       Tue Feb 03 17:14:55 2015 +0530<br>>+++ b/source/common/x86/blockcopy8.asm        Tue Feb 03 17:55:38 2015 +0530<br>>@@ -351,17 +351,34 @@<br>> ; void blockcopy_pp_8x12(pixel* dst, intptr_t dstStride, const pixel* src, intptr_t srcStride)<br>> ;-----------------------------------------------------------------------------<br>> INIT_XMM sse2<br>>-cglobal blockcopy_pp_8x12, 4, 5, 2<br>>-    mov      r4d,       12/2<br>>-.loop:<br>>-    movh     m0,        [r2]<br>>-    movh     m1,        [r2 + r3]<br>>-    movh     [r0],      m0<br>>-    movh     [r0 + r1], m1<br>>-    dec      r4d<br>>-    lea      r0,        [r0 + 2 * r1]<br>>-    lea      r2,        [r2 + 2 * r3]<br>>-    jnz      .loop<br>>+cglobal blockcopy_pp_8x12, 4, 5, 4<br>>+<br>>+    lea      r4, [3 * r3]<br>>+    lea      r5, [3 * r1]<br>>+<br>>+    movh     m0, [r2]<br>>+    movh     m1, [r2 + r3]<br>>+    movh     m2, [r2 + 2 * r3]<br>>+    movh     m3, [r2 + r4]<br>>+<br>>+    movh     [r0],          m0<br>>+    movh     [r0 + r1],     m1<br>>+    movh     [r0 + 2 * r1], m2<br>>+    movh     [r0 + r5],     m3<br>>+<br>>+    %rep 2<br>>+    lea      r2, [r2 + 4 * r3]<br>>+    movh     m0, [r2]<br>>+    movh     m1, [r2 + r3]<br>>+    movh     m2, [r2 + 2 * r3]<br>>+    movh     m3, [r2 + r4]<br>>+<br>>+    lea      r0,            [r0 + 4 * r1]<br>>+    movh     [r0],          m0<br>>+    movh     [r0 + r1],     m1<br>>+    movh     [r0 + 2 * r1], m2<br>>+    movh     [r0 + r5],     m3<br>>+    %endrep<br>>     RET<br>> <br>> ;-----------------------------------------------------------------------------<br>>_______________________________________________<br>>x265-devel mailing list<br>>x265-devel@videolan.org<br>>https://mailman.videolan.org/listinfo/x265-devel<br></div></div>