<div style="line-height:1.7;color:#000000;font-size:14px;font-family:arial"><div>this version is good</div>
<div><br>At 2015-02-02 19:34:13,praveen@multicorewareinc.com wrote:<br>># HG changeset patch<br>># User Praveen Tiwari<br>># Date 1422876820 -19800<br>># Branch stable<br>># Node ID 8e1f8ca9d4112d8ad9801bf79518482306ff55ce<br>># Parent  bc0fbae84481a82011ce7548efe67210bb14666f<br>>blockfill_s_8x8 sse2 asm code optimization<br>><br>>improved, 100.04c -> 90.05c<br>><br>>diff -r bc0fbae84481 -r 8e1f8ca9d411 source/common/x86/blockcopy8.asm<br>>--- a/source/common/x86/blockcopy8.asm     Mon Feb 02 14:34:16 2015 +0530<br>>+++ b/source/common/x86/blockcopy8.asm        Mon Feb 02 17:03:40 2015 +0530<br>>@@ -1748,9 +1748,10 @@<br>> ; void blockfill_s_8x8(int16_t* dst, intptr_t dstride, int16_t val)<br>> ;-----------------------------------------------------------------------------<br>> INIT_XMM sse2<br>>-cglobal blockfill_s_8x8, 3, 3, 1, dst, dstStride, val<br>>+cglobal blockfill_s_8x8, 3, 4, 1, dst, dstStride, val<br>> <br>> add        r1,            r1<br>>+lea        r3,            [3 * r1]<br>> <br>> movd       m0,            r2d<br>> pshuflw    m0,            m0,         0<br>>@@ -1760,17 +1761,13 @@<br>> movu       [r0 + r1],     m0<br>> movu       [r0 + 2 * r1], m0<br>> <br>>-lea        r0,            [r0 + 2 * r1]<br>>+movu       [r0 + r3],     m0<br>>+<br>>+lea        r0,            [r0 + 4 * r1]<br>>+movu       [r0],          m0<br>> movu       [r0 + r1],     m0<br>> movu       [r0 + 2 * r1], m0<br>>-<br>>-lea        r0,            [r0 + 2 * r1]<br>>-movu       [r0 + r1],     m0<br>>-movu       [r0 + 2 * r1], m0<br>>-<br>>-lea        r0,            [r0 + 2 * r1]<br>>-movu       [r0 + r1],     m0<br>>-<br>>+movu       [r0 + r3],     m0<br>> RET<br>> <br>> ;-----------------------------------------------------------------------------<br>>_______________________________________________<br>>x265-devel mailing list<br>>x265-devel@videolan.org<br>>https://mailman.videolan.org/listinfo/x265-devel<br></div></div>