<div style="line-height:1.7;color:#000000;font-size:14px;font-family:arial"><div>Please check input buffer, we need found reason, it is better than change mova to movu</div>

<div>we DCT input uffer may alignment for more performance.<br><br>At 2015-09-02 19:38:27,dnyaneshwar@multicorewareinc.com wrote:<br>># HG changeset patch<br>># User Dnyaneshwar G <dnyaneshwar@multicorewareinc.com><br>># Date 1441193878 -19800<br>>#      Wed Sep 02 17:07:58 2015 +0530<br>># Node ID 8295bff6f2b70202af8aa99397767e21ff8ab5e4<br>># Parent  86e9bd7dd19278fceef65fc93a06dc8746ec9daf<br>>asm: fix crash due to unaligned memory access<br>><br>>diff -r 86e9bd7dd192 -r 8295bff6f2b7 source/common/x86/dct8.asm<br>>--- a/source/common/x86/dct8.asm       Tue Sep 01 17:06:05 2015 +0530<br>>+++ b/source/common/x86/dct8.asm      Wed Sep 02 17:07:58 2015 +0530<br>>@@ -2112,25 +2112,25 @@<br>>     pxor     m5,  m5<br>>     shr      r3d, 3<br>> .loop:<br>>-    mova     m0, [r0]<br>>+    movu     m0, [r0]<br>>     pabsw    m1, m0<br>> <br>>-    mova     m2, [r1]<br>>+    movu     m2, [r1]<br>>     pmovsxwd m3, m1<br>>     paddd    m2, m3<br>>-    mova     [r1], m2<br>>-    mova     m2, [r1 + 16]<br>>+    movu     [r1], m2<br>>+    movu     m2, [r1 + 16]<br>>     psrldq   m3, m1, 8<br>>     pmovsxwd m4, m3<br>>     paddd    m2, m4<br>>-    mova     [r1 + 16], m2<br>>+    movu     [r1 + 16], m2<br>> <br>>     movu     m3, [r2]<br>>     psubusw  m1, m3<br>>     pcmpgtw  m4, m1, m5<br>>     pand     m1, m4<br>>     psignw   m1, m0<br>>-    mova     [r0], m1<br>>+    movu     [r0], m1<br>>     add      r0, 16<br>>     add      r1, 32<br>>     add      r2, 16<br>>_______________________________________________<br>>x265-devel mailing list<br>>x265-devel@videolan.org<br>>https://mailman.videolan.org/listinfo/x265-devel<br></div></div>