<div dir="ltr">Replaced in both C and asm codes, sent fix.<div><br></div><div>Regards,</div><div>Praveen Tiwari</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Wed, Nov 20, 2013 at 6:11 PM, chen <span dir="ltr"><<a href="mailto:chenm003@163.com" target="_blank">chenm003@163.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="line-height:1.7;font-size:14px;font-family:arial"><div><div class="im">>+;-----------------------------------------------------------------------------<br>
>+; void pixel_add_ps_%1x%2(pixel *dest, int destride, pixel *src0, int16_t *scr1, int srcStride0, int srcStride1)<br>>+;-----------------------------------------------------------------------------<br></div>use intprt_t type  for stride is better</div>

<div> </div>
<div><div><div class="h5">>+%macro PIXEL_ADD_PS_W4_H4 2<br>>+INIT_XMM sse4<br>>+cglobal pixel_add_ps_%1x%2, 6, 7, 2, dest, destride, src0, scr1, srcStride0, srcStride1<br>>+<br>>+add         r5,            r5<br>
>+<br>>+mov         r6d,           %2/4<br>>+<br>>+.loop<br>>+      movd        m0,            [r2]<br>>+      pmovzxbw    m0,            m0<br>>+      movh        m1,            [r3]<br>>+<br>>+      paddw       m0,            m1<br>
>+      packuswb    m0,            m0<br>>+<br>>+      movd        [r0],          m0<br>>+<br>>+      movd        m0,            [r2 + r4]<br>>+      pmovzxbw    m0,            m0<br>>+      movh        m1,            [r3 + r5]<br>
>+<br>>+      paddw       m0,            m1<br>>+      packuswb    m0,            m0<br>>+<br>>+      movd        [r0 + r1],     m0<br>>+<br>>+      movd        m0,            [r2 + 2 * r4]<br>>+      pmovzxbw    m0,            m0<br>
>+      movh        m1,            [r3 + 2 * r5]<br>>+<br>>+      paddw       m0,            m1<br>>+      packuswb    m0,            m0<br>>+<br>>+      movd        [r0 + 2 * r1], m0<br>>+<br>>+      lea         r0,            [r0 + 2 * r1]<br>
>+      lea         r2,            [r2 + 2 * r4]<br>>+      lea         r3,            [r3 + 2 * r5]<br>>+<br>>+      movd        m0,            [r2 + r4]<br>>+      pmovzxbw    m0,            m0<br>>+      movh        m1,            [r3 + r5]<br>
>+<br>>+      paddw       m0,            m1<br>>+      packuswb    m0,            m0<br>>+<br>>+      movd        [r0 + r1],     m0<br>>+<br>>+      lea         r0,            [r0 + 2 * r1]<br>>+      lea         r2,            [r2 + 2 * r4]<br>
>+      lea         r3,            [r3 + 2 * r5]<br>>+<br>>+      dec         r6d<br>>+      jnz         .loop<br>>+<br>>+RET<br>>+%endmacro<br>>+<br>>+PIXEL_ADD_PS_W4_H4   4,  8<br>>+PIXEL_ADD_PS_W4_H4   4, 16<br>
</div></div>>_______________________________________________<br>>x265-devel mailing list<br>><a href="mailto:x265-devel@videolan.org" target="_blank">x265-devel@videolan.org</a><br>><a href="https://mailman.videolan.org/listinfo/x265-devel" target="_blank">https://mailman.videolan.org/listinfo/x265-devel</a><br>
</div></div><br>_______________________________________________<br>
x265-devel mailing list<br>
<a href="mailto:x265-devel@videolan.org">x265-devel@videolan.org</a><br>
<a href="https://mailman.videolan.org/listinfo/x265-devel" target="_blank">https://mailman.videolan.org/listinfo/x265-devel</a><br>
<br></blockquote></div><br></div>