<div dir="ltr"><br><div class="gmail_extra"><br><br><div class="gmail_quote">On Wed, Nov 6, 2013 at 10:08 AM, Praveen Tiwari <span dir="ltr"><<a href="mailto:praveen@multicorewareinc.com" target="_blank">praveen@multicorewareinc.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Fixed.<div><br></div><div>Regards,</div><div>Praveen Tiwari<br><div><br></div></div></div><div class="gmail_extra">
<br><br><div class="gmail_quote"><div><div class="h5">On Wed, Nov 6, 2013 at 8:09 PM, chen <span dir="ltr"><<a href="mailto:chenm003@163.com" target="_blank">chenm003@163.com</a>></span> wrote:<br>
</div></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div class="h5"><div style="line-height:1.7;font-size:14px;font-family:arial"><div><div>>+     movd      [r0 + 2 * r1],     m3<br>

>+     pextrw    r6,                m3,    2<br>>+     mov       [r0 + 2 * r1 + 4], r6w<br></div>SSE4.1 support below:</div>
<div> pextrw    [r0 + 2 * r1 + 4],      m3,    2<br></div></div></div></div></blockquote></div></div></blockquote></div><div class="gmail_extra"><br></div>When you change the function signature to SSE4, you also need to move the pointer setups to the SSE4 portion of asm-primitives.cpp, else you defeat the whole concept of runtime CPU arch identification<br clear="all">
<div><br></div>-- <br>Steve Borho
</div></div>