<div style="line-height:1.7;color:#000000;font-size:14px;font-family:arial">At 2013-11-07 00:12:47,"Praveen Tiwari" <praveen@multicorewareinc.com> wrote:<BR>
<BLOCKQUOTE id="isReplyContent" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: #ccc 1px solid">
<DIV dir="ltr"><BR><BR>
<DIV class="gmail_quote">---------- Forwarded message ----------<BR>From: <B class="gmail_sendername">chen</B> <SPAN dir="ltr"><<A href="mailto:chenm003@163.com">chenm003@163.com</A>></SPAN><BR>Date: Wed, Nov 6, 2013 at 8:00 PM<BR>Subject: Re: [x265] [PATCH Review Only] asm code for blockcopy_sp, 8x4 partition<BR>To: Development for x265 <<A href="mailto:x265-devel@videolan.org">x265-devel@videolan.org</A>><BR><BR><BR>
<DIV style="FONT-SIZE: 14px; LINE-HEIGHT: 1.7; FONT-FAMILY: arial">
<DIV>
<DIV class="im">>+pshufb     m1,      m0<BR>>+pshufb     m2,      m0<BR>>+pshufb     m3,      m0<BR>>+pshufb     m4,      m0<BR></DIV>>>packuswb</DIV>
<DIV><BR></DIV>
<DIV>Our C code is not using saturation. For this we have to change our C primitive, probably merge calcrecon.</DIV>
<DIV><BR></DIV>
<DIV>Yes, the C code has not saturation, but we can insert assert() to C code and use packuswb in asm code, it reduce a memory load operator.<BR></DIV></DIV></DIV><BR></DIV></BLOCKQUOTE></div>