<div style="line-height:1.7;color:#000000;font-size:14px;font-family:arial"><div><br> </div>At 2015-03-11 12:57:34,"Praveen Tiwari" <praveen@multicorewareinc.com> wrote:<br> <blockquote id="isReplyContent" style="margin: 0px 0px 0px 0.8ex; padding-left: 1ex; border-left-color: rgb(204, 204, 204); border-left-width: 1px; border-left-style: solid;"><div dir="ltr"><br><div class="gmail_quote">---------- Forwarded message ----------<br>From: <b class="gmail_sendername">chen</b> <span dir="ltr"><<a href="mailto:chenm003@163.com">chenm003@163.com</a>></span><br>Date: Wed, Mar 11, 2015 at 6:32 AM<br>Subject: Re: [x265] [PATCH] asm: intra_pred_ang16_2<br>To: Development for x265 <<a href="mailto:x265-devel@videolan.org">x265-devel@videolan.org</a>><br><br><br><div><div style="color: rgb(0, 0, 0); line-height: 1.7; font-family: arial; font-size: 14px;">>>same speed to old version</div><div style="color: rgb(0, 0, 0); line-height: 1.7; font-family: arial; font-size: 14px;"><br></div><div style="color: rgb(0, 0, 0); line-height: 1.7; font-family: arial; font-size: 14px;">This avx2 version of asm code eliminates following instruction on cost of one vextracti128 instruction as compare to SSEE3, may not be a visible impact in testBench but seems worth to push.  </div><div><div><font color="#000000" face="arial"><span style="line-height: 23.79px; font-size: 14px;">    add             r2, 34</span></font></div><div><font color="#000000" face="arial"><span style="line-height: 23.79px; font-size: 14px;">    cmp             r3m, byte 34</span></font></div><div><font color="#000000" face="arial"><span style="line-height: 23.79px; font-size: 14px;">    cmove           r2, r4</span></font></div><div><font color="#000000" face="arial"><span style="line-height: 23.79px; font-size: 14px;">[MC] above for share code on mode 2 & 34, your new code use seprate functions, and vextract will use Port5, it is common bottleneck</span></font></div><div><font color="#000000" face="arial"><span style="line-height: 23.79px; font-size: 14px;"></span></font> </div><div><font color="#000000" face="arial"><span style="line-height: 23.79px; font-size: 14px;">    movu            m1, [r2 + 16]</span></font></div><div><font color="#000000" face="arial"><span style="line-height: 23.79px; font-size: 14px;"><br></span></font></div></div></div></div></div>
</blockquote></div>