<div style="line-height:1.7;color:#000000;font-size:14px;font-family:arial"><DIV><BR></DIV>ÔÚ 2013-10-12 03:12:46£¬"Steve Borho" <steve@borho.org> Ð´µÀ£º<BR>
<BLOCKQUOTE id="isReplyContent" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: #ccc 1px solid">
<DIV dir="ltr"><BR>
<DIV class="gmail_extra"><BR><BR>
<DIV class="gmail_quote">On Fri, Oct 11, 2013 at 3:40 AM, <SPAN dir="ltr"><<A href="mailto:yuvaraj@multicorewareinc.com" target="_blank">yuvaraj@multicorewareinc.com</A>></SPAN> wrote:<BR>
<BLOCKQUOTE class="gmail_quote" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: #ccc 1px solid"># HG changeset patch<BR># User Yuvaraj Venkatesh <<A href="mailto:yuvaraj@multicorewareinc.com">yuvaraj@multicorewareinc.com</A>><BR># Date 1381480768 -19800<BR>#      Fri Oct 11 14:09:28 2013 +0530<BR># Node ID 46b954edb1c52a557b9d94c4ed380ea0578c1949<BR># Parent  8bb743458331d7cdc1008e217542e406818c5a7a<BR>dct: Replaced partialButterfly16 vector class function to intrinsic<BR></BLOCKQUOTE>
<DIV><BR></DIV>
<DIV>For some reason, this new version is 3x slower than the vector version; we need to figure out why.  It looks like the code-flow is the same.</DIV>
<DIV> </DIV>
<DIV>are you use VS compiler? the instruction _mm_setr_epi32 is very slow on it, most time vector version make constant array.</DIV></DIV></DIV></DIV></BLOCKQUOTE></div>