<div dir="ltr"><br><div class="gmail_extra"><br><br><div class="gmail_quote">On Fri, Oct 11, 2013 at 10:39 PM, chen <span dir="ltr"><<a href="mailto:chenm003@163.com" target="_blank">chenm003@163.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div style="line-height:1.7;font-size:14px;font-family:arial">
<div><br></div>在 2013-10-12 03:12:46,"Steve Borho" <<a href="mailto:steve@borho.org" target="_blank">steve@borho.org</a>> 写道:<br>
<blockquote style="padding-left:1ex;margin:0px 0px 0px 0.8ex;border-left-color:rgb(204,204,204);border-left-width:1px;border-left-style:solid">
<div dir="ltr"><br>
<div class="gmail_extra"><br><br>
<div class="gmail_quote"><div class="im">On Fri, Oct 11, 2013 at 3:40 AM, <span dir="ltr"><<a href="mailto:yuvaraj@multicorewareinc.com" target="_blank">yuvaraj@multicorewareinc.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="padding-left:1ex;margin:0px 0px 0px 0.8ex;border-left-color:rgb(204,204,204);border-left-width:1px;border-left-style:solid"># HG changeset patch<br># User Yuvaraj Venkatesh <<a href="mailto:yuvaraj@multicorewareinc.com" target="_blank">yuvaraj@multicorewareinc.com</a>><br>
# Date 1381480768 -19800<br>#      Fri Oct 11 14:09:28 2013 +0530<br># Node ID 46b954edb1c52a557b9d94c4ed380ea0578c1949<br># Parent  8bb743458331d7cdc1008e217542e406818c5a7a<br>dct: Replaced partialButterfly16 vector class function to intrinsic<br>
</blockquote>
<div><br></div>
<div>For some reason, this new version is 3x slower than the vector version; we need to figure out why.  It looks like the code-flow is the same.</div>
<div> </div>
</div><div>are you use VS compiler? the instruction _mm_setr_epi32 is very slow on it, most time vector version make constant array.</div></div></div></div></blockquote></div></blockquote></div><br>Yes, indeed.  What should they use instead of _mm_setr_epi32?<div>
<br></div>-- <br>Steve Borho
</div></div>