<div style="line-height:1.7;color:#000000;font-size:14px;font-family:arial"><div>pxor didn't make uops, and m7 is temporary in your macro</div><pre><br>At 2015-03-13 06:40:10,dave <dtyx265@gmail.com> wrote:
>On 03/12/2015 03:16 PM, chen wrote:
>> I use 'pxor m7,m7' to replace your [pb_0], but it is same cycles in 
>> IACA, the bottleneck on Port0
>> Not sure how about performance on old CPU
>I would have used something like that but there are no available 
>registers by that point.  They are used up on holding other 
>constants(pw_planar..) in the case of x86_64 and there just aren't 
>enough in x86_32.  Performance on my old CPU seems unaffected by using 
>constants in registers or from memory.
>_______________________________________________
>x265-devel mailing list
>x265-devel@videolan.org
>https://mailman.videolan.org/listinfo/x265-devel
</pre></div>