<div style="line-height:1.7;color:#000000;font-size:14px;font-family:Arial"><div style="margin: 0;">Hi, </div><div style="margin: 0;"><br></div><div style="margin: 0;">The code looks good.</div><div style="margin: 0;">little performance change because pipeline stall, two of LD1 can't hidden latency penalty, but it is not big problem, we saved the code size.</div><div style="margin: 0;">Could you please make a stalone patch, I guess patch to patch is not good idea.</div><div style="margin: 0;"><br></div><div style="margin: 0;">Regards,</div><div style="margin: 0;">Min Chen</div><p>At 2021-07-31 02:27:36, "Pop, Sebastian" <spop@amazon.com> wrote:</p><blockquote id="isReplyContent" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: #ccc 1px solid">



<style><!--

_font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
_font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}

p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        font-size:12.0pt;
        font-family:"Calibri",sans-serif;}
span.EmailStyle19
        {mso-style-type:personal-reply;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
_page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style>


<div class="WordSection1">
<div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt">A small change to save a few bytes in code size.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">I replaced the 4 LD1 2 regs with 2 LD1 4 regs.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">No performance change.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
</div>
</div>
</div>
</div>


</blockquote></div>