<div style="line-height:1.7;color:#000000;font-size:14px;font-family:Arial"><div style="margin: 0;">Hi Sebastian,</div><div style="margin: 0;"><br></div><div style="margin: 0;">Thank you for your contibution, the code looks good.</div><div style="margin: 0;"><br></div><div style="margin: 0;">Just a little comment for future performance improve,</div><div style="margin: 0;">"fmov w12, s2" are expensive because data across Neon and Integer fields, especally it is inside the loop.</div><div style="margin: 0;">There are also some deep-seated data organization and algorithm problems, for example, we spends many instructions for absCoeff[numNonZero], if we allow spare zeros inside of array, we will reduce many of instructions.</div><div style="margin: 0;"><br></div><div style="margin: 0;">Regards,</div><div style="margin: 0;">Min Chen</div><div style="position:relative;zoom:1"></div><div id="divNeteaseMailCard"></div><p style="margin: 0;"><br></p><p>At 2022-03-02 07:28:15, "Pop, Sebastian" <spop@amazon.com> wrote:</p><blockquote id="isReplyContent" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: #ccc 1px solid">


<style type="text/css" style="display:none"><!-- p { margin-top: 0px; margin-bottom: 0px; }--></style>


<p>Hi,<br>
</p>
<p><br>
</p>
<p>the attached patch fixes the registration of costCoeffNxN function hook and removes the early return that I used for testing.<br>
</p>
<div dir="ltr" style="font-size:12pt; color:#000000; background-color:#FFFFFF; font-family:Calibri,Arial,Helvetica,sans-serif">
<div>
<p><br>
</p>
<p>Sebastian<br>
</p>
</div>
</div>


</blockquote></div>