<div style="line-height:1.7;color:#000000;font-size:14px;font-family:Arial"><div style="margin: 0;">Hello,</div><div style="margin: 0;"><br></div><div style="margin: 0;">a little comments</div><div style="margin: 0;"><br></div><div style="margin: 0;"><div style="margin: 0;">+function PFX(cpy2Dto1D_shl_64x64_neon)</div><div style="margin: 0;">+    cpy2Dto1D_shl_start</div><div style="margin: 0;">+    mov             w12, #32</div><div style="margin: 0;">+.loop_cpy2Dto1D_shl_64:</div><div style="margin: 0;">+    sub             w12, w12, #1</div><div style="margin: 0;">+.rept 2</div><div style="margin: 0;">+    ldp             q2, q3, [x1]</div><div style="margin: 0;">+    ldp             q4, q5, [x1, #32]</div><div>[MC] Why not LD1? same as STP</div><div><br></div><div><br></div></div><p style="margin-right: 0px; margin-left: 0px;">-#if X86_64</p><p style="margin-right: 0px; margin-left: 0px;">+#if X86_64 || defined(__aarch64__)</p><div>[MC] This is right, but for more generic, we can check with sizeof(long*)==8</div><p style="margin: 0;"><br></p><div style="margin: 0;">Other are fine.</div><div style="margin: 0;"><br></div><div style="margin: 0;">Regards,</div><div style="margin: 0;">Min Chen</div><p style="margin: 0;"><br></p><div style="position:relative;zoom:1"></div><div id="divNeteaseMailCard"></div><p style="margin: 0;"><br></p><p>2022-03-25 00:24:01£¬"Pop, Sebastian" <spop@amazon.com> </p><blockquote id="isReplyContent" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: #ccc 1px solid">


<style type="text/css" style="display:none"><!-- p { margin-top: 0px; margin-bottom: 0px; }--></style>


<p>Hi,<br>
</p>
<p><br>
</p>
<p>Please find attached a few more changes that bring up the performance of x265 on Arm64 processors.<br>
</p>
<p>Patches tested on Graviton2 aarch64-linux.<br>
</p>
<p><span style="font-size: 12pt;">Ok to commit?</span><br>
</p>
<p><br>
</p>
<p>Thanks,<br>
</p>
<p>Sebastian</p>


</blockquote></div>