<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Aptos;
        panose-1:2 11 0 4 2 2 2 2 2 4;}
@font-face
        {font-family:Consolas;
        panose-1:2 11 6 9 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        font-size:12.0pt;
        font-family:"Aptos",sans-serif;}
pre
        {mso-style-priority:99;
        mso-style-link:"HTML Preformatted Char";
        margin:0cm;
        font-size:10.0pt;
        font-family:"Courier New";}
span.HTMLPreformattedChar
        {mso-style-name:"HTML Preformatted Char";
        mso-style-priority:99;
        mso-style-link:"HTML Preformatted";
        font-family:Consolas;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;
        mso-ligatures:none;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style>
</head>
<body lang="EN-GB" link="#467886" vlink="#96607D" style="word-wrap:break-word">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:11.0pt;mso-fareast-language:EN-US">Hi Chen,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;mso-fareast-language:EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;mso-fareast-language:EN-US">The performance in the commitmsg of weight_pp for SBD is relative to the removed Neon asm.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;mso-fareast-language:EN-US">The new intrinsics code is faster when CTZ(w0) < shift (e.g. w0 = 127, shift = 6) and equal in other cases.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;mso-fareast-language:EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial",sans-serif;color:#3B3B3B">Relative performance compared to Neon asm [SBD]:<br>
 (w0 = 64)<br>
 Neoverse N1: 1.19x<br>
 Neoverse N2: 1.00x<br>
 Neoverse V1: 1.10x<br>
 Neoverse V2: 1.01x<br>
 (w0 = 127)<br>
 Neoverse N1: 3.05x<br>
 Neoverse N2: 3.63x<br>
 Neoverse V1: 3.25x<br>
 Neoverse V2: 3.58x</span><span style="font-size:11.0pt;mso-fareast-language:EN-US">
<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;mso-fareast-language:EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;mso-fareast-language:EN-US">Regards,<br>
Micro<o:p></o:p></span></p>
<div id="mail-editor-reference-message-container">
<div>
<div>
<div style="border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0cm 0cm 0cm">
<p class="MsoNormal" style="margin-bottom:12.0pt"><b><span style="color:black">From:
</span></b><span style="color:black">chen <chenm003@163.com><br>
<b>Date: </b>Tuesday, 8 April 2025 at 03:32<br>
<b>To: </b>Development for x265 <x265-devel@videolan.org><br>
<b>Cc: </b>nd <nd@arm.com>, Micro Daryl Robles <MicroDaryl.Robles@arm.com><br>
<b>Subject: </b>Re:[x265] [PATCH 0/2] Add Neon impl of planecopy_cp and weight_pp<o:p></o:p></span></p>
</div>
<div>
<div id="spnEditorContent">
<p style="margin:0cm"><span style="font-size:10.5pt;font-family:"Arial",sans-serif;color:black">Hi Micro,<o:p></o:p></span></p>
<p style="margin:0cm"><span style="font-size:10.5pt;font-family:"Arial",sans-serif;color:black"><o:p> </o:p></span></p>
<p style="margin:0cm"><span style="font-size:10.5pt;font-family:"Arial",sans-serif;color:black">How about performance compare to removed weight_pp_neon?<o:p></o:p></span></p>
<p style="margin:0cm"><span style="font-size:10.5pt;font-family:"Arial",sans-serif;color:black"><o:p> </o:p></span></p>
<p style="margin:0cm"><span style="font-size:10.5pt;font-family:"Arial",sans-serif;color:black">Regards,<o:p></o:p></span></p>
<p style="margin:0cm"><span style="font-size:10.5pt;font-family:"Arial",sans-serif;color:black">Chen<o:p></o:p></span></p>
<p style="margin:0cm"><span style="font-size:10.5pt;font-family:"Arial",sans-serif;color:black"><o:p> </o:p></span></p>
</div>
<pre><span style="color:black">At 2025-04-07 18:57:14, "Micro Daryl Robles" <microdaryl.robles@arm.com> wrote:<o:p></o:p></span></pre>
<pre><span style="color:black">>Hi,<o:p></o:p></span></pre>
<pre><span style="color:black">><o:p> </o:p></span></pre>
<pre><span style="color:black">>This patch series adds Neon intrinsic implementations of<o:p></o:p></span></pre>
<pre><span style="color:black">>planecopy_cp and weight_pp that work for both SBD and HBD.<o:p></o:p></span></pre>
<pre><span style="color:black">><o:p> </o:p></span></pre>
<pre><span style="color:black">>This series is based on the master branch.<o:p></o:p></span></pre>
<pre><span style="color:black">><o:p> </o:p></span></pre>
<pre><span style="color:black">>Many thanks,<o:p></o:p></span></pre>
<pre><span style="color:black">>Micro<o:p></o:p></span></pre>
<pre><span style="color:black">><o:p> </o:p></span></pre>
<pre><span style="color:black">>Micro Daryl Robles (2):<o:p></o:p></span></pre>
<pre><span style="color:black">>  AArch64: Add SBD and HBD Neon implementation of planecopy_cp<o:p></o:p></span></pre>
<pre><span style="color:black">>  AArch64: Add SBD and HBD Neon implementation of weight_pp<o:p></o:p></span></pre>
<pre><span style="color:black">><o:p> </o:p></span></pre>
<pre><span style="color:black">> source/common/aarch64/asm-primitives.cpp |   4 -<o:p></o:p></span></pre>
<pre><span style="color:black">> source/common/aarch64/fun-decls.h        |   3 -<o:p></o:p></span></pre>
<pre><span style="color:black">> source/common/aarch64/pixel-prim.cpp     | 183 +++++++++++++++++++++++<o:p></o:p></span></pre>
<pre><span style="color:black">> source/common/aarch64/pixel-util.S       | 144 ------------------<o:p></o:p></span></pre>
<pre><span style="color:black">> source/test/pixelharness.cpp             |  50 +++++--<o:p></o:p></span></pre>
<pre><span style="color:black">> 5 files changed, 217 insertions(+), 167 deletions(-)<o:p></o:p></span></pre>
<pre><span style="color:black">><o:p> </o:p></span></pre>
<pre><span style="color:black">>-- <o:p></o:p></span></pre>
<pre><span style="color:black">>2.34.1<o:p></o:p></span></pre>
<pre><span style="color:black">><o:p> </o:p></span></pre>
<pre><span style="color:black">>_______________________________________________<o:p></o:p></span></pre>
<pre><span style="color:black">>x265-devel mailing list<o:p></o:p></span></pre>
<pre><span style="color:black">>x265-devel@videolan.org<o:p></o:p></span></pre>
<pre><span style="color:black">>https://mailman.videolan.org/listinfo/x265-devel<o:p></o:p></span></pre>
</div>
</div>
</div>
</div>
</div>
IMPORTANT NOTICE: The contents of this email and any attachments are confidential and may also be privileged. If you are not the intended recipient, please notify the sender immediately and do not disclose the contents to any other person, use it for any purpose,
 or store or copy the information in any medium. Thank you.
</body>
</html>