<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<style type="text/css" style="display:none;"> P {margin-top:0;margin-bottom:0;} </style>
</head>
<body dir="ltr">
<div class="elementToProof" style="font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
Hi,</div>
<div class="elementToProof" style="font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
<br>
</div>
<div class="elementToProof" style="font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
Could someone take a look at these patches please?</div>
<div class="elementToProof" style="font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
<br>
</div>
<div class="elementToProof" style="font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
Thanks,</div>
<div class="elementToProof" style="font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
Jonathan</div>
<div id="appendonsend"></div>
<hr style="display:inline-block;width:98%" tabindex="-1">
<div id="divRplyFwdMsg" dir="ltr"><font face="Calibri, sans-serif" style="font-size:11pt" color="#000000"><b>From:</b> x265-devel <x265-devel-bounces@videolan.org> on behalf of Jonathan Wright <jonathan.wright@arm.com><br>
<b>Sent:</b> 10 June 2025 18:40<br>
<b>To:</b> x265-devel@videolan.org <x265-devel@videolan.org><br>
<b>Cc:</b> nd <nd@arm.com><br>
<b>Subject:</b> [x265] [PATCH 0/2] AArch64: Fix SVE DCT implementations</font>
<div> </div>
</div>
<div class="BodyFragment"><font size="2"><span style="font-size:11pt;">
<div class="PlainText">Hi,<br>
<br>
This patch series fixes bugs in the Arm SVE 16x16 and 32x32 DCT<br>
implementations, and also mitigates a portion of the performance<br>
regression due to the fix. Both SVE DCT implementations are still<br>
sgnificantly faster than the equivalent Neon paths.<br>
<br>
Note that the DCT unit tests did not show these bugs. They were found<br>
after differences in encoded output videos were observed on Arm and<br>
x86 for veryslow, slower and slow encoding presets. With these patches<br>
applied encoded output matches for all speed presets.<br>
<br>
Thanks,<br>
Jonathan<br>
<br>
Jonathan Wright (2):<br>
  AArch64: Fix SVE 16x16 and 32x32 DCT implementations<br>
  AArch64: Specialize passes of 16x16 and 32x32 SVE DCTs<br>
<br>
 source/common/aarch64/dct-prim-sve.cpp | 338 ++++++++++++++++++++++---<br>
 1 file changed, 306 insertions(+), 32 deletions(-)<br>
<br>
-- <br>
2.39.5 (Apple Git-154)<br>
<br>
_______________________________________________<br>
x265-devel mailing list<br>
x265-devel@videolan.org<br>
<a href="https://mailman.videolan.org/listinfo/x265-devel">https://mailman.videolan.org/listinfo/x265-devel</a><br>
</div>
</span></font></div>
IMPORTANT NOTICE: The contents of this email and any attachments are confidential and may also be privileged. If you are not the intended recipient, please notify the sender immediately and do not disclose the contents to any other person, use it for any purpose,
 or store or copy the information in any medium. Thank you.
</body>
</html>