<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        font-size:12.0pt;
        font-family:"Calibri",sans-serif;}
span.EmailStyle19
        {mso-style-type:personal-reply;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style>
</head>
<body lang="EN-US" link="#0563C1" vlink="#954F72" style="word-wrap:break-word">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:11.0pt">Now with the patch attached.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
<div style="border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in">
<p class="MsoNormal"><b><span style="color:black">From: </span></b><span style="color:black">"Pop, Sebastian" <spop@amazon.com><br>
<b>Date: </b>Friday, July 9, 2021 at 7:03 PM<br>
<b>To: </b>"x265-devel@videolan.org" <x265-devel@videolan.org><br>
<b>Subject: </b>[arm64] improve luma_hps<o:p></o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
</div>
<p class="MsoNormal"><span style="font-size:11.0pt;color:black">Hi,</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">the attached patch improves the existing implementation of luma_hps as follows:</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt"> </span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">before the patch:</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[  4x4]         7.26x    155.66          1130.24</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[  8x8]         13.19x   229.34          3025.77</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[  8x4]         12.82x   170.88          2190.91</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[  4x8]         7.39x    209.01          1544.11</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[ 8x16]         13.33x   346.17          4614.47</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[12x16]         10.92x   628.93          6869.03</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[ 4x16]         7.42x    316.50          2348.13</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[24x32]         14.09x   1627.97         22935.64</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[ 8x32]         13.48x   579.82          7815.91</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt"> </span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">with the patch:</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[  4x4]         7.25x    154.91          1123.54</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[  8x8]         13.25x   229.03          3033.61</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[16x16]         13.90x   655.11          9105.27</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[32x32]         14.20x   2154.92         30597.96</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[64x64]         14.57x   7626.98         111121.77</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[  8x4]         12.98x   170.83          2218.02</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[  4x8]         7.38x    209.01          1543.31</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[ 16x8]         13.91x   427.22          5942.64</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[ 8x16]         13.31x   346.14          4607.25</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[32x16]         14.29x   1263.49         18052.49</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[16x32]         14.08x   1097.46         15447.23</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[64x32]         14.33x   4257.39         60995.71</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[32x64]         14.38x   3860.87         55516.82</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[16x12]         14.15x   533.02          7541.39</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[12x16]         10.92x   628.27          6861.97</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[ 16x4]         13.94x   312.73          4360.99</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[ 4x16]         7.44x    316.14          2352.54</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[32x24]         14.37x   1695.62         24370.08</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[24x32]         14.08x   1628.42         22924.21</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[ 32x8]         14.27x   821.42          11721.52</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[ 8x32]         13.49x   579.23          7815.46</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[64x48]         14.60x   5892.16         86022.95</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[48x64]         14.59x   5724.71         83546.84</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[64x16]         14.50x   2484.56         36024.81</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt">luma_hps[16x64]         14.15x   1979.60         28009.11</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt"> </span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt;color:black">Ok to commit?</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt;color:black"> </span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt;color:black">Thanks,</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt;color:black">Sebastian</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt"> </span><o:p></o:p></p>
</div>
</body>
</html>