<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:12.0pt;
        font-family:"Calibri",sans-serif;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style>
</head>
<body lang="EN-US" link="#0563C1" vlink="#954F72" style="word-wrap:break-word">
<div class="WordSection1">
<p class="MsoNormal">Hi,<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I have seen on a linux-perf profile that interp_hv_pp_c was still called:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">   0.98%  ffmpeg_g  libx265.so.200  [.] (anonymous namespace)::interp_hv_pp_c<8, 32, 32><o:p></o:p></p>
<p class="MsoNormal">   0.87%  ffmpeg_g  libx265.so.200  [.] (anonymous namespace)::interp_hv_pp_c<8, 16, 16><o:p></o:p></p>
<p class="MsoNormal">   0.25%  ffmpeg_g  libx265.so.200  [.] (anonymous namespace)::interp_hv_pp_c<8, 64, 64><o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">That was due to the fact that some of the kernels for luma_hvpp were disabled.<o:p></o:p></p>
<p class="MsoNormal">The attached patch enables luma_hvpp for all kernel sizes.<o:p></o:p></p>
<p class="MsoNormal">With the patch the profile does not contain calls to interp_hv_pp_c.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">before the patch:<o:p></o:p></p>
<p class="MsoNormal">luma_hv [  8x8]         16.08x   318.26          5117.80<o:p></o:p></p>
<p class="MsoNormal">luma_hv [  8x4]         14.94x   220.35          3292.54<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 8x16]         16.89x   519.45          8773.31<o:p></o:p></p>
<p class="MsoNormal">luma_hv [12x16]         14.70x   962.32          14149.10<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 8x32]         19.10x   917.16          17519.01<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">with the patch:<o:p></o:p></p>
<p class="MsoNormal">luma_hv [  4x4]         8.29x    203.25          1684.26<o:p></o:p></p>
<p class="MsoNormal">luma_hv [  8x8]         15.92x   319.45          5086.50<o:p></o:p></p>
<p class="MsoNormal">luma_hv [16x16]         17.71x   984.39          17429.32<o:p></o:p></p>
<p class="MsoNormal">luma_hv [32x32]         18.54x   3411.28         63255.92<o:p></o:p></p>
<p class="MsoNormal">luma_hv [64x64]         19.29x   12628.54        243586.52<o:p></o:p></p>
<p class="MsoNormal">luma_hv [  8x4]         14.89x   219.60          3268.85<o:p></o:p></p>
<p class="MsoNormal">luma_hv [  4x8]         8.75x    297.49          2602.33<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 16x8]         16.86x   598.21          10085.83<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 8x16]         16.68x   520.16          8678.79<o:p></o:p></p>
<p class="MsoNormal">luma_hv [32x16]         18.16x   1906.65         34631.16<o:p></o:p></p>
<p class="MsoNormal">luma_hv [16x32]         17.31x   1842.00         31880.58<o:p></o:p></p>
<p class="MsoNormal">luma_hv [64x32]         19.03x   6696.71         127412.67<o:p></o:p></p>
<p class="MsoNormal">luma_hv [32x64]         19.02x   6406.64         121846.34<o:p></o:p></p>
<p class="MsoNormal">luma_hv [16x12]         17.40x   791.32          13772.11<o:p></o:p></p>
<p class="MsoNormal">luma_hv [12x16]         13.54x   964.49          13058.28<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 16x4]         15.78x   410.06          6469.77<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 4x16]         9.22x    482.95          4450.62<o:p></o:p></p>
<p class="MsoNormal">luma_hv [32x24]         18.39x   2661.41         48955.65<o:p></o:p></p>
<p class="MsoNormal">luma_hv [24x32]         18.51x   2585.15         47854.70<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 32x8]         17.49x   1150.18         20111.31<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 8x32]         17.36x   921.36          15992.87<o:p></o:p></p>
<p class="MsoNormal">luma_hv [64x48]         19.21x   9635.09         185077.92<o:p></o:p></p>
<p class="MsoNormal">luma_hv [48x64]         19.13x   9513.58         181971.16<o:p></o:p></p>
<p class="MsoNormal">luma_hv [64x16]         18.52x   3729.03         69050.16<o:p></o:p></p>
<p class="MsoNormal">luma_hv [16x64]         18.49x   3308.71         61182.30<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><span style="color:black">Ok to commit?</span><span style="font-size:12.0pt;color:black"><o:p></o:p></span></p>
<p class="MsoNormal" style="caret-color: rgb(0, 0, 0);font-variant-caps: normal;orphans: auto;text-align:start;widows: auto;-webkit-text-size-adjust: auto;-webkit-text-stroke-width: 0px;word-spacing:0px">
<span style="color:black"> </span><span style="font-size:12.0pt;color:black"><o:p></o:p></span></p>
<p class="MsoNormal" style="caret-color: rgb(0, 0, 0);font-variant-caps: normal;orphans: auto;text-align:start;widows: auto;-webkit-text-size-adjust: auto;-webkit-text-stroke-width: 0px;word-spacing:0px">
<span style="color:black">Thanks,</span><span style="font-size:12.0pt;color:black"><o:p></o:p></span></p>
<p class="MsoNormal" style="caret-color: rgb(0, 0, 0);font-variant-caps: normal;orphans: auto;text-align:start;widows: auto;-webkit-text-size-adjust: auto;-webkit-text-stroke-width: 0px;word-spacing:0px">
<span style="color:black">Sebastian</span><span style="font-size:12.0pt;color:black"><o:p></o:p></span></p>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
</body>
</html>