<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
{font-family:"Cambria Math";
panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
{font-family:Calibri;
panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
{margin:0in;
font-size:11.0pt;
font-family:"Calibri",sans-serif;}
span.EmailStyle17
{mso-style-type:personal-compose;
font-family:"Calibri",sans-serif;
color:windowtext;}
.MsoChpDefault
{mso-style-type:export-only;
font-size:12.0pt;
font-family:"Calibri",sans-serif;}
@page WordSection1
{size:8.5in 11.0in;
margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
{page:WordSection1;}
--></style>
</head>
<body lang="EN-US" link="#0563C1" vlink="#954F72" style="word-wrap:break-word">
<div class="WordSection1">
<p class="MsoNormal">Hi,<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I have seen on a linux-perf profile that interp_hv_pp_c was still called:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"> 0.98% ffmpeg_g libx265.so.200 [.] (anonymous namespace)::interp_hv_pp_c<8, 32, 32><o:p></o:p></p>
<p class="MsoNormal"> 0.87% ffmpeg_g libx265.so.200 [.] (anonymous namespace)::interp_hv_pp_c<8, 16, 16><o:p></o:p></p>
<p class="MsoNormal"> 0.25% ffmpeg_g libx265.so.200 [.] (anonymous namespace)::interp_hv_pp_c<8, 64, 64><o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">That was due to the fact that some of the kernels for luma_hvpp were disabled.<o:p></o:p></p>
<p class="MsoNormal">The attached patch enables luma_hvpp for all kernel sizes.<o:p></o:p></p>
<p class="MsoNormal">With the patch the profile does not contain calls to interp_hv_pp_c.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">before the patch:<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 8x8] 16.08x 318.26 5117.80<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 8x4] 14.94x 220.35 3292.54<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 8x16] 16.89x 519.45 8773.31<o:p></o:p></p>
<p class="MsoNormal">luma_hv [12x16] 14.70x 962.32 14149.10<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 8x32] 19.10x 917.16 17519.01<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">with the patch:<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 4x4] 8.29x 203.25 1684.26<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 8x8] 15.92x 319.45 5086.50<o:p></o:p></p>
<p class="MsoNormal">luma_hv [16x16] 17.71x 984.39 17429.32<o:p></o:p></p>
<p class="MsoNormal">luma_hv [32x32] 18.54x 3411.28 63255.92<o:p></o:p></p>
<p class="MsoNormal">luma_hv [64x64] 19.29x 12628.54 243586.52<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 8x4] 14.89x 219.60 3268.85<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 4x8] 8.75x 297.49 2602.33<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 16x8] 16.86x 598.21 10085.83<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 8x16] 16.68x 520.16 8678.79<o:p></o:p></p>
<p class="MsoNormal">luma_hv [32x16] 18.16x 1906.65 34631.16<o:p></o:p></p>
<p class="MsoNormal">luma_hv [16x32] 17.31x 1842.00 31880.58<o:p></o:p></p>
<p class="MsoNormal">luma_hv [64x32] 19.03x 6696.71 127412.67<o:p></o:p></p>
<p class="MsoNormal">luma_hv [32x64] 19.02x 6406.64 121846.34<o:p></o:p></p>
<p class="MsoNormal">luma_hv [16x12] 17.40x 791.32 13772.11<o:p></o:p></p>
<p class="MsoNormal">luma_hv [12x16] 13.54x 964.49 13058.28<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 16x4] 15.78x 410.06 6469.77<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 4x16] 9.22x 482.95 4450.62<o:p></o:p></p>
<p class="MsoNormal">luma_hv [32x24] 18.39x 2661.41 48955.65<o:p></o:p></p>
<p class="MsoNormal">luma_hv [24x32] 18.51x 2585.15 47854.70<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 32x8] 17.49x 1150.18 20111.31<o:p></o:p></p>
<p class="MsoNormal">luma_hv [ 8x32] 17.36x 921.36 15992.87<o:p></o:p></p>
<p class="MsoNormal">luma_hv [64x48] 19.21x 9635.09 185077.92<o:p></o:p></p>
<p class="MsoNormal">luma_hv [48x64] 19.13x 9513.58 181971.16<o:p></o:p></p>
<p class="MsoNormal">luma_hv [64x16] 18.52x 3729.03 69050.16<o:p></o:p></p>
<p class="MsoNormal">luma_hv [16x64] 18.49x 3308.71 61182.30<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><span style="color:black">Ok to commit?</span><span style="font-size:12.0pt;color:black"><o:p></o:p></span></p>
<p class="MsoNormal" style="caret-color: rgb(0, 0, 0);font-variant-caps: normal;orphans: auto;text-align:start;widows: auto;-webkit-text-size-adjust: auto;-webkit-text-stroke-width: 0px;word-spacing:0px">
<span style="color:black"> </span><span style="font-size:12.0pt;color:black"><o:p></o:p></span></p>
<p class="MsoNormal" style="caret-color: rgb(0, 0, 0);font-variant-caps: normal;orphans: auto;text-align:start;widows: auto;-webkit-text-size-adjust: auto;-webkit-text-stroke-width: 0px;word-spacing:0px">
<span style="color:black">Thanks,</span><span style="font-size:12.0pt;color:black"><o:p></o:p></span></p>
<p class="MsoNormal" style="caret-color: rgb(0, 0, 0);font-variant-caps: normal;orphans: auto;text-align:start;widows: auto;-webkit-text-size-adjust: auto;-webkit-text-stroke-width: 0px;word-spacing:0px">
<span style="color:black">Sebastian</span><span style="font-size:12.0pt;color:black"><o:p></o:p></span></p>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
</body>
</html>