<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
{font-family:"Cambria Math";
panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
{font-family:Calibri;
panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
{margin:0in;
font-size:12.0pt;
font-family:"Calibri",sans-serif;}
span.EmailStyle17
{mso-style-type:personal-compose;
font-family:"Calibri",sans-serif;
color:windowtext;}
.MsoChpDefault
{mso-style-type:export-only;
font-size:12.0pt;
font-family:"Calibri",sans-serif;}
@page WordSection1
{size:8.5in 11.0in;
margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
{page:WordSection1;}
--></style>
</head>
<body lang="EN-US" link="#0563C1" vlink="#954F72" style="word-wrap:break-word">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:11.0pt">Hi,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Part of using the x86 macros to register the functions makes it possible to automatically spot those functions that were not yet implemented.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">The attached patch adds the following missing kernels:<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[ 2x4] 7.23x 7.77 56.14<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[ 2x4] 7.36x 7.82 57.53<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[ 2x8] 9.33x 11.42 106.57<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[ 2x8] 11.46x 11.40 130.65<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[ 2x16] 12.81x 20.87 267.46<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[ 2x16] 13.18x 20.45 269.52<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[ 4x2] 9.27x 5.94 55.11<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[ 4x2] 9.26x 6.05 56.01<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[ 4x32] 28.73x 30.52 876.99<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[ 4x32] 33.27x 30.85 1026.31<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[ 6x8] 15.33x 19.92 305.40<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[ 6x8] 15.41x 19.92 306.91<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[ 6x16] 16.28x 37.47 609.82<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[ 6x16] 16.53x 37.42 618.63<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[ 8x2] 17.47x 5.87 102.58<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[ 8x2] 16.97x 5.95 100.98<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[ 8x6] 36.08x 8.35 301.40<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[ 8x6] 35.69x 8.39 299.25<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[ 8x12] 45.62x 13.12 598.47<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[ 8x12] 46.13x 13.09 603.87<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[ 8x64] 51.21x 62.76 3214.13<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[ 8x64] 52.85x 62.51 3303.60<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[12x32] 45.45x 52.36 2379.91<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[12x32] 45.66x 51.82 2365.99<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[16x24] 59.90x 39.38 2358.73<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[16x24] 59.66x 39.39 2350.24<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[24x64] 59.29x 159.27 9444.02<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[24x64] 59.44x 159.39 9473.78<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[32x48] 59.84x 155.86 9326.65<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[32x48] 59.81x 155.81 9318.74<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">The patch also makes use of the macros to declare the functions.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">That makes it much easier to see through the include file.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Ok to commit?<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Thanks,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Sebastian<o:p></o:p></span></p>
</div>
</body>
</html>