<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        font-size:12.0pt;
        font-family:"Calibri",sans-serif;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:12.0pt;
        font-family:"Calibri",sans-serif;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style>
</head>
<body lang="EN-US" link="#0563C1" vlink="#954F72" style="word-wrap:break-word">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:11.0pt">Hi,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Part of using the x86 macros to register the functions makes it possible to automatically spot those functions that were not yet implemented.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">The attached patch adds the following missing kernels:<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[  2x4]               7.23x    7.77            56.14<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[  2x4]               7.36x    7.82            57.53<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[  2x8]               9.33x    11.42           106.57<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[  2x8]               11.46x   11.40           130.65<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[ 2x16]               12.81x   20.87           267.46<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[ 2x16]               13.18x   20.45           269.52<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[  4x2]               9.27x    5.94            55.11<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[  4x2]               9.26x    6.05            56.01<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[ 4x32]               28.73x   30.52           876.99<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[ 4x32]               33.27x   30.85           1026.31<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[  6x8]               15.33x   19.92           305.40<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[  6x8]               15.41x   19.92           306.91<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[ 6x16]               16.28x   37.47           609.82<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[ 6x16]               16.53x   37.42           618.63<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[  8x2]               17.47x   5.87            102.58<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[  8x2]               16.97x   5.95            100.98<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[  8x6]               36.08x   8.35            301.40<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[  8x6]               35.69x   8.39            299.25<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[ 8x12]               45.62x   13.12           598.47<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[ 8x12]               46.13x   13.09           603.87<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[ 8x64]               51.21x   62.76           3214.13<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[ 8x64]               52.85x   62.51           3303.60<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[12x32]               45.45x   52.36           2379.91<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[12x32]               45.66x   51.82           2365.99<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[16x24]               59.90x   39.38           2358.73<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[16x24]               59.66x   39.39           2350.24<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[24x64]               59.29x   159.27          9444.02<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[24x64]               59.44x   159.39          9473.78<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s[32x48]               59.84x   155.86          9326.65<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">chroma_p2s_aligned[32x48]               59.81x   155.81          9318.74<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">The patch also makes use of the macros to declare the functions.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">That makes it much easier to see through the include file.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Ok to commit?<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Thanks,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Sebastian<o:p></o:p></span></p>
</div>
</body>
</html>