<div dir="ltr">Updated this patch on tip.<div><br></div><div><br></div><div>Thanks,</div><div>Praveen</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Tue, Mar 10, 2015 at 10:53 AM,  <span dir="ltr"><<a href="mailto:praveen@multicorewareinc.com" target="_blank">praveen@multicorewareinc.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"># HG changeset patch<br>
# User Praveen Tiwari <<a href="mailto:praveen@multicorewareinc.com">praveen@multicorewareinc.com</a>><br>
# Date 1425964751 -19800<br>
# Node ID f97dfb483647d573cbcab9a4f007ac2aa89c9066<br>
# Parent  726fe4088f31710af174c18b1e26fdc759efb300<br>
asm-avx2: inra_pred, align const<br>
<br>
diff -r 726fe4088f31 -r f97dfb483647 source/common/x86/intrapred8.asm<br>
--- a/source/common/x86/intrapred8.asm  Mon Mar 09 19:21:25 2015 -0500<br>
+++ b/source/common/x86/intrapred8.asm  Tue Mar 10 10:49:11 2015 +0530<br>
@@ -26,6 +26,8 @@<br>
<br>
 SECTION_RODATA 32<br>
<br>
+intra_pred_shuff_0_8:    times 2 db 0, 1, 1, 2, 2, 3, 3, 4, 4, 5, 5, 6, 6, 7, 7, 8<br>
+<br>
 pb_0_8        times 8 db  0,  8<br>
 pb_unpackbw1  times 2 db  1,  8,  2,  8,  3,  8,  4,  8<br>
 pb_swap8:     times 2 db  7,  6,  5,  4,  3,  2,  1,  0<br>
@@ -83,7 +85,6 @@<br>
 c_ang8_7_20:          db 25, 7, 25, 7, 25, 7, 25, 7, 25, 7, 25, 7, 25, 7, 25, 7, 12, 20, 12, 20, 12, 20, 12, 20, 12, 20, 12, 20, 12, 20, 12, 20<br>
 c_ang8_1_14:          db 31, 1, 31, 1, 31, 1, 31, 1, 31, 1, 31, 1, 31, 1, 31, 1, 18, 14, 18, 14, 18, 14, 18, 14, 18, 14, 18, 14, 18, 14, 18, 14<br>
 c_ang8_27_8:          db 5, 27, 5, 27, 5, 27, 5, 27, 5, 27, 5, 27, 5, 27, 5, 27, 24, 8, 24, 8, 24, 8, 24, 8, 24, 8, 24, 8, 24, 8, 24, 8<br>
-c_ang8_src1_9_1_9:    db 0, 1, 1, 2, 2, 3, 3, 4, 4, 5, 5, 6, 6, 7, 7, 8, 0, 1, 1, 2, 2, 3, 3, 4, 4, 5, 5, 6, 6, 7, 7, 8<br>
 c_ang8_src2_10_2_10:  db 1, 2, 2, 3, 3, 4, 4, 5, 5, 6, 6, 7, 7, 8, 8, 9, 1, 2, 2, 3, 3, 4, 4, 5, 5, 6, 6, 7, 7, 8, 8, 9<br>
 c_ang8_src3_11_3_11:  db 2, 3, 3, 4, 4, 5, 5, 6, 6, 7, 7, 8, 8, 9, 9, 10, 2, 3, 3, 4, 4, 5, 5, 6, 6, 7, 7, 8, 8, 9, 9, 10<br>
<br>
@@ -9968,7 +9969,7 @@<br>
     mova              m3, [pw_1024]<br>
     vbroadcasti128    m0, [r2 + 17]<br>
<br>
-    pshufb            m1, m0, [c_ang8_src1_9_1_9]<br>
+    pshufb            m1, m0, [intra_pred_shuff_0_8]<br>
     pshufb            m2, m0, [c_ang8_src2_10_2_10]<br>
     pshufb            m4, m0, [c_ang8_src3_11_3_11]<br>
     pshufb            m0,     [c_ang8_src3_11_4_12]<br>
@@ -10013,7 +10014,7 @@<br>
     mova              m3, [pw_1024]<br>
     vbroadcasti128    m0, [r2 + 1]<br>
<br>
-    pshufb            m1, m0, [c_ang8_src1_9_1_9]<br>
+    pshufb            m1, m0, [intra_pred_shuff_0_8]<br>
     pshufb            m2, m0, [c_ang8_src2_10_2_10]<br>
     pshufb            m4, m0, [c_ang8_src3_11_3_11]<br>
     pshufb            m0,     [c_ang8_src3_11_4_12]<br>
@@ -10045,12 +10046,11 @@<br>
<br>
<br>
 INIT_YMM avx2<br>
-cglobal intra_pred_ang8_9, 3, 5, 6<br>
+cglobal intra_pred_ang8_9, 3, 5, 5<br>
     mova              m3, [pw_1024]<br>
     vbroadcasti128    m0, [r2 + 17]<br>
-    movu              m5, [c_ang8_src1_9_1_9]<br>
-<br>
-    pshufb            m0, m5<br>
+<br>
+    pshufb            m0, [intra_pred_shuff_0_8]<br>
<br>
     lea               r4, [c_ang8_mode_27]<br>
     pmaddubsw         m1, m0, [r4]<br>
@@ -10089,12 +10089,11 @@<br>
     RET<br>
<br>
 INIT_YMM avx2<br>
-cglobal intra_pred_ang8_27, 3, 5, 6<br>
+cglobal intra_pred_ang8_27, 3, 5, 5<br>
     mova              m3, [pw_1024]<br>
     vbroadcasti128    m0, [r2 + 1]<br>
-    movu              m5, [c_ang8_src1_9_1_9]<br>
-<br>
-    pshufb            m0, m5<br>
+<br>
+    pshufb            m0, [intra_pred_shuff_0_8]<br>
<br>
     lea               r4, [c_ang8_mode_27]<br>
     pmaddubsw         m1, m0, [r4]<br>
@@ -10123,12 +10122,11 @@<br>
     RET<br>
<br>
 INIT_YMM avx2<br>
-cglobal intra_pred_ang8_25, 3, 5, 6<br>
+cglobal intra_pred_ang8_25, 3, 5, 5<br>
     mova              m3, [pw_1024]<br>
     vbroadcasti128    m0, [r2]<br>
-    mova              m5, [c_ang8_src1_9_1_9]<br>
-<br>
-    pshufb            m0, m5<br>
+<br>
+    pshufb            m0, [intra_pred_shuff_0_8]<br>
<br>
     lea               r4, [c_ang8_mode_25]<br>
     pmaddubsw         m1, m0, [r4]<br>
@@ -10162,7 +10160,7 @@<br>
     mova              m3, [pw_1024]<br>
     vbroadcasti128    m0, [r2 + 17]<br>
<br>
-    pshufb            m1, m0, [c_ang8_src1_9_1_9]<br>
+    pshufb            m1, m0, [intra_pred_shuff_0_8]<br>
     pshufb            m2, m0, [c_ang8_src1_9_2_10]<br>
     pshufb            m4, m0, [c_ang8_src2_10_2_10]<br>
     pshufb            m0,     [c_ang8_src2_10_3_11]<br>
@@ -10207,7 +10205,7 @@<br>
     mova              m3, [pw_1024]<br>
     vbroadcasti128    m0, [r2 + 1]<br>
<br>
-    pshufb            m1, m0, [c_ang8_src1_9_1_9]<br>
+    pshufb            m1, m0, [intra_pred_shuff_0_8]<br>
     pshufb            m2, m0, [c_ang8_src1_9_2_10]<br>
     pshufb            m4, m0, [c_ang8_src2_10_2_10]<br>
     pshufb            m0,     [c_ang8_src2_10_3_11]<br>
@@ -10242,7 +10240,7 @@<br>
 cglobal intra_pred_ang8_8, 3, 4, 6<br>
     mova              m3, [pw_1024]<br>
     vbroadcasti128    m0, [r2 + 17]<br>
-    movu              m5, [c_ang8_src1_9_1_9]<br>
+    mova              m5, [intra_pred_shuff_0_8]<br>
<br>
     pshufb            m1, m0, m5<br>
     pshufb            m2, m0, m5<br>
@@ -10288,7 +10286,7 @@<br>
 cglobal intra_pred_ang8_28, 3, 4, 6<br>
     mova              m3, [pw_1024]<br>
     vbroadcasti128    m0, [r2 + 1]<br>
-    movu              m5, [c_ang8_src1_9_1_9]<br>
+    mova              m5, [intra_pred_shuff_0_8]<br>
<br>
     pshufb            m1, m0, m5<br>
     pshufb            m2, m0, m5<br>
</blockquote></div><br></div>