<div dir="ltr"><div class="gmail_extra"><br><div class="gmail_quote">On Tue, Nov 21, 2017 at 10:37 AM, <span dir="ltr"><<a href="mailto:vignesh@multicorewareinc.com" target="_blank">vignesh@multicorewareinc.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"># HG changeset patch<br>
# User Vignesh Vijayakumar<<a href="mailto:vignesh@multicorewareinc.com">vignesh@<wbr>multicorewareinc.com</a>><br>
# Date 1509595798 -19800<br>
# Thu Nov 02 09:39:58 2017 +0530<br>
# Node ID 182bfd0d5af929a801a08b35ee863d<wbr>79eadb2833<br>
# Parent dae558b40d9901d5498bb989c96ae8<wbr>acc5b63cdf<br>
x86: Modify asm codes for NASM compatibility<br></blockquote><div><br></div><div>Pushed series to default branch.</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
diff -r dae558b40d99 -r 182bfd0d5af9 source/common/x86/blockcopy8.<wbr>asm<br>
--- a/source/common/x86/<wbr>blockcopy8.asm Tue Nov 21 09:40:16 2017 +0530<br>
+++ b/source/common/x86/<wbr>blockcopy8.asm Thu Nov 02 09:39:58 2017 +0530<br>
@@ -3850,7 +3850,7 @@<br>
mov r4d, %2/4<br>
add r1, r1<br>
add r3, r3<br>
-.loop<br>
+.loop:<br>
movu m0, [r2]<br>
movu m1, [r2 + 16]<br>
movu m2, [r2 + 32]<br>
@@ -3905,7 +3905,7 @@<br>
lea r5, [3 * r3]<br>
lea r6, [3 * r1]<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r2]<br>
movu xm1, [r2 + 32]<br>
movu [r0], m0<br>
@@ -5085,7 +5085,7 @@<br>
pxor m4, m4<br>
pxor m5, m5<br>
<br>
-.loop<br>
+.loop:<br>
; row 0<br>
movu m0, [r1]<br>
movu m1, [r1 + 16]<br>
@@ -5196,7 +5196,7 @@<br>
pxor m4, m4<br>
pxor m5, m5<br>
<br>
-.loop<br>
+.loop:<br>
; row 0<br>
movu m0, [r1]<br>
movu m1, [r1 + 16]<br>
diff -r dae558b40d99 -r 182bfd0d5af9 source/common/x86/intrapred8.<wbr>asm<br>
--- a/source/common/x86/<wbr>intrapred8.asm Tue Nov 21 09:40:16 2017 +0530<br>
+++ b/source/common/x86/<wbr>intrapred8.asm Thu Nov 02 09:39:58 2017 +0530<br>
@@ -2148,7 +2148,7 @@<br>
paddw m0, m1<br>
packuswb m0, m0<br>
<br>
- movd r2, m0<br>
+ movd r2d, m0<br>
mov [r0], r2b<br>
shr r2, 8<br>
mov [r0 + r1], r2b<br>
diff -r dae558b40d99 -r 182bfd0d5af9 source/common/x86/ipfilter16.<wbr>asm<br>
--- a/source/common/x86/<wbr>ipfilter16.asm Tue Nov 21 09:40:16 2017 +0530<br>
+++ b/source/common/x86/<wbr>ipfilter16.asm Thu Nov 02 09:39:58 2017 +0530<br>
@@ -9103,7 +9103,7 @@<br>
; load constant<br>
mova m2, [pw_2000]<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r0]<br>
movu m1, [r0 + r1]<br>
psllw m0, (14 - BIT_DEPTH)<br>
@@ -9156,7 +9156,7 @@<br>
; load constant<br>
mova m1, [pw_2000]<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r0]<br>
psllw m0, (14 - BIT_DEPTH)<br>
psubw m0, m1<br>
@@ -9277,7 +9277,7 @@<br>
; load constant<br>
mova m2, [pw_2000]<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r0]<br>
movu m1, [r0 + r1]<br>
psllw m0, (14 - BIT_DEPTH)<br>
@@ -9351,7 +9351,7 @@<br>
; load constant<br>
mova m2, [pw_2000]<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r0]<br>
movu m1, [r0 + r1]<br>
psllw m0, (14 - BIT_DEPTH)<br>
@@ -9405,7 +9405,7 @@<br>
; load constant<br>
mova m4, [pw_2000]<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r0]<br>
movu m1, [r0 + r1]<br>
movu m2, [r0 + r1 * 2]<br>
@@ -9510,7 +9510,7 @@<br>
; load constant<br>
mova m2, [pw_2000]<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r0]<br>
movu m1, [r0 + r1]<br>
psllw m0, (14 - BIT_DEPTH)<br>
@@ -9583,7 +9583,7 @@<br>
; load constant<br>
mova m4, [pw_2000]<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r0]<br>
movu m1, [r0 + r1]<br>
movu m2, [r0 + r1 * 2]<br>
@@ -9758,7 +9758,7 @@<br>
; load constant<br>
mova m2, [pw_2000]<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r0]<br>
movu m1, [r0 + r1]<br>
psllw m0, (14 - BIT_DEPTH)<br>
@@ -9869,7 +9869,7 @@<br>
; load constant<br>
mova m4, [pw_2000]<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r0]<br>
movu m1, [r0 + r1]<br>
movu m2, [r0 + r1 * 2]<br>
@@ -9952,7 +9952,7 @@<br>
; load constant<br>
mova m2, [pw_2000]<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r0]<br>
movu m1, [r0 + 32]<br>
psllw m0, (14 - BIT_DEPTH)<br>
@@ -10017,7 +10017,7 @@<br>
; load constant<br>
mova m2, [pw_2000]<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r0]<br>
movu m1, [r0 + r1]<br>
psllw m0, (14 - BIT_DEPTH)<br>
@@ -10081,7 +10081,7 @@<br>
; load constant<br>
mova m4, [pw_2000]<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r0]<br>
movu m1, [r0 + r1]<br>
movu m2, [r0 + r1 * 2]<br>
@@ -10214,7 +10214,7 @@<br>
; load constant<br>
mova m3, [pw_2000]<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r0]<br>
movu m1, [r0 + 32]<br>
movu m2, [r0 + 64]<br>
@@ -10314,7 +10314,7 @@<br>
<br>
.preloop:<br>
lea r6, [r3 * 3]<br>
-.loop<br>
+.loop:<br>
; Row 0<br>
movu xm3, [r0] ; [x x x x x A 9 8 7 6 5 4 3 2 1 0]<br>
movu xm4, [r0 + 2] ; [x x x x x A 9 8 7 6 5 4 3 2 1 0]<br>
@@ -10381,7 +10381,7 @@<br>
packssdw xm4, xm4<br>
<br>
movq [r2], xm3 ;row 0<br>
-.end<br>
+.end:<br>
RET<br>
%endif<br>
%endmacro<br>
diff -r dae558b40d99 -r 182bfd0d5af9 source/common/x86/ipfilter8.<wbr>asm<br>
--- a/source/common/x86/ipfilter8.<wbr>asm Tue Nov 21 09:40:16 2017 +0530<br>
+++ b/source/common/x86/ipfilter8.<wbr>asm Thu Nov 02 09:39:58 2017 +0530<br>
@@ -324,7 +324,7 @@<br>
paddw m0, m5<br>
psraw m0, 6<br>
packuswb m0, m0<br>
- movd r4, m0<br>
+ movd r4d, m0<br>
mov [dstq], r4w<br>
shr r4, 16<br>
mov [dstq + dststrideq], r4w<br>
@@ -3471,7 +3471,7 @@<br>
phaddw %2, %2<br>
pmulhrsw %2, %3<br>
packuswb %2, %2<br>
- movd r4, %2<br>
+ movd r4d, %2<br>
mov [dstq], r4w<br>
shr r4, 16<br>
mov [dstq + dststrideq], r4w<br>
@@ -5336,7 +5336,7 @@<br>
sub r0 , r1<br>
add r6d , 3<br>
<br>
-.loop<br>
+.loop:<br>
; Row 0<br>
vbroadcasti128 m3, [r0] ; [x x x x x A 9 8 7 6 5 4 3 2 1 0]<br>
pshufb m3, m1<br>
@@ -5441,7 +5441,7 @@<br>
<br>
.preloop:<br>
lea r6, [r3 * 3]<br>
-.loop<br>
+.loop:<br>
; Row 0-1<br>
vbroadcasti128 m3, [r0] ; [x x x x x A 9 8 7 6 5 4 3 2 1 0]<br>
pshufb m3, m1 ; shuffled based on the col order tab_Lm<br>
@@ -5502,7 +5502,7 @@<br>
movq [r2], xm3<br>
movhps [r2 + r3], xm3<br>
movq [r2 + r3 * 2], xm4<br>
-.end<br>
+.end:<br>
RET<br>
%endif<br>
%endmacro<br>
@@ -5592,7 +5592,7 @@<br>
paddw xm1, xm2<br>
psubw xm1, xm0<br>
movu [r2], xm1 ;row 0<br>
-.end<br>
+.end:<br>
RET<br>
%endif<br>
%endmacro ; IPFILTER_LUMA_PS_8xN_AVX2<br>
@@ -5634,7 +5634,7 @@<br>
sub r0, r8 ; r0(src)-r8<br>
add r9, 7 ; blkheight += N - 1 (7 - 1 = 6 ; since the last one row not in loop)<br>
<br>
-.label<br>
+.label:<br>
; Row 0<br>
vbroadcasti128 m3, [r0] ; [x x x x x A 9 8 7 6 5 4 3 2 1 0]<br>
pshufb m4, m3, m6 ; row 0 (col 4 to 7)<br>
@@ -12374,7 +12374,7 @@<br>
mova m4, [pb_128]<br>
mova m5, [tab_c_64_n64]<br>
<br>
-.loop<br>
+.loop:<br>
movh m0, [r0]<br>
punpcklbw m0, m4<br>
pmaddubsw m0, m5<br>
@@ -25491,7 +25491,7 @@<br>
sub r0, r1<br>
add r4d, 3<br>
<br>
-.loop<br>
+.loop:<br>
; Row 0<br>
movu m2, [r0]<br>
movu m3, [r0 + 1]<br>
@@ -25553,7 +25553,7 @@<br>
sub r0 , r1<br>
add r6d , 3<br>
<br>
-.loop<br>
+.loop:<br>
; Row 0<br>
vbroadcasti128 m3, [r0] ; [x x x x x A 9 8 7 6 5 4 3 2 1 0]<br>
pshufb m3, m1<br>
@@ -25607,7 +25607,7 @@<br>
sub r0 , r1<br>
add r6d , 3<br>
<br>
-.loop<br>
+.loop:<br>
; Row 0<br>
vbroadcasti128 m3, [r0]<br>
pshufb m3, m1<br>
@@ -25670,7 +25670,7 @@<br>
sub r0 , r1<br>
add r6d , 3<br>
<br>
-.loop<br>
+.loop:<br>
; Row 0<br>
vbroadcasti128 m3, [r0]<br>
pshufb m3, m1<br>
@@ -25743,7 +25743,7 @@<br>
je .label<br>
sub r0 , r1<br>
<br>
-.label<br>
+.label:<br>
; Row 0-1<br>
movu xm3, [r0]<br>
vinserti128 m3, m3, [r0 + r1], 1<br>
@@ -25795,7 +25795,7 @@<br>
movq [r2+r3], xm4<br>
lea r2, [r2 + r3 * 2]<br>
movhps [r2], xm3<br>
-.end<br>
+.end:<br>
RET<br>
<br>
cglobal interp_4tap_horiz_ps_4x2, 4,7,5<br>
@@ -25823,7 +25823,7 @@<br>
je .label<br>
sub r0 , r1<br>
<br>
-.label<br>
+.label:<br>
; Row 0-1<br>
movu xm3, [r0]<br>
vinserti128 m3, m3, [r0 + r1], 1<br>
@@ -25864,7 +25864,7 @@<br>
movq [r2+r3], xm4<br>
lea r2, [r2 + r3 * 2]<br>
movhps [r2], xm3<br>
-.end<br>
+.end:<br>
RET<br>
<br>
;-----------------------------<wbr>------------------------------<wbr>------------------------------<wbr>------------------------------<wbr>------<br>
@@ -25899,7 +25899,7 @@<br>
sub r0 , r1<br>
<br>
<br>
-.loop<br>
+.loop:<br>
sub r4d, 4<br>
; Row 0-1<br>
movu xm3, [r0]<br>
@@ -25955,7 +25955,7 @@<br>
movq [r2+r3], xm4<br>
lea r2, [r2 + r3 * 2]<br>
movhps [r2], xm3<br>
-.end<br>
+.end:<br>
RET<br>
%endmacro<br>
<br>
@@ -25993,7 +25993,7 @@<br>
sub r0 , r1<br>
add r6d , 1<br>
<br>
-.loop<br>
+.loop:<br>
dec r6d<br>
; Row 0<br>
vbroadcasti128 m3, [r0]<br>
@@ -26032,7 +26032,7 @@<br>
psubw m3, m5<br>
vpermq m3, m3, 11011000b<br>
movu [r2], xm3<br>
-.end<br>
+.end:<br>
RET<br>
<br>
INIT_YMM avx2<br>
@@ -26237,7 +26237,7 @@<br>
<br>
dec r0<br>
<br>
-.loop<br>
+.loop:<br>
sub r4d, 4<br>
; Row 0-1<br>
movu xm3, [r0] ; [x x x x x A 9 8 7 6 5 4 3 2 1 0]<br>
@@ -26306,9 +26306,9 @@<br>
sub r0, r6<br>
add r4d, 7<br>
<br>
-.label<br>
+.label:<br>
lea r6, [pw_2000]<br>
-.loop<br>
+.loop:<br>
; Row 0<br>
vbroadcasti128 m3, [r0] ; [x x x x x A 9 8 7 6 5 4 3 2 1 0]<br>
pshufb m4, m3, m6 ; row 0 (col 4 to 7)<br>
@@ -26405,9 +26405,9 @@<br>
sub r0, r6 ; r0(src)-r6<br>
add r4d, 7 ; blkheight += N - 1 (7 - 1 = 6 ; since the last one row not in loop)<br>
<br>
-.label<br>
+.label:<br>
lea r6, [interp8_hps_shuf]<br>
-.loop<br>
+.loop:<br>
; Row 0<br>
vbroadcasti128 m3, [r0] ; [x x x x x A 9 8 7 6 5 4 3 2 1 0]<br>
pshufb m4, m3, m6 ; row 0 (col 4 to 7)<br>
@@ -26736,9 +26736,9 @@<br>
sub r0, r6 ; r0(src)-r6<br>
add r4d, 7 ; blkheight += N - 1<br>
<br>
-.label<br>
+.label:<br>
lea r6, [pw_2000]<br>
-.loop<br>
+.loop:<br>
; Row 0<br>
vbroadcasti128 m3, [r0] ; [x x x x x A 9 8 7 6 5 4 3 2 1 0]<br>
pshufb m4, m3, m6 ; row 0 (col 4 to 7)<br>
@@ -26880,7 +26880,7 @@<br>
sub r0 , r1<br>
inc r6d<br>
<br>
-.loop<br>
+.loop:<br>
; Row 0<br>
vbroadcasti128 m3, [r0]<br>
pshufb m3, m1<br>
@@ -26915,7 +26915,7 @@<br>
psubw m3, m5<br>
vpermq m3, m3, 11011000b<br>
movu [r2], xm3<br>
-.end<br>
+.end:<br>
RET<br>
%endmacro<br>
<br>
@@ -26945,7 +26945,7 @@<br>
jz .label<br>
sub r0, r1<br>
<br>
-.label<br>
+.label:<br>
lea r6, [r1 * 3]<br>
movq xm1, [r0]<br>
movhps xm1, [r0 + r1]<br>
@@ -26985,7 +26985,7 @@<br>
movd [r2], xm1<br>
pextrd [r2 + r3], xm1, 1<br>
pextrd [r2 + r3 * 2], xm1, 2<br>
-.end<br>
+.end:<br>
RET<br>
<br>
INIT_YMM avx2<br>
@@ -27005,7 +27005,7 @@<br>
jz .label<br>
sub r0, r1<br>
<br>
-.label<br>
+.label:<br>
mova m4, [interp4_hpp_shuf]<br>
mova m5, [pw_1]<br>
dec r0<br>
@@ -27062,7 +27062,7 @@<br>
movd [r2], xm1<br>
pextrd [r2 + r3], xm1, 1<br>
movd [r2 + r3 * 2], xm2<br>
-.end<br>
+.end:<br>
RET<br>
<br>
INIT_YMM avx2<br>
@@ -27217,7 +27217,7 @@<br>
sub r0 , r1<br>
inc r6d<br>
<br>
-.loop<br>
+.loop:<br>
; Row 0<br>
vbroadcasti128 m3, [r0]<br>
pshufb m3, m1<br>
@@ -27254,7 +27254,7 @@<br>
vextracti128 xm4, m3, 1<br>
movq [r2], xm3<br>
movd [r2+8], xm4<br>
-.end<br>
+.end:<br>
RET<br>
<br>
INIT_YMM avx2<br>
@@ -27285,7 +27285,7 @@<br>
lea r6, [r1 * 3] ; r6 = (N / 2 - 1) * srcStride<br>
sub r0, r6 ; r0(src)-r6<br>
add r4d, 7<br>
-.loop<br>
+.loop:<br>
<br>
; Row 0<br>
<br>
@@ -27350,9 +27350,9 @@<br>
sub r0, r6 ; r0(src)-r6<br>
add r4d, 7 ; blkheight += N - 1 (7 - 1 = 6 ; since the last one row not in loop)<br>
<br>
-.label<br>
+.label:<br>
lea r6, [interp8_hps_shuf]<br>
-.loop<br>
+.loop:<br>
; Row 0<br>
vbroadcasti128 m3, [r0] ; [x x x x x A 9 8 7 6 5 4 3 2 1 0]<br>
pshufb m4, m3, m6 ; row 0 (col 4 to 7)<br>
@@ -27430,7 +27430,7 @@<br>
sub r0 , r1<br>
add r6d , 3<br>
<br>
-.loop<br>
+.loop:<br>
; Row 0<br>
vbroadcasti128 m3, [r0] ; [x x x x x A 9 8 7 6 5 4 3 2 1 0]<br>
pshufb m3, m1<br>
@@ -27988,7 +27988,7 @@<br>
sub r0 , r1<br>
add r6d , 3<br>
<br>
-.loop<br>
+.loop:<br>
; Row 0<br>
vbroadcasti128 m3, [r0] ; [x x x x x A 9 8 7 6 5 4 3 2 1 0]<br>
pshufb m3, m1<br>
@@ -28067,7 +28067,7 @@<br>
sub r0 , r1<br>
add r6d , 3<br>
<br>
-.loop<br>
+.loop:<br>
; Row 0<br>
vbroadcasti128 m3, [r0] ; [x x x x x A 9 8 7 6 5 4 3 2 1 0]<br>
pshufb m3, m1<br>
@@ -28114,7 +28114,7 @@<br>
jz .label<br>
sub r0, r1<br>
<br>
-.label<br>
+.label:<br>
mova m4, [interp4_hps_shuf]<br>
mova m5, [pw_1]<br>
dec r0<br>
@@ -28209,7 +28209,7 @@<br>
movd [r2], xm1<br>
pextrd [r2 + r3], xm1, 1<br>
movd [r2 + r3 * 2], xm2<br>
-.end<br>
+.end:<br>
RET<br>
<br>
INIT_YMM avx2<br>
diff -r dae558b40d99 -r 182bfd0d5af9 source/common/x86/loopfilter.<wbr>asm<br>
--- a/source/common/x86/<wbr>loopfilter.asm Tue Nov 21 09:40:16 2017 +0530<br>
+++ b/source/common/x86/<wbr>loopfilter.asm Thu Nov 02 09:39:58 2017 +0530<br>
@@ -374,7 +374,7 @@<br>
pxor m0, m0 ; m0 = 0<br>
mova m6, [pb_2] ; m6 = [2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2]<br>
shr r4d, 4<br>
-.loop<br>
+.loop:<br>
movu m7, [r0]<br>
movu m5, [r0 + 16]<br>
movu m3, [r0 + r3]<br>
@@ -430,7 +430,7 @@<br>
mova m6, [pb_2] ; m6 = [2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2]<br>
mova m7, [pb_128]<br>
shr r4d, 4<br>
-.loop<br>
+.loop:<br>
movu m1, [r0] ; m1 = pRec[x]<br>
movu m2, [r0 + r3] ; m2 = pRec[x + iStride]<br>
<br>
@@ -478,7 +478,7 @@<br>
mova m4, [pb_2]<br>
shr r4d, 4<br>
mova m0, [pw_pixel_max]<br>
-.loop<br>
+.loop:<br>
movu m5, [r0]<br>
movu m3, [r0 + r3]<br>
<br>
@@ -523,7 +523,7 @@<br>
mova xm6, [pb_2] ; xm6 = [2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2]<br>
mova xm7, [pb_128]<br>
shr r4d, 4<br>
-.loop<br>
+.loop:<br>
movu xm1, [r0] ; xm1 = pRec[x]<br>
movu xm2, [r0 + r3] ; xm2 = pRec[x + iStride]<br>
<br>
@@ -572,7 +572,7 @@<br>
mov r5d, r4d<br>
shr r4d, 4<br>
mov r6, r0<br>
-.loop<br>
+.loop:<br>
movu m7, [r0]<br>
movu m5, [r0 + 16]<br>
movu m3, [r0 + r3]<br>
@@ -674,7 +674,7 @@<br>
pxor m0, m0 ; m0 = 0<br>
mova m7, [pb_128]<br>
shr r4d, 4<br>
-.loop<br>
+.loop:<br>
movu m1, [r0] ; m1 = pRec[x]<br>
movu m2, [r0 + r3] ; m2 = pRec[x + iStride]<br>
<br>
@@ -748,7 +748,7 @@<br>
mova m4, [pw_pixel_max]<br>
vbroadcasti128 m6, [r2] ; m6 = m_iOffsetEo<br>
shr r4d, 4<br>
-.loop<br>
+.loop:<br>
movu m7, [r0]<br>
movu m5, [r0 + r3]<br>
movu m1, [r0 + r3 * 2]<br>
@@ -804,7 +804,7 @@<br>
vbroadcasti128 m5, [pb_128]<br>
vbroadcasti128 m6, [r2] ; m6 = m_iOffsetEo<br>
shr r4d, 4<br>
-.loop<br>
+.loop:<br>
movu xm1, [r0] ; m1 = pRec[x]<br>
movu xm2, [r0 + r3] ; m2 = pRec[x + iStride]<br>
vinserti128 m1, m1, xm2, 1<br>
@@ -859,7 +859,7 @@<br>
movh m6, [r0 + r4 * 2]<br>
movhps m6, [r1 + r4]<br>
<br>
-.loop<br>
+.loop:<br>
movu m7, [r0]<br>
movu m5, [r0 + 16]<br>
movu m3, [r0 + r5 + 2]<br>
@@ -918,7 +918,7 @@<br>
movh m5, [r0 + r4]<br>
movhps m5, [r1 + r4]<br>
<br>
-.loop<br>
+.loop:<br>
movu m1, [r0] ; m1 = rec[x]<br>
movu m2, [r0 + r5 + 1] ; m2 = rec[x + stride + 1]<br>
pxor m3, m1, m7<br>
@@ -970,7 +970,7 @@<br>
movhps xm4, [r1 + r4]<br>
vbroadcasti128 m5, [r3]<br>
mova m6, [pw_pixel_max]<br>
-.loop<br>
+.loop:<br>
movu m1, [r0]<br>
movu m3, [r0 + r5 + 2]<br>
<br>
@@ -1061,7 +1061,7 @@<br>
movhps xm4, [r1 + r4]<br>
vbroadcasti128 m5, [r3]<br>
<br>
-.loop<br>
+.loop:<br>
movu m1, [r0]<br>
movu m7, [r0 + 32]<br>
movu m3, [r0 + r5 + 2]<br>
@@ -1567,11 +1567,11 @@<br>
movu m4, [r1 + 16] ; offset[16-31]<br>
pxor m7, m7<br>
<br>
-.loopH<br>
+.loopH:<br>
mov r5d, r2d<br>
xor r6, r6<br>
<br>
-.loopW<br>
+.loopW:<br>
movu m2, [r0 + r6]<br>
movu m5, [r0 + r6 + 16]<br>
psrlw m0, m2, (BIT_DEPTH - 5)<br>
@@ -1617,11 +1617,11 @@<br>
movu m3, [r1 + 0] ; offset[0-15]<br>
movu m4, [r1 + 16] ; offset[16-31]<br>
pxor m7, m7 ; m7 =[0]<br>
-.loopH<br>
+.loopH:<br>
mov r5d, r2d<br>
xor r6, r6<br>
<br>
-.loopW<br>
+.loopW:<br>
movu m2, [r0 + r6] ; m0 = [rec]<br>
psrlw m1, m2, 3<br>
pand m1, [pb_31] ; m1 = [index]<br>
@@ -1670,9 +1670,9 @@<br>
mov r6d, r3d<br>
shr r3d, 1<br>
<br>
-.loopH<br>
+.loopH:<br>
mov r5d, r2d<br>
-.loopW<br>
+.loopW:<br>
movu m2, [r0]<br>
movu m5, [r0 + r4]<br>
psrlw m0, m2, (BIT_DEPTH - 5)<br>
@@ -1751,9 +1751,9 @@<br>
shr r2d, 4<br>
mov r1d, r3d<br>
shr r3d, 1<br>
-.loopH<br>
+.loopH:<br>
mov r5d, r2d<br>
-.loopW<br>
+.loopW:<br>
movu xm2, [r0] ; m2 = [rec]<br>
vinserti128 m2, m2, [r0 + r4], 1<br>
psrlw m1, m2, 3<br>
@@ -1789,7 +1789,7 @@<br>
test r1b, 1<br>
jz .end<br>
mov r5d, r2d<br>
-.loopW1<br>
+.loopW1:<br>
movu xm2, [r0] ; m2 = [rec]<br>
psrlw xm1, xm2, 3<br>
pand xm1, xm7 ; m1 = [index]<br>
@@ -1811,7 +1811,7 @@<br>
add r0, 16<br>
dec r5d<br>
jnz .loopW1<br>
-.end<br>
+.end:<br>
RET<br>
%endif<br>
<br>
@@ -1827,7 +1827,7 @@<br>
add r3d, 1<br>
mov r5, r0<br>
movu m4, [r0 + r4]<br>
-.loop<br>
+.loop:<br>
movu m1, [r1] ; m2 = pRec[x]<br>
movu m2, [r2] ; m3 = pTmpU[x]<br>
<br>
@@ -1921,7 +1921,7 @@<br>
mov r5, r0<br>
movu m4, [r0 + r4]<br>
<br>
-.loop<br>
+.loop:<br>
movu m1, [r1] ; m2 = pRec[x]<br>
movu m2, [r2] ; m3 = pTmpU[x]<br>
<br>
diff -r dae558b40d99 -r 182bfd0d5af9 source/common/x86/mc-a.asm<br>
--- a/source/common/x86/mc-a.asm Tue Nov 21 09:40:16 2017 +0530<br>
+++ b/source/common/x86/mc-a.asm Thu Nov 02 09:39:58 2017 +0530<br>
@@ -4115,7 +4115,7 @@<br>
lea r7, [r5 * 3]<br>
lea r8, [r1 * 3]<br>
mov r9d, 4<br>
-.loop<br>
+.loop:<br>
pixel_avg_W8<br>
dec r9d<br>
jnz .loop<br>
@@ -4129,7 +4129,7 @@<br>
lea r7, [r5 * 3]<br>
lea r8, [r1 * 3]<br>
mov r9d, 8<br>
-.loop<br>
+.loop:<br>
pixel_avg_W8<br>
dec r9d<br>
jnz .loop<br>
@@ -4697,7 +4697,7 @@<br>
lea r8, [r1 * 3]<br>
mov r9d, 4<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r2]<br>
movu m1, [r4]<br>
pavgw m0, m1<br>
@@ -4834,7 +4834,7 @@<br>
lea r7, [r5 * 3]<br>
lea r8, [r1 * 3]<br>
mov r9d, 4<br>
-.loop<br>
+.loop:<br>
pixel_avg_H16<br>
dec r9d<br>
jnz .loop<br>
@@ -4848,7 +4848,7 @@<br>
lea r7, [r5 * 3]<br>
lea r8, [r1 * 3]<br>
mov r9d, 4<br>
-.loop<br>
+.loop:<br>
pixel_avg_H16<br>
pixel_avg_H16<br>
dec r9d<br>
@@ -4863,7 +4863,7 @@<br>
lea r7, [r5 * 3]<br>
lea r8, [r1 * 3]<br>
mov r9d, 4<br>
-.loop<br>
+.loop:<br>
pixel_avg_H16<br>
pixel_avg_H16<br>
pixel_avg_H16<br>
@@ -4887,7 +4887,7 @@<br>
lea r8, [r1 * 3]<br>
mov r9d, 8<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r2]<br>
movu m1, [r4]<br>
pavgw m0, m1<br>
@@ -4987,7 +4987,7 @@<br>
lea r7, [r5 * 3]<br>
lea r8, [r1 * 3]<br>
mov r9d, 2<br>
-.loop<br>
+.loop:<br>
pixel_avg_W32<br>
dec r9d<br>
jnz .loop<br>
@@ -5001,7 +5001,7 @@<br>
lea r7, [r5 * 3]<br>
lea r8, [r1 * 3]<br>
mov r9d, 4<br>
-.loop<br>
+.loop:<br>
pixel_avg_W32<br>
dec r9d<br>
jnz .loop<br>
@@ -5015,7 +5015,7 @@<br>
lea r7, [r5 * 3]<br>
lea r8, [r1 * 3]<br>
mov r9d, 6<br>
-.loop<br>
+.loop:<br>
pixel_avg_W32<br>
dec r9d<br>
jnz .loop<br>
@@ -5029,7 +5029,7 @@<br>
lea r7, [r5 * 3]<br>
lea r8, [r1 * 3]<br>
mov r9d, 8<br>
-.loop<br>
+.loop:<br>
pixel_avg_W32<br>
dec r9d<br>
jnz .loop<br>
@@ -5043,7 +5043,7 @@<br>
lea r7, [r5 * 3]<br>
lea r8, [r1 * 3]<br>
mov r9d, 16<br>
-.loop<br>
+.loop:<br>
pixel_avg_W32<br>
dec r9d<br>
jnz .loop<br>
@@ -5141,7 +5141,7 @@<br>
lea r7, [r5 * 3]<br>
lea r8, [r1 * 3]<br>
mov r9d, 4<br>
-.loop<br>
+.loop:<br>
pixel_avg_W64<br>
dec r9d<br>
jnz .loop<br>
@@ -5155,7 +5155,7 @@<br>
lea r7, [r5 * 3]<br>
lea r8, [r1 * 3]<br>
mov r9d, 8<br>
-.loop<br>
+.loop:<br>
pixel_avg_W64<br>
dec r9d<br>
jnz .loop<br>
@@ -5169,7 +5169,7 @@<br>
lea r7, [r5 * 3]<br>
lea r8, [r1 * 3]<br>
mov r9d, 12<br>
-.loop<br>
+.loop:<br>
pixel_avg_W64<br>
dec r9d<br>
jnz .loop<br>
@@ -5183,7 +5183,7 @@<br>
lea r7, [r5 * 3]<br>
lea r8, [r1 * 3]<br>
mov r9d, 16<br>
-.loop<br>
+.loop:<br>
pixel_avg_W64<br>
dec r9d<br>
jnz .loop<br>
@@ -5204,7 +5204,7 @@<br>
lea r8, [r1 * 3]<br>
mov r9d, 16<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r2]<br>
movu m1, [r4]<br>
pavgw m0, m1<br>
diff -r dae558b40d99 -r 182bfd0d5af9 source/common/x86/pixel-util8.<wbr>asm<br>
--- a/source/common/x86/pixel-<wbr>util8.asm Tue Nov 21 09:40:16 2017 +0530<br>
+++ b/source/common/x86/pixel-<wbr>util8.asm Thu Nov 02 09:39:58 2017 +0530<br>
@@ -1785,7 +1785,7 @@<br>
movu [r1], xm7<br>
je .nextH<br>
<br>
-.width6<br>
+.width6:<br>
cmp r6d, 6<br>
jl .width4<br>
movq [r1], xm7<br>
@@ -4937,7 +4937,7 @@<br>
lea r9, [r4 * 3]<br>
lea r8, [r5 * 3]<br>
<br>
-.loop<br>
+.loop:<br>
pmovzxbw m0, [r2]<br>
pmovzxbw m1, [r3]<br>
pmovzxbw m2, [r2 + r4]<br>
@@ -5150,7 +5150,7 @@<br>
lea r7, [r4 * 3]<br>
lea r8, [r5 * 3]<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r2]<br>
movu m1, [r2 + 32]<br>
movu m2, [r3]<br>
@@ -5557,7 +5557,7 @@<br>
lea r7, [r4 * 3]<br>
lea r8, [r5 * 3]<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r2]<br>
movu m1, [r2 + 32]<br>
movu m2, [r2 + 64]<br>
diff -r dae558b40d99 -r 182bfd0d5af9 source/common/x86/sad-a.asm<br>
--- a/source/common/x86/sad-a.asm Tue Nov 21 09:40:16 2017 +0530<br>
+++ b/source/common/x86/sad-a.asm Thu Nov 02 09:39:58 2017 +0530<br>
@@ -5631,7 +5631,7 @@<br>
xorps m5, m5<br>
mov r4d, 4<br>
<br>
-.loop<br>
+.loop:<br>
movu m1, [r0] ; row 0 of pix0<br>
movu m2, [r2] ; row 0 of pix1<br>
movu m3, [r0 + r1] ; row 1 of pix0<br>
@@ -5676,7 +5676,7 @@<br>
mov r4d, 6<br>
lea r5, [r1 * 3]<br>
lea r6, [r3 * 3]<br>
-.loop<br>
+.loop:<br>
movu m1, [r0] ; row 0 of pix0<br>
movu m2, [r2] ; row 0 of pix1<br>
movu m3, [r0 + r1] ; row 1 of pix0<br>
@@ -5718,7 +5718,7 @@<br>
lea r5, [r1 * 3]<br>
lea r6, [r3 * 3]<br>
<br>
-.loop<br>
+.loop:<br>
movu m1, [r0] ; row 0 of pix0<br>
movu m2, [r2] ; row 0 of pix1<br>
movu m3, [r0 + r1] ; row 1 of pix0<br>
@@ -5759,7 +5759,7 @@<br>
lea r5, [r1 * 3]<br>
lea r6, [r3 * 3]<br>
<br>
-.loop<br>
+.loop:<br>
movu m1, [r0] ; row 0 of pix0<br>
movu m2, [r2] ; row 0 of pix1<br>
movu m3, [r0 + r1] ; row 1 of pix0<br>
@@ -5822,7 +5822,7 @@<br>
mov r4d, 64/4<br>
lea r5, [r1 * 3]<br>
lea r6, [r3 * 3]<br>
-.loop<br>
+.loop:<br>
movu m1, [r0] ; row 0 of pix0<br>
movu m2, [r2] ; row 0 of pix1<br>
movu m3, [r0 + r1] ; row 1 of pix0<br>
@@ -5873,7 +5873,7 @@<br>
xorps m0, m0<br>
xorps m5, m5<br>
mov r4d, 4<br>
-.loop<br>
+.loop:<br>
movu m1, [r0] ; first 32 of row 0 of pix0<br>
movu m2, [r2] ; first 32 of row 0 of pix1<br>
movu m3, [r0 + 32] ; second 32 of row 0 of pix0<br>
@@ -5936,7 +5936,7 @@<br>
xorps m0, m0<br>
xorps m5, m5<br>
mov r4d, 16<br>
-.loop<br>
+.loop:<br>
movu m1, [r0] ; first 32 of row 0 of pix0<br>
movu m2, [r2] ; first 32 of row 0 of pix1<br>
movu m3, [r0 + 32] ; second 32 of row 0 of pix0<br>
@@ -5978,7 +5978,7 @@<br>
mov r4d, 12<br>
lea r5, [r1 * 3]<br>
lea r6, [r3 * 3]<br>
-.loop<br>
+.loop:<br>
movu m1, [r0] ; first 32 of row 0 of pix0<br>
movu m2, [r2] ; first 32 of row 0 of pix1<br>
movu m3, [r0 + 32] ; second 32 of row 0 of pix0<br>
@@ -6040,7 +6040,7 @@<br>
mov r4d, 8<br>
lea r5, [r1 * 3]<br>
lea r6, [r3 * 3]<br>
-.loop<br>
+.loop:<br>
movu m1, [r0] ; first 32 of row 0 of pix0<br>
movu m2, [r2] ; first 32 of row 0 of pix1<br>
movu m3, [r0 + 32] ; second 32 of row 0 of pix0<br>
diff -r dae558b40d99 -r 182bfd0d5af9 source/common/x86/seaintegral.<wbr>asm<br>
--- a/source/common/x86/<wbr>seaintegral.asm Tue Nov 21 09:40:16 2017 +0530<br>
+++ b/source/common/x86/<wbr>seaintegral.asm Thu Nov 02 09:39:58 2017 +0530<br>
@@ -36,7 +36,7 @@<br>
mov r2, r1<br>
shl r2, 4<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r0]<br>
movu m1, [r0 + r2]<br>
psubd m1, m0<br>
@@ -54,7 +54,7 @@<br>
mov r2, r1<br>
shl r2, 5<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r0]<br>
movu m1, [r0 + r2]<br>
psubd m1, m0<br>
@@ -75,7 +75,7 @@<br>
shl r3, 4<br>
add r2, r3<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r0]<br>
movu m1, [r0 + r2]<br>
psubd m1, m0<br>
@@ -93,7 +93,7 @@<br>
mov r2, r1<br>
shl r2, 6<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r0]<br>
movu m1, [r0 + r2]<br>
psubd m1, m0<br>
@@ -114,7 +114,7 @@<br>
shl r3, 5<br>
add r2, r3<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r0]<br>
movu m1, [r0 + r2]<br>
psubd m1, m0<br>
@@ -132,7 +132,7 @@<br>
mov r2, r1<br>
shl r2, 7<br>
<br>
-.loop<br>
+.loop:<br>
movu m0, [r0]<br>
movu m1, [r0 + r2]<br>
psubd m1, m0<br>
@@ -264,7 +264,7 @@<br>
movu [r0 + r3], xm0<br>
jmp .end<br>
<br>
-.end<br>
+.end:<br>
RET<br>
%endif<br>
<br>
@@ -379,7 +379,7 @@<br>
movu [r0 + r3], m0<br>
jmp .end<br>
<br>
-.end<br>
+.end:<br>
RET<br>
%endif<br>
<br>
@@ -577,7 +577,7 @@<br>
movu [r0 + r3], xm0<br>
jmp .end<br>
<br>
-.end<br>
+.end:<br>
RET<br>
%endif<br>
<br>
@@ -740,7 +740,7 @@<br>
movu [r0 + r3], m0<br>
jmp .end<br>
<br>
-.end<br>
+.end:<br>
RET<br>
%endif<br>
<br>
@@ -883,7 +883,7 @@<br>
movu [r0 + r3], m0<br>
jmp .end<br>
<br>
-.end<br>
+.end:<br>
RET<br>
<br>
%macro INTEGRAL_THIRTYTWO_HORIZONTAL_<wbr>16 0<br>
@@ -1058,5 +1058,5 @@<br>
movu [r0 + r3], m0<br>
jmp .end<br>
<br>
-.end<br>
+.end:<br>
RET<br>
______________________________<wbr>_________________<br>
x265-devel mailing list<br>
<a href="mailto:x265-devel@videolan.org">x265-devel@videolan.org</a><br>
<a href="https://mailman.videolan.org/listinfo/x265-devel" rel="noreferrer" target="_blank">https://mailman.videolan.org/<wbr>listinfo/x265-devel</a><br>
</blockquote></div><br></div></div>