<div style="line-height:1.7;color:#000000;font-size:14px;font-family:arial"><div>right now</div><div><br></div><div>future optimize suggest: in pixel_ssd_ss_16x16, if you assign stride*3 into r4/r5, you can save lots of LEA<br></div><div></div><div id="divNeteaseMailCard"></div><div><br></div>At 2015-10-01 19:57:43,"Ramya Sriraman" <ramya@multicorewareinc.com> wrote:<br> <blockquote id="isReplyContent" style="margin: 0px 0px 0px 0.8ex; padding-left: 1ex; border-left-color: rgb(204, 204, 204); border-left-width: 1px; border-left-style: solid;"><div dir="ltr"><div># HG changeset patch</div><div># User Ramya Sriraman <<a href="mailto:ramya@multicorewareinc.com">ramya@multicorewareinc.com</a>></div><div># Date 1443592336 -19800</div><div>#      Wed Sep 30 11:22:16 2015 +0530</div><div># Node ID f56066fbfc4de2deb969d65efdb9045f37681808</div><div># Parent  6e7761bdfe23addb862483f8407b388800de7d92</div><div>asm: Add sse_ss for [16x16],[32x32] & [64x64] for 8bpp avx2</div><div><br></div></div></blockquote></div>