<div style="line-height:1.7;color:#000000;font-size:14px;font-family:arial"><DIV>At 2013-10-10 18:34:09,nabajit@multicorewareinc.com wrote:<BR>># HG changeset patch<BR>># User Nabajit Deka<BR>># Date 1381401191 -19800<BR>>#      Thu Oct 10 16:03:11 2013 +0530<BR>># Node ID 05869241955051235ee70ceb29a7e13862153f95<BR>># Parent  a79ecf3a787577a2e557659c7a8d226d7d41ce00<BR>>ASM routine for luma filter for 12xN block size.<BR>><BR>>+    pextrd      [r2 + 8], %2, 0<BR>movd [r2 + 8], %2 </DIV>
<DIV> </DIV>
<DIV>>+    dec r4d<BR>I am not sure "dec r4" is faster or not</DIV></div>