<div dir="ltr"><br><div class="gmail_extra"><br><br><div class="gmail_quote">On Fri, Oct 25, 2013 at 11:05 PM, chen <span dir="ltr"><<a href="mailto:chenm003@163.com" target="_blank">chenm003@163.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="line-height:1.7;font-size:14px;font-family:arial"><div class="im"><div>On Fri, Oct 25, 2013 at 7:25 AM, Min Chen <span dir="ltr"><<a href="mailto:chenm003@163.com" target="_blank">chenm003@163.com</a>></span> wrote:<br>
</div>
</div><blockquote style="PADDING-LEFT:1ex;MARGIN:0px 0px 0px 0.8ex;BORDER-LEFT:#ccc 1px solid">
<div dir="ltr">
<div class="gmail_extra">
<div class="gmail_quote"><div class="im">
<blockquote class="gmail_quote" style="PADDING-LEFT:1ex;MARGIN:0px 0px 0px 0.8ex;BORDER-LEFT:#ccc 1px solid"># HG changeset patch<br># User Min Chen <<a href="mailto:chenm003@163.com" target="_blank">chenm003@163.com</a>><br>
# Date 1382703678 -28800<br># Node ID 2221e3abb479b1e9a586d80d769373d13c7f7980<br># Parent  4ca4da7bdd36fbef00b9eefe54c0a56bf11633f3<br>asm: interp_8tap_hv_pp_8x8() for InterpolateHV_8x8<br></blockquote>
<div><br></div>
<div>How does this compare, performance wise, to the combined h_ps + v_sp intrinsic functions?</div>
<div> </div>
</div><div>[MC] about 2.8x</div></div></div></div></blockquote></div></blockquote><div><br></div><div>Ok, not bad.</div><div><br></div><div>If we allocate the intermediate buffer on the stack, we should allocate it to the exact size requirement, which is width * (height + 7) * sizeof(int16_t) </div>
</div><div><br></div>-- <br>Steve Borho
</div></div>