Hello,<br><br>I am sending a patch to libdvbcsa whcih implements ARM NEON acceleration.<br>All development and verification is done with chroot/qemu-arm-static on a x86.<br>All test are passing fine.<br><br>I don't have currently ARM board where I can test the speedup. My benchmarks <br>
show slower speed with NEON, which probably is due to the complex emulation of <br>the vector instructions.<br><br>The current implementation uses 64 bit wide batch size. I am also working on a <br>128 bit version. Since I am doing my first steps in NEON - any comments and <br>
recommendations are more than welcome.<br><br>If someone can run the benchmarks on a real board and post some numbers, I'll be <br>very thankful.<br><br>Lastly, I send this mail to these 2 mailing lists as I was recommended to do in <br>
#videolan channel. If this is not the proper place - please point me where I can <br>post/discuss these matters.<br><br>best regards<br>Nikolay Nikolaev<br><br>