I was trying to parallelize x264 using CUDA. I was trying to understand code. Any suggestions where to start. I mostly looking at motion estimation part.