<div data-ntes="ntes_mail_body_root" style="line-height:1.7;color:#000000;font-size:14px;font-family:Arial"><div id="spnEditorContent"><p style="margin: 0;">Hi Changsheng,</p><p style="margin: 0;"><br></p><p style="margin: 0;">Thank for the patches.</p><p style="margin: 0;"><br></p><p style="margin: 0;">However, I don't think RISC-V Extension-V stable enough nowadays.</p><p style="margin: 0px;">v1.0 frozen at September 2021</p><p style="margin: 0px;">v1.1 public review at May 2023</p><div>no more update until July 2025</div><div><br></div><p style="margin: 0px;">And most instructions has not behavior description,</p><p style="margin: 0px;"><br></p><p style="margin: 0px;">For example, <b>vredsum.vs</b> in the patch</p><p style="margin: 0px;">vredsum.vs  vd, vs2, vs1, vm   # vd[0] =  sum( vs1[0] , vs2[*] )</p><p style="margin: 0px;"><br></p><p style="margin: 0px;">I just guess it is<br>vd[0] =  vs1[0] + sum(vs2[*])</p><p style="margin: 0px;"><br></p><p style="margin: 0px;">Another example is <b>vlse8.v</b>,</p><p style="margin: 0px;">I may guess it is equal to x86 PSHUFB or ARM VTBL,</p><p style="margin: 0px;"><br></p><p style="margin: 0px;">Above example I just guess, I can't confirm my concept in past couple years, too many similar problem inside RISC-V Extension-V</p><p style="margin: 0px;">So, I suggest do not integrate / implement RISC-V patch, until specification become stable enough.</p><p style="margin: 0;"><br></p><p style="margin: 0;">Rgards,</p></div><div style="margin: 0;">Chen</div><p>2025-07-06 10:08:25£¬wu.changsheng@sanechips.com.cn </p><blockquote id="isReplyContent" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: #ccc 1px solid"><div class="zcontentRow"><p style="font-size:14px;font-family:΢ÈíÑźÚ,Microsoft YaHei;"><span style="font-family: sans-serif;">From 7562e3a834a6a5ea76ab1b97acf915e095646cd5 Mon Sep 17 00:00:00 2001</span><br></p><p>From: Changsheng Wu <wu.changsheng@sanechips.com.cn></p><p>Date: Sat, 5 Jul 2025 23:09:14 +0800</p><p>Subject: [PATCH] RISCV64: add copy_cnt assembly optimization</p><p><br></p><p>TestBench test result:</p><p>  copy_cnt[4x4] |        1.34x |          123.12   |      165.06</p><p>  copy_cnt[8x8] |        2.64x |          214.07   |      564.26</p><p>copy_cnt[16x16] |        3.96x |          563.83   |      2232.00</p><p>copy_cnt[32x32] |        7.44x |          2144.80  |      15954.42</p><p><br></p></div></blockquote></div>