搜索
bottom↓
回复: 13

会是替代st m7的未来之选嘛,RISC-V gap8与cortex m7性能测试比较

[复制链接]

出0入0汤圆

发表于 2019-6-17 22:09:14 | 显示全部楼层 |阅读模式
本帖最后由 reloaded 于 2019-6-17 22:37 编辑

很多年前,st的m3因为atmel缺货而走上了主流,今天,由于某某站的缘故,以及ai市场大大举入侵嵌入式,我们开始把目光投向risc-v,他会是第二个stm32嘛
参考https://greenwaves-technologies. ... m-m7-embedded-cnns/

图片刷不出来可以打开网页,有。

不知道从何时开始,低端arm控制器和mpu也开始炫起了ML大法,各种NN都开始port到上面来。且不说性能如何,至少有这个玩意会比别家多一些噱头。。arm公司也不闲着,他
已经准备了下一代arm v8.1m架构,给mcu加入了neon协处理器,类似于矩阵计算阵列的多核mini版本,提供NN算法的加速。同时彻底降低了主控单元的计算负载。
而这一点,也是riscv们提前开始占领的高地。现在我们已经看到有厂家制造了一颗8核心加1主控的低端ai加速用的riscv单片机。
它依旧是单片机。主控250mhz,协处理器175mhz。

作为评测对比,它用gap8和运行在217mhz的stm32h7进行了对比
同一套CNN算法,stm32h7              99ms         
                          gap8(175mhz)9ms
功耗方面            stm32h7             60mw    不得不说这个功耗还是很不错的。
                         gap8                    70mw
并且risc v芯片的全功率运行时候电压是1v,比stm32的3.3v要低很多
只看数学计算性能,riscv是最高频率工作下的stm32h7的五倍。
功耗它俩在同一水平线。(几乎)同频率的话。
设计原理在:
Why is GAP8 using so few cycles? Well firstly we’re running on 8 cores and GAP8‘s extremely efficient architecture for parallelization is giving us a speed-up factor of somewhere between 7 and 8 times. Secondly the optimized DSP/SIMD instructions in GAP8 are giving fine grained parallelization on the convolution operations. Finally our fine grained control over memory movement is giving us a real benefit in the amount of cycles used to load and store weights, input and output data from the CNN graph nodes. All of these factors allow us to achieve the same execution time for the inference of 99.1ms at a clock speed of 15.4Mhz. This, in turn, allows us to run the cores at 1V leading to a power consumption during the operation of 3.7mW. Here we are really benefiting from the shared instruction cache in the cluster which decreases the cost of running the 8 cores by fetching instructions only once.

The last row in the table shows GAP8 executing the CNN at full clock speed. Here the cluster is working at 1.2V and its maximum clock speed of 175 Mhz. We are able to complete the inference in 8.7ms. A performance increase of 11 times versus the M7 core at a power level that is reasonably similar of 70mW. The energy consumed is obviously less than the M7 since it is over a shorter period but from an energy perspective the GAP8 is less efficient at this operation point.
更早一点的测评数据汇总在 https://greenwaves-technologies.com/gap8-cnn-benchmarks/
按照它们官方的说法,今年年中还会进行产品的第二次升级,把频率做到协处理器超200mhz,做到传统arm m7性能的五到八倍。以期和很快就会出样品的次时代arm mcu
集成NEON多核的AI单片机进行抗衡。
但是有个坏消息,这家公司的样品居然是四十欧一片。晕倒了。。
这种针对ai优化的mcu产品是有市场需求的。他可以作为camera的辅助检测。也可以做超低端的face recognition 大概做个婴儿动作检测比较合适。
由于我国的特殊市场需求非常之大,我依旧看好这类监控和识图类芯片的前景。

PS  目前所有的risc-v产品都没有以太网的IP,特别是低端控制器里的。所以要用的时候只能用wifi替代网络扩展。
   甚至连usb 3也没有。这个问题不大。usb数量上也不占任何优势。riscv的唯一优势就是它更像是一款普通人能开发升级的fpga。
  超低端的那种。破解起来初期成本较大。国内的合肥某手表公司已经量产了一款,还有一个做智能锁的芯片厂也量产了一款
他们都不需要以太网接口。
如果你要用以太网接口的有线接口,不要看了!!!!!!!!!!!!!!!!!!!!!!!!

PSS   最大的dsp厂家是TEXAS INSTRUMENTS,和ADI, 都是美国的。美国美国你懂得

出0入0汤圆

 楼主| 发表于 2019-6-17 22:19:30 | 显示全部楼层
本帖最后由 reloaded 于 2019-6-17 22:29 编辑

关于国内某挖矿芯片厂的riscv产品吐槽
我不太相信一个挖矿设计公司能把产品线做到三到五年不消失。作为消费型ic,他们并没有那种信任感。相反欧洲人设计的这个greenwave,也就是苏黎世和乌得勒支联合开发的产品,在得到了国内某厂的大力入股之后,看起来安全和长期供货的概率更大。价格上,如果risc-v能做到10usd以下,还是有戏的。
但外设的匮乏,和可靠性测试不够多的现实,可能很多人还不太会完全切入到这个平台。单纯从使用开发上,IDE也没有mdk这样用起来顺手的人机界面
好在烧写程序都是一样 的。RTOS也有了。哈哈哈哈,没有rtos,我都看都不用看了。

还有一个riscv产品线,就是很多小企业在搞的,拿超低端fpga来做。价格低于五美元。那个用起来感觉和atmel的mega16类似
大家可以体会是啥样了。高级版本的是用xilinx的大片子跑豪华版ip。看起来外设代码还是不足。

如果你们有看过挖矿公司的risc-v的demo游戏,会发现居然真的可以用图像识别做小游戏。而且功耗能做到非常之低。从这点上看,传统的m4和最贵的m7还无法做到。
功耗问题会在大规模的工厂自动化里显现出来,特别是一个环境下,有几千个采集节点的时候出现。以前我们是用arm a9来做工业摄像,图形捕获的。这个成本是大规模生产线无法接受的。
所以,riscv 确实是另辟蹊径,用它的独特的卖点。

出0入0汤圆

发表于 2019-6-17 22:19:37 | 显示全部楼层
第一句话就是错的。

出0入0汤圆

 楼主| 发表于 2019-6-17 22:23:17 | 显示全部楼层
colinzhao 发表于 2019-6-17 22:19
第一句话就是错的。

那是你高看了arm阵营的公司,没有零八年的经济危机,现在你还在用atmel的arm7跑。
现在针对arm系的恐慌,恰恰是riscv大势的好机会。
没有什么是不可能的。
atmel死于供货,而现在整个arm系特别是美系,都有全军覆没的危险。国产高仿32们也是唇亡齿寒。

出0入93汤圆

发表于 2019-6-17 22:27:05 | 显示全部楼层
截个图。。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

出0入0汤圆

 楼主| 发表于 2019-6-17 22:31:24 | 显示全部楼层

在我国,做DANG的好儿女,做DANG的好帮手,永远都有肉吃啊。。

出0入0汤圆

 楼主| 发表于 2019-6-17 22:36:08 | 显示全部楼层
按国外的说法,我国是要做到一人俩camera的量,城市中心无死角。据说那一个省就卖了一亿枚camera
不过我依旧看好它在工业自动化上的大规模使用,只要它的识图速度不吹牛x和功耗不作假。
别的安全类,它想要动国家采购的蛋糕,暂时很难,除非是复旦微电子自己开片子用它的ip。其它地方,大家也都看到了,这个芯片最大的不足就是外设匮乏。
以至于它的舞台只能在小小的ai上跳跃

出0入442汤圆

发表于 2019-6-17 22:38:22 来自手机 | 显示全部楼层
我们用vexriscv已经用半年多了,表示非常稳定可靠。

出0入36汤圆

发表于 2019-6-18 00:39:02 来自手机 | 显示全部楼层
wye11083 发表于 2019-6-17 22:38
我们用vexriscv已经用半年多了,表示非常稳定可靠。

啥片子?

出0入0汤圆

发表于 2019-6-18 08:19:23 | 显示全部楼层
这个对比就是扯蛋,它比的不是两个核,而是核心之外的东西。。。
按它这种比法,我拿个8051核挂个纯硬件算法IP,难道可以得出8051的强大?

要比两个核心的效率、功耗,第一是硬件平台要相同,同样的功艺,同样的频率,同样的电压。第二是跑同样的算法,只利用核心,和外设/协处理器无关。

出0入0汤圆

发表于 2019-6-18 09:08:34 | 显示全部楼层
当然如果从芯片级别来比对,确实各家芯片各有所长,百花齐放,某种芯片可能在某一特定领域有巨大优势。

出0入0汤圆

发表于 2019-6-18 11:09:13 | 显示全部楼层
协处理器对比通用处理器  你咋不用68013秒杀stm的USB结论51比arm好  ai协处理器一样可以整合到stm上  

出0入0汤圆

发表于 2019-6-18 11:09:37 | 显示全部楼层
协处理器对比通用处理器  你咋不用68013秒杀stm的USB结论51比arm好  ai协处理器一样可以整合到stm上  

出0入0汤圆

发表于 2019-6-19 10:03:08 | 显示全部楼层
只要STM32供货价格都稳定就好。
其他处理器(比如RISC-V)要想突围,只有比ARM性能更高,价格更便宜才有可能。
回帖提示: 反政府言论将被立即封锁ID 在按“提交”前,请自问一下:我这样表达会给举报吗,会给自己惹麻烦吗? 另外:尽量不要使用Mark、顶等没有意义的回复。不得大量使用大字体和彩色字。【本论坛不允许直接上传手机拍摄图片,浪费大家下载带宽和论坛服务器空间,请压缩后(图片小于1兆)才上传。压缩方法可以在微信里面发给自己(不要勾选“原图),然后下载,就能得到压缩后的图片】。另外,手机版只能上传图片,要上传附件需要切换到电脑版(不需要使用电脑,手机上切换到电脑版就行,页面底部)。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|amobbs.com 阿莫电子技术论坛 ( 粤ICP备2022115958号, 版权所有:东莞阿莫电子贸易商行 创办于2004年 (公安交互式论坛备案:44190002001997 ) )

GMT+8, 2024-5-6 14:18

© Since 2004 www.amobbs.com, 原www.ourdev.cn, 原www.ouravr.com

快速回复 返回顶部 返回列表