搜索
bottom↓
回复: 14

测了GD32VF103的Dhrystone性能, 居然有1.98DMIPS/MHz?

[复制链接]

出0入362汤圆

发表于 2022-3-9 22:40:28 | 显示全部楼层 |阅读模式
官方标称108M时153DMIPS, 合1.46DMIPS/MHz
我实测了一下, 108M时居然跑到了214DMIPS, 合1.98DMIPS/MHz了, 不知道是哪里出了问题.
编译器是riscv-none-embed-gcc 7.2.0, -O3优化.

顺便试了一下超频, 144M正常, 168M正常, 192M正常,  208M不运行, 降到200M不太稳定, 再降回192M,  稳了.
这时跑分达到了382DMIPS.

完整数据见github链接:
https://github.com/tomzbj/dhrystone_score

阿莫论坛20周年了!感谢大家的支持与爱护!!

曾经有一段真挚的爱情摆在我的面前,我没有珍惜,现在想起来,还好我没有珍惜……

出0入442汤圆

发表于 2022-3-9 23:35:38 来自手机 | 显示全部楼层
优化的锅可能,gd应该是开os跑的,os比o2在有cache条件下慢一小半。

出0入362汤圆

 楼主| 发表于 2022-3-10 08:58:33 | 显示全部楼层
wye11083 发表于 2022-3-9 23:35
优化的锅可能,gd应该是开os跑的,os比o2在有cache条件下慢一小半。
(引用自2楼)

开Os的话只有0.88DMIPS/MHz, 又比标称的1.46DMIPS/MHz慢太多了...

出30入54汤圆

发表于 2022-3-10 09:57:22 | 显示全部楼层
楼主和我跑出来的差不多,GD32VF103 108M下Dhrystone开启flto分数是1.9491 DMIPS/MHz,Coremark是3.081 Coremark/MHz
48M下开启和未开启flto的Dhrystone分数是:1.9293   1.5218
由于GD32V的flash是sram模拟的,所以分数基本上和频率无关,我猜官方可能没有开flto?
我们自己也有设计RISCV的CPU,而且还是E指令集的不是完整的I,Dhrystone都能跑到2.36
RISCV跑Dhrystone的分数都是普遍碾压ARM的,Coremark分数的话也是比ARM高,不过没有Dhrystone的分数高的那么多

出30入54汤圆

发表于 2022-3-10 09:58:23 | 显示全部楼层
另外备注一下上面的编译基本参数均是GCC -O2

出0入442汤圆

发表于 2022-3-10 10:52:06 来自手机 | 显示全部楼层
cloudboy 发表于 2022-3-10 09:57
楼主和我跑出来的差不多,GD32VF103 108M下Dhrystone开启flto分数是1.9491 DMIPS/MHz,Coremark是3.081 Cor ...
(引用自4楼)

根据老外的测试,rv32imc/emc的指令密度比其它家的都低。。

出0入362汤圆

 楼主| 发表于 2022-3-10 10:54:25 | 显示全部楼层
cloudboy 发表于 2022-3-10 09:57
楼主和我跑出来的差不多,GD32VF103 108M下Dhrystone开启flto分数是1.9491 DMIPS/MHz,Coremark是3.081 Cor ...
(引用自4楼)

汗, 我也没开flto啊? 晚上回去加上-flto再试试. 难道是riscv-none-embed-gcc默认就开flto了?

出0入4汤圆

发表于 2022-3-10 10:57:43 来自手机 | 显示全部楼层
这东西烧写还能用jlink吗?

出0入362汤圆

 楼主| 发表于 2022-3-10 11:13:34 | 显示全部楼层
本帖最后由 tomzbj 于 2022-3-10 11:15 编辑
carefree1986 发表于 2022-3-10 10:57
这东西烧写还能用jlink吗?
(引用自8楼)


说起来比较折腾,

jlink v8/v9不支持, 据说得v10?
stlink, 肯定是不行的
gdlink, 得带jtag的版本, 只有swd的也不行

我买了个50多的山寨gdlink, 然后发现用gdlink的gui界面能写, 命令行界面一运行就卡住不动了, 但是gdlink那个gui实在是不好用.

然后呢, 某天看到说gdlink其实就是daplink, 于是翻出来老早以前买的一个daplink, 没想到这东西用gdlink的gui和cli都好使, 就它了.

购买链接如下, 当时才20多, 现在涨价了.

https://item.taobao.com/item.htm ... p;_u=a201cs8arcb61f

出0入4汤圆

发表于 2022-3-10 12:00:18 | 显示全部楼层
tomzbj 发表于 2022-3-10 11:13
说起来比较折腾,

jlink v8/v9不支持, 据说得v10?
(引用自9楼)

这么坑,GD的支持这么差劲

出0入25汤圆

发表于 2022-3-10 12:10:38 | 显示全部楼层

GD32VF103调试接口只支持JTAG,,要占4根引脚,,感觉有点儿浪费

出0入0汤圆

发表于 2022-3-10 13:59:34 | 显示全部楼层
XIVN1987 发表于 2022-3-10 12:10
GD32VF103调试接口只支持JTAG,,要占4根引脚,,感觉有点儿浪费
(引用自11楼)

JTAG是IEEE1149标准,swd是arm公司为了节省IO自己定义的,估计不能随便用。

出0入25汤圆

发表于 2022-3-10 14:29:38 | 显示全部楼层
vuo50z 发表于 2022-3-10 13:59
JTAG是IEEE1149标准,swd是arm公司为了节省IO自己定义的,估计不能随便用。
(引用自12楼)

可以支持cJTAG,,两线的JTAG,,IEEE 1149.7标准

出30入54汤圆

发表于 2022-3-10 17:15:21 | 显示全部楼层
wye11083 发表于 2022-3-10 10:52
根据老外的测试,rv32imc/emc的指令密度比其它家的都低。。
(引用自6楼)

RV的指令密度我感觉是肯定低的,很多高级指令都没有的,比如操作自增什么的

出0入25汤圆

发表于 2022-3-10 19:47:04 来自手机 | 显示全部楼层
cloudboy 发表于 2022-3-10 17:15
RV的指令密度我感觉是肯定低的,很多高级指令都没有的,比如操作自增什么的 ...
(引用自14楼)

risc-v存取指令的寻址模式没cortex-m灵活,但risc-v的内核寄存器比cortex-m多一倍还多,,程序中的load/store指令可能会少很多
回帖提示: 反政府言论将被立即封锁ID 在按“提交”前,请自问一下:我这样表达会给举报吗,会给自己惹麻烦吗? 另外:尽量不要使用Mark、顶等没有意义的回复。不得大量使用大字体和彩色字。【本论坛不允许直接上传手机拍摄图片,浪费大家下载带宽和论坛服务器空间,请压缩后(图片小于1兆)才上传。压缩方法可以在微信里面发给自己(不要勾选“原图),然后下载,就能得到压缩后的图片】。另外,手机版只能上传图片,要上传附件需要切换到电脑版(不需要使用电脑,手机上切换到电脑版就行,页面底部)。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|amobbs.com 阿莫电子技术论坛 ( 粤ICP备2022115958号, 版权所有:东莞阿莫电子贸易商行 创办于2004年 (公安交互式论坛备案:44190002001997 ) )

GMT+8, 2024-6-9 12:43

© Since 2004 www.amobbs.com, 原www.ourdev.cn, 原www.ouravr.com

快速回复 返回顶部 返回列表