fbwcpu 发表于 2022-1-6 20:55:53

STC 的核武器STC32 啥时候出来呀,我也给客户吹牛逼STC有高端芯片

STC 的核武器STC32M4啥时候出来呀,我也给客户吹牛逼STC有高端芯片,下一个产品升级到STC32M4{:cry:}

kitten 发表于 2022-1-6 21:14:51

核武器需要时间啊

kundi 发表于 2022-1-7 08:24:18

应该是STC32G系列的32位80251先出来

tomzbj 发表于 2022-1-7 11:05:13

加油, 早点弄出来, 我也可以早点更新我的dhrystone数据

MCU                Opt      Compiler                   Freq/MHz   Time/ms   DMIPS       DMIPS/MHz

AMD R5-3600X       O3         gcc 5.1.0                  4350      0.02    24322.73         5.59
AMD R5-3600X       Os         gcc 5.1.0                  4350      0.05    11383.04         2.62
GD32FFPRTGU6       O3         arm-none-eabi-gcc 4.9.3       280      1.76      323.38         1.15
GD32F350CBT6       O3         arm-none-eabi-gcc 4.9.3       280      1.80      316.20         1.13
STM32F407VET6      O3         arm-none-eabi-gcc 4.9.3       168      2.59      219.75         1.31
GD32FFPRTGU6       O3         arm-none-eabi-gcc 4.9.3       168      2.93      194.25         1.16
GD32E103         O3         arm-none-eabi-gcc 4.9.3       120      3.77      150.97         1.26
GD32F350CBT6       O3         arm-none-eabi-gcc 4.9.3       108      4.57      124.54         1.15
STM32F407VET6      Os         arm-none-eabi-gcc 4.9.3       168      4.84      117.59         0.70
STM32F401RET6      O3         arm-none-eabi-gcc 4.9.3      84      5.21      109.24         1.30
ESP8266            O3         xtensa-lx106-elf-gcc 8.4.0   80      6.38       89.21         1.12
GD32E103         Os         arm-none-eabi-gcc 4.9.3       120      8.11       70.18         0.58
STM32F103VET6      O3         arm-none-eabi-gcc 4.9.3      72      8.71       65.34         0.91
STM32F401RET6      Os         arm-none-eabi-gcc 4.9.3      84      9.19       61.93         0.74
ESP8266            Os         xtensa-lx106-elf-gcc 8.4.0   80   12.20       46.65         0.58
STM32F070CBT6      O3         arm-none-eabi-gcc 4.9.3      48   14.90       38.20         0.80
STM32F103VET6      Os         arm-none-eabi-gcc 4.9.3      72   18.33       31.05         0.43
STM32F407VET6      O3         arm-none-eabi-gcc 4.9.3      16   27.00       21.08         1.32
STM32F401RET6      O3         arm-none-eabi-gcc 4.9.3      16   27.23       20.90         1.31
STM32F070CBT6      Os         arm-none-eabi-gcc 4.9.3      48   27.52       20.68         0.43
GD32E103         O3         arm-none-eabi-gcc 4.9.3         8   55.10       10.33         1.29
STM32F103VET6      O3         arm-none-eabi-gcc 4.9.3         8   59.00      9.65         1.21
GD32FFPRTGU6       O3         arm-none-eabi-gcc 4.9.3         8   61.50      9.25         1.16
GD32F350CBT6       O3         arm-none-eabi-gcc 4.9.3         8   61.55      9.25         1.16
ATMEGA328P         O3         avr-gcc 7.3.0                  16   71.90      7.92         0.49
ATMEGA328P         Os         avr-gcc 7.3.0                  16   74.00      7.69         0.48
STM32F070CBT6      O3         arm-none-eabi-gcc 4.9.3         8   80.00      7.11         0.89
GD32E103         Os         arm-none-eabi-gcc 4.9.3         8   96.00      5.93         0.74
STM8L151G6U6       fast       cosmic c 4.4.12                16    107.10      5.31         0.33
STM8S003F3U6       fast       cosmic c 4.4.12                16    107.20      5.31         0.33
STM8S003F3U6       compact    cosmic c 4.4.12                16    108.10      5.27         0.33
STM8L151G6U6       compact    cosmic c 4.4.12                16    121.00      4.70         0.29
STC8A8K64S4A       opt-code-speedsdcc 3.8.0                24    254.00      2.24         0.09
NRF24LE1         opt-code-size   sdcc 3.8.0                16    883.00      0.64         0.04
NRF24LE1         opt-code-speedsdcc 3.8.0                16    884.00      0.64         0.04

洞洞幺 发表于 2022-1-7 11:14:42

这你也信,你都知道他们都没有草稿本的。

makesoft 发表于 2022-1-7 11:14:42

tomzbj 发表于 2022-1-7 11:05
加油, 早点弄出来, 我也可以早点更新我的dhrystone数据

8266但从速度来看,性价比是真高啊

gonboy 发表于 2022-1-7 11:41:41

kundi 发表于 2022-1-7 12:10:52

tomzbj 发表于 2022-1-7 11:05
加油, 早点弄出来, 我也可以早点更新我的dhrystone数据

我之前8月做的用STC8H和STC16分别做的dhrystone测试,您没有在此贴上去。
stc8a8k这个结果,应该是可以和我用STC8H的效果一样的。您测得0.09应该是所有变量都在xdata里面的效果。
等会我贴上来。

kundi 发表于 2022-1-7 12:18:39

本帖最后由 kundi 于 2022-1-7 13:52 编辑

见https://www.amobbs.com/forum.php?mod=viewthread&tid=5752164&extra=page%3D1&mobile=2的61楼。
在16MHz下,STC16为9.68ms(数据都不放xadata区);
也是16MHz, STC8约为56ms.(注意常用数据的放在data区)。

tomzbj 发表于 2022-1-7 13:00:32

kundi 发表于 2022-1-7 12:18
见https://www.amobbs.com/forum.php?mod=viewthread&tid=5752164&extra=page%3D1&mobile=2的11楼。
在16MH ...

我的数据已经和若干朋友互相验证过了, stc8用keil编译大概比sdcc能快20%.

你这个过于离谱, 没法认可.

按你的说法, stc16同频性能是stc8的6倍左右, 那就是和stm8差不多, 还没赶上avr的水平.       

tomzbj 发表于 2022-1-7 13:01:52

makesoft 发表于 2022-1-7 11:14
8266但从速度来看,性价比是真高啊

esp32应该能再快点吧, 我买了个esp12模块, 还没试.

kundi 发表于 2022-1-7 13:46:45

本帖最后由 kundi 于 2022-1-7 13:53 编辑

tomzbj 发表于 2022-1-7 13:00
我的数据已经和若干朋友互相验证过了, stc8用keil编译大概比sdcc能快20%.

你这个过于离谱, 没法认可.


除了结果截图,我实际所用原代码已经在那里贴过了的,是我亲自测量得到的结果,不存在故意作弊行为。难道是后续没有用我实际的代码去再次互相验证?

如果允许,可以让版主或老姚等来评判一下。

我所用的电脑是联想V330-15IGM,处理器为牙膏厂的Celeron N4100, 1.1GHz,不可能因为实验所用电脑不一样而效果相差特别大吧。

redroof 发表于 2022-1-7 13:59:11

tomzbj 发表于 2022-1-7 11:05
加油, 早点弄出来, 我也可以早点更新我的dhrystone数据

一会下午我测测我手上的800兆的cortexA7,看看有多少

tomzbj 发表于 2022-1-7 14:41:50

kundi 发表于 2022-1-7 13:46
除了结果截图,我实际所用原代码已经在那里贴过了的,是我亲自测量得到的结果,不存在故意作弊行为。难道 ...

把LOOPS从1000改成100, 是你干的不是? 这不叫作弊, 什么叫作弊?

redroof 发表于 2022-1-7 14:41:57

本帖最后由 redroof 于 2022-1-7 15:45 编辑

tomzbj 发表于 2022-1-7 13:01
esp32应该能再快点吧, 我买了个esp12模块, 还没试.

(我用的原版Dhrystones,啥也没改,刚发现它内部的计时精度好像只有1秒,所以得用非常多的次数才能测准,重新测了一遍,如下:)

首先是我的电脑的性能:
thinkpad P1,I7-9850,主频2.6G,最高睿频4.6G
linux虚拟机,gcc5.4.0 优化等级-O3
测试次数20亿次,
Dhrystones per Second: 47619048.0
=27102.5 DMIPS(/1757)
换算5.89 DMIPS/MHz

跟你的电脑基本一样

然后是手上的IMX6板子,主频792兆
gcc 5.3.0 优化等级-O3
测试次数2亿次,
Dhrystones per Second: 3508772.0
=1997.0 DMIPS(/1757)

换算2.52 DMIPS/MHz

tomzbj 发表于 2022-1-7 14:52:32

redroof 发表于 2022-1-7 14:41
首先是我的电脑的性能:
thinkpad P1,I7-9850,主频2.6G,最高睿频4.6G
linux虚拟机,gcc5.4.0 优化等级 ...

应该是睿频起作用了吧
再试试-Os看看会不会慢一半?

redroof 发表于 2022-1-7 14:57:03

tomzbj 发表于 2022-1-7 14:52
应该是睿频起作用了吧
再试试-Os看看会不会慢一半?

电脑-Os优化
Dhrystones per Second: 26666666.0
=15177.4 DMIPS(/1757)
换算结果3.3 DMIPS/MHz
就是按4.6G主频换算的,我知道单核情况下肯定是跑满睿频的

mypear 发表于 2022-1-7 15:17:31

tomzbj 发表于 2022-1-7 11:05
加油, 早点弄出来, 我也可以早点更新我的dhrystone数据

用啥工具测试?

tomzbj 发表于 2022-1-7 15:20:42

mypear 发表于 2022-1-7 15:17
用啥工具测试?

dhrystone2.1
链接如下, 见27楼
https://www.amobbs.com/forum.php?mod=viewthread&tid=5752164&extra=page%3D1

makesoft 发表于 2022-1-7 15:45:12

tomzbj 发表于 2022-1-7 14:41
把LOOPS从1000改成100, 是你干的不是? 这不叫作弊, 什么叫作弊?

神操作{:lol:} {:lol:}

redroof 发表于 2022-1-7 16:07:28

我来发一个dhrystone 2.1 原版,没给单片机做任何移植,设计成在linux上可以直接被gcc编译:
(因为只用C库,时间精度只有1秒,请确保测试次数足够大,要运行几十秒以上才行)


kundi 发表于 2022-1-7 16:14:30

tomzbj 发表于 2022-1-7 14:41
把LOOPS从1000改成100, 是你干的不是? 这不叫作弊, 什么叫作弊?

因为当初是给STC8来测试的,感觉用100比较合适,容易快些从串口助手看出结果。

但是用了逻辑分析器后,就不需要循环多次了,直接在逻辑分析器上看每次运行后的时长,但其实每次时长都几乎一致。

tomzbj 发表于 2022-1-7 16:18:08

kundi 发表于 2022-1-7 16:14
因为当初是给STC8来测试的,感觉用100比较合适,容易快些从串口助手看出结果。

但是用了逻辑分析器后, ...

我那儿其他MCU都是用1000, 你改成100了, 那你最后的结果当然得乘以10才算数了.

mypear 发表于 2022-1-7 16:38:58

tomzbj 发表于 2022-1-7 15:20
dhrystone2.1
链接如下, 见27楼
https://www.amobbs.com/forum.php?mod=viewthread&tid=5752164&extra=pa ...

收到         

amigenius 发表于 2022-1-7 17:09:03

大神测试一下H7看看, 貌似宣传有2.1DMIPS

redroof 发表于 2022-1-7 18:40:05

本帖最后由 redroof 于 2022-1-7 18:41 编辑

amigenius 发表于 2022-1-7 17:09
大神测试一下H7看看, 貌似宣传有2.1DMIPS

我的IMX6,核心是CortexA7,网上说标称1.9DMIPS每兆,但我实测的2.5啊,不知道哪里的问题,或者是我现在这个编译器的优化更好?
CortexM7只有没有MMU,计算能力应该跟我这个A7一样吧。。

kundi 发表于 2022-1-7 19:07:33

tomzbj 发表于 2022-1-7 16:18
我那儿其他MCU都是用1000, 你改成100了, 那你最后的结果当然得乘以10才算数了. ...

我周末可以重新按1000来测试一下,也可下周上班后用办公室的示波器和电脑重新复核一下结果。

amigenius 发表于 2022-1-7 20:00:42

redroof 发表于 2022-1-7 18:40
我的IMX6,核心是CortexA7,网上说标称1.9DMIPS每兆,但我实测的2.5啊,不知道哪里的问题,或者是我现在 ...

参看https://www.amobbs.com/thread-5689679-1-1.html

PPS 发表于 2022-1-7 21:11:03

redroof 发表于 2022-1-7 18:40
我的IMX6,核心是CortexA7,网上说标称1.9DMIPS每兆,但我实测的2.5啊,不知道哪里的问题,或者是我现在 ...

有没有可能是cache的原因?程序全部在cache里面跑了,测试的是cache的性能?

tomzbj 发表于 2022-1-7 21:35:03

PPS 发表于 2022-1-7 21:11
有没有可能是cache的原因?程序全部在cache里面跑了,测试的是cache的性能? ...

有可能, dhrystone规模太小了...

redroof 发表于 2022-1-7 21:46:25

本帖最后由 redroof 于 2022-1-7 21:47 编辑

PPS 发表于 2022-1-7 21:11
有没有可能是cache的原因?程序全部在cache里面跑了,测试的是cache的性能? ...

循环核心原本就该装在cache里啊,没毛病。cache是高速cpu必不可少的组成部分。没有cache要那么高的cpu频率干啥?主内存才能跑多少频率?还有那么高的延迟。
这些cpu的标称性能就是在有良好的cache的情况下测到的。非要关掉cache至少会慢几倍,多一点慢几十倍也不希奇

tomzbj 发表于 2022-1-10 23:31:16

redroof 发表于 2022-1-7 21:46
循环核心原本就该装在cache里啊,没毛病。cache是高速cpu必不可少的组成部分。没有cache要那么高的cpu频 ...

我在树莓派zero上也试了, 也是800M主频, BCM2835

-O3编译时 0.40ms,1422.88DMIPS,      1.78DMIPS/MHz
-Os编译时 0.71ms,   798.25DMIPS,   1.00DMIPS/MHz

好象比你的imx6慢挺多啊~

redroof 发表于 2022-1-11 08:53:43

本帖最后由 redroof 于 2022-1-11 09:10 编辑

tomzbj 发表于 2022-1-10 23:31
我在树莓派zero上也试了, 也是800M主频, BCM2835

-O3编译时 0.40ms,1422.88DMIPS,      1.78DMIPS/MHz ...

你用的是我上面那个c代码吗?
我就感觉那一份是不是原版,或者是不是什么地方要移植才能对。
不过刚查了你的bcm2835是个比较老的ARM11核心,而我这个是比较新的双发射的A7核心,每个时钟可以执行两条指令,所以这个结果也说得过去。
之前我还试过NUC980,是个300兆的ARM9 ,然后跑测试程序只有我以前买的530兆版本的IMX6的1/3性能,扣除主频差别,同频性能只有这个的60%不到。换算下来也就是DMIPS应该是1.4,只有你ARM11的80%,这样看也就合理了,哈哈。
ARM公司这么多年的架构进化肯定是有用的啊。就像电脑CPU,多少年来都是4G的主频上限,再没升级过了,但是性能分数照样每一代都升高不少

tomzbj 发表于 2022-1-11 09:31:24

redroof 发表于 2022-1-11 08:53
你用的是我上面那个c代码吗?
我就感觉那一份是不是原版,或者是不是什么地方要移植才能对。
不过刚查了 ...

我那个应该没问题, 测STM32F103VET6, O3优化, 8M主频(0等待周期)时1.21DMIPS/MHz
和官方标称的1.25DMIPS/MHz基本符合.

redroof 发表于 2022-1-11 09:48:18

tomzbj 发表于 2022-1-11 09:31
我那个应该没问题, 测STM32F103VET6, O3优化, 8M主频(0等待周期)时1.21DMIPS/MHz
和官方标称的1.25DMIPS/ ...

但是ARM11的标称DMIPS性能也是1.2啊,你测到的1.78,是150%左右
A7标称1.9,我测到2.5,是130%左右
我们俩想统一标准还是你用我那一份直接编译吧,我那一份是原版,纯linux不依赖任何单片机的定时器什么的,直接用标准gcc就可以编译运行。你在ARM11的开发环境里面一字不改就能直接过。
你那个给单片机移植的版本我还得改一大堆东西才能在我这里编译{:titter:}

rootxie 发表于 2022-1-11 21:19:28

过段时间可以改成STC64,可以称全球第一个64位单片机{:titter:}

kundi 发表于 2022-1-11 22:28:43

rootxie 发表于 2022-1-11 21:19
过段时间可以改成STC64,可以称全球第一个64位单片机

去年就听说ST就已经在研发这玩意,不知道何时开始送样。

rootxie 发表于 2022-1-12 08:17:54

kundi 发表于 2022-1-11 22:28
去年就听说ST就已经在研发这玩意,不知道何时开始送样。

不是说STC32就是STC16改名而来的东西吗 {:titter:}

kundi 发表于 2022-1-12 08:27:06

rootxie 发表于 2022-1-12 08:17
不是说STC32就是STC16改名而来的东西吗

那个STC32G就是32位80251,改自之前STC16。这是和ARM核的STC32M4系列有区别的

modbus 发表于 2022-1-12 10:56:51

rootxie 发表于 2022-1-11 21:19
过段时间可以改成STC64,可以称全球第一个64位单片机

估计STC32M4会改成STC64,因为里面有64位运算

国学芯用 发表于 2022-1-12 11:01:39

STC32G12K128-LQFP64,LQFP48,从 4月开始,每月110K产能,从 6月开始每月220K产能

洞洞幺 发表于 2022-1-12 14:09:29

有swd调试接口吧?

tomzbj 发表于 2022-1-12 14:57:36

redroof 发表于 2022-1-11 09:48
但是ARM11的标称DMIPS性能也是1.2啊,你测到的1.78,是150%左右
A7标称1.9,我测到2.5,是130%左右
我们 ...

用你那个在pi zero上又试了一下,

-O3时1897.2DMIPS,2.37DMIPS/MHz, 比之前还快了
-Os时813.1DMIPS, 1.02DMIPS/MHz, 和之前基本一样.

tomzbj 发表于 2022-1-12 15:06:56

本帖最后由 国学芯用 于 2022-1-12 15:20 编辑

国学芯用 发表于 2022-1-12 11:01
STC32G12K128-LQFP64,LQFP48,从 4月开始,每月110K产能,从 6月开始每月220K产能 ...

★ 系统效率高:运行于 30MHz 工作频率的 STC32G 系列的指令效率大约相当于 60MHz 工作频率的 M0

根据"Cortex-M0权威指南"的说法, M0的性能是0.9DMIPS/MHz, 那就是说这东西有54DMIPS的性能?
让这东西也跑个dhrystone, 把数据贴上来呗


redroof 发表于 2022-1-12 16:42:52

tomzbj 发表于 2022-1-12 14:57
用你那个在pi zero上又试了一下,

-O3时1897.2DMIPS,2.37DMIPS/MHz, 比之前还快了


跑的时间够长吗?次数要写多一点,让它跑几十秒以上才行,因为只能用c库,时间精度只有1秒。

tomzbj 发表于 2022-1-12 19:14:30

redroof 发表于 2022-1-12 16:42
跑的时间够长吗?次数要写多一点,让它跑几十秒以上才行,因为只能用c库,时间精度只有1秒。 ...

1000万次吧?明天我再试试,应该不会差太多

redroof 发表于 2022-1-12 19:28:04

tomzbj 发表于 2022-1-12 19:14
1000万次吧?明天我再试试,应该不会差太多

我是用10亿次和20亿次的。int32的上限是20亿多一点点,所以没法用更多的次数了。
除非你改过程序,否则低于1亿次的只要几秒就算完了,用1秒精度的时间根本算不准

鲜衣怒马 发表于 2022-1-13 00:06:10

19楼的程序是改过的(int Arr_1_Glob ,int Arr_2_Glob ,21楼发的为50,代码也有变动),21楼的原版在单片机上运行要移植

暂时用19楼的跑了下, 新唐的 M482,M4内核,192M,Keil MDK5.13-O3

314 DMIPS   1.63DMIPS/MHz比ARM官方的1.25要高,但跑CoreMark得分是501.73(2.61/MHz),比官方的3.38要低

amigenius 发表于 2022-1-13 00:36:38

rootxie 发表于 2022-1-11 21:19
过段时间可以改成STC64,可以称全球第一个64位单片机

做m7还可以改成STC128,因为有128位的SIMD指令

tomzbj 发表于 2022-1-13 10:26:19

redroof 发表于 2022-1-12 19:28
我是用10亿次和20亿次的。int32的上限是20亿多一点点,所以没法用更多的次数了。
除非你改过程序,否则低 ...

今天试验的结果, 感觉变化不大, 在误差范围内
-O3
1e7: 1897.2DMIPS, 2.37DMIPS/MHz
1e8: 1724.7DMIPS, 2.16DMIPS/MHz
1e9: 1729.9DMIPS, 2.16DMIPS/MHz

-Os
1e7: 813.1DMIPS, 1.02DMIPS/MHz
1e8: 837.0DMIPS, 1.05DMIPS/MHz
1e9: 833.3DMIPS, 1.04DMIPS/MHz

redroof 发表于 2022-1-13 10:45:19

本帖最后由 redroof 于 2022-1-13 12:24 编辑

tomzbj 发表于 2022-1-13 10:26
今天试验的结果, 感觉变化不大, 在误差范围内
-O3
1e7: 1897.2DMIPS, 2.37DMIPS/MHz


那就是2.16DMIPS/MHz呗,相当于我测到的80%
反正比A7低一点,说得过去啊。也没有人知道A7的双发射对不同的程序到底能有多大的效果,只能以测试为准了{:titter:}

或者你也试一下coremark吧
https://github.com/eembc/coremark
linux开发环境下面不需要移植,除了自己改各种优化级别之外,直接就能用

刚发现coremark官网有你这个BCM2835 (Raspberry Pi Zero)的结果
它是用的1G主频的,分数1303.8
CoreMark/MHz是1.8625
这样跟我的A7的比例就比较接近官方标称MIPS性能的比例了。把Coremark值除以1.55基本就是官方标称的MIPS数:
1.86/1.55=1.2
3/1.55=1.9

redroof 发表于 2022-1-13 11:19:33

本帖最后由 redroof 于 2022-1-13 11:37 编辑

鲜衣怒马 发表于 2022-1-13 00:06
19楼的程序是改过的(int Arr_1_Glob ,int Arr_2_Glob ,21楼发的为50,代码也有变动),21 ...

我刚才也试了一下Coremark,用的github上的原版,它会自动识别系统是linux,我只把原本的优化选项从-O2改成-O3,其它的啥也没动,直接make就可以成功
在我的IMX6上运行结果是2382次每秒,用主频792换算结果是3.0 coremark/MHz

补充:刚又试了一下用原版默认的-O2选项,啥也不改,那么我这个的测试结果是2210次每秒,等于2.79 coremark/MHz

kundi 发表于 2022-1-13 11:38:47

我刚刚用单位的DELL台式机电脑,接逻辑分析器,STC8G系列在和之前相同条件下,16MHZ完成一次dhrystone,用时约64.3ms,和我之前做的相差不算大。

kundi 发表于 2022-1-13 12:07:48

然后,换相同条件下的STC16上去测试。
结果也显示约9.7ms.

但是,如果程序开头把WTST=0;去掉,就会变成约54ms.

redroof 发表于 2022-1-13 12:19:09

本帖最后由 redroof 于 2022-1-13 13:06 编辑

kundi 发表于 2022-1-13 12:07
然后,换相同条件下的STC16上去测试。
结果也显示约9.7ms.



54ms一次,换算结果是0.01MIPS
升到9.7ms一次也不过0.06MIPS而已
补充,这个程序是算100次输出一次的,所以要乘100,是1MIPS和6 MIPS
所以就不要宣传那些古老架构的单片机有多么快速了。。。
只不过从蜗牛速度加快到乌龟速度而已
离兔子或者猎豹的速度还差的没边呢

kundi 发表于 2022-1-13 12:25:52

本帖最后由 kundi 于 2022-1-13 12:27 编辑

redroof 发表于 2022-1-13 12:19
54ms一次,换算结果是0.01MIPS
升到9.7ms一次也不过0.06MIPS而已
所以就不要宣传那些古老架构的单片机有 ...

注意,条件是主频16MHZ下。以及没有进行多次循环才输出。每完成一次就输出

redroof 发表于 2022-1-13 12:30:09

kundi 发表于 2022-1-13 12:25
注意,条件是主频16MHZ下。

没错啊。
近二十年来设计的现代化的cpu,怎么都该有1mips每兆左右,差的0.x,好一点的1.x或者2-3,电脑cpu可以高到5,
你这个0.06除以主频16兆,只有0.0038 mips每兆,慢死了

tomzbj 发表于 2022-1-13 12:55:34

redroof 发表于 2022-1-13 12:30
没错啊。
近二十年来设计的现代化的cpu,怎么都该有1mips每兆左右,差的0.x,好一点的1.x或者2-3,电脑cp ...

他那个一次里面其实是100次,0.38DMIPS/MHz,还凑合,赶上STM8了。和avr还有点距离。

redroof 发表于 2022-1-13 13:04:44

本帖最后由 redroof 于 2022-1-13 13:22 编辑

tomzbj 发表于 2022-1-13 12:55
他那个一次里面其实是100次,0.38DMIPS/MHz,还凑合,赶上STM8了。和avr还有点距离。 ...

哦,这样啊,那还差不多,至少跟别人一个数量级了。
但是只赶上stm8,低于avr,也不算什么高性能啊。离他想超越的M0还远呢。
而且低主频的情况下跟别人对比mips/MHz是占便宜的,因为flash速度不会成为拖累。比如stm32f103在24兆和72兆测试结果就根本不可能有3倍。72兆的时候flash要分频,会降低性能。
常见的M0主频应该是48兆为多,flash也要2分频,除非人家也降到24兆不分频跟他这个来比mips/MHz才公平
刚发现你上面的测试结果里面有STM32F070降到8兆的,8兆肯定flash不用分频了,可以得到理论最高性能了,测到0.89mips/MHz,跟官方标称值是一样的。

kundi 发表于 2022-1-13 13:27:33

redroof 发表于 2022-1-13 13:04
哦,这样啊,那还差不多,至少跟别人一个数量级了。
但是只赶上stm8,低于avr,也不算什么高性能啊。离他 ...

他之前说16MHz下,9点几大约是3.79DMIPS/MHZ。

kundi 发表于 2022-1-13 13:30:14

tomzbj 发表于 2022-1-13 12:55
他那个一次里面其实是100次,0.38DMIPS/MHz,还凑合,赶上STM8了。和avr还有点距离。 ...

那个100次的LOOP其实后来就没有用上。每运行一次完dhrystone()函数就输出。

redroof 发表于 2022-1-13 13:35:28

本帖最后由 redroof 于 2022-1-13 13:38 编辑

kundi 发表于 2022-1-13 13:27
他之前说16MHz下,9点几大约是3.79DMIPS/MHZ。

那肯定不可能啊。
双发射的A7也就2.5,电脑cpu是乱序的一大堆执行单元,也就堆岀5.x的性能
我就不信一个简单的cpu能做到3.x,要说0.3x还比较可信
单个周期不能执行多条指令的cpu,撑死也就1.x的性能,不可能更高。超过2的都得是多发射。
上面的arm11已经是很好的例子了

kundi 发表于 2022-1-13 13:46:18

本帖最后由 kundi 于 2022-1-13 13:48 编辑

redroof 发表于 2022-1-13 13:35
那肯定不可能啊。
双发射的A7也就2.5,电脑cpu是乱序的一大堆执行单元,也就堆岀5.x的性能
我就不信一个 ...

那么,你们用的算法在下面图中 TIME/ms,是跑100或1000次后每次的平均值吧?。如果不是的话,那应该改名100(1000)TIMES/ms。

我手上有个STM32F103,等会修改程序后烧录进去再试试。

redroof 发表于 2022-1-13 13:50:58

本帖最后由 redroof 于 2022-1-13 13:59 编辑

kundi 发表于 2022-1-13 13:46
那么,你们用的算法在下面图中 TIME/ms,是跑100或1000次后每次的平均值吧?。如果不是的话,那应该改名10 ...

MIPS的定义是每秒运行1757次的性能等于1MIPS
常数1757来自于以前第一个标称1MIPS的cpu的实测值。以后大家就用它做标准了。
你想运行多少次输出一次都无所谓啊,让时间别太短,好算就行。最后报告的时候都是按原始运行次数换算的
实际上,非多发射的cpu每个时钟根本不可能执行超过1条的指令。实测的高于1的MIPS值的意思是这个cpu执行相同的c程序操作所花费的时钟数比第一个当标准的cpu快的倍数。

洞洞幺 发表于 2022-1-14 08:29:17

本帖最后由 洞洞幺 于 2022-1-14 08:37 编辑

只要不是专业的芯片设计人员,感觉不用操那么多心在什么芯片速度的比较上吧?
还是在实践中考虑各种各样有效的解决方案比较的有实际意义,就像军事爱好者和真正的士兵的差别一样,得在实战中打赢才行,而国产芯片除了营销,没有什么真功夫的,连宇宙第一的华为也是说得牛逼其实被老美一按就死。
还是安安心心用可靠好用,开发生态好的国外芯片,把精力花在解决问题上,少花点时间在芯片的坑上,争取卖高点价格,快点用在量产出货赚钱上。除了担心国内销售炒货,我们是不用担心芯片封锁会到8位,16位,m0这种低端芯片上来的。

redroof 发表于 2022-1-14 09:49:50

洞洞幺 发表于 2022-1-14 08:29
只要不是专业的芯片设计人员,感觉不用操那么多心在什么芯片速度的比较上吧?
还是在实践中考虑各种各样有 ...

但是,自己做的明明是个性能很差的东西,你可以宣传性价比啊,供货啊什么的,但是不能空口白牙说自己比业界主流的cpu性能好啊{:titter:}
性能太好测了,为什么不测呢?
很多有经验的设计师拿到一个新的平台第一步就是跑性能测试的。
性能明显不够自己用就赶紧换啊,花了很多时间开发程序最后才发现性能不够,之前的开发时间不都搭进去了?

tomzbj 发表于 2022-1-15 09:40:49

redroof 发表于 2022-1-14 09:49
但是,自己做的明明是个性能很差的东西,你可以宣传性价比啊,供货啊什么的,但是不能空口白牙说自己比业 ...

在我的旧x1c上也试了一下, i7-4600u, 睿频3GHz

-Os:   8893.0DMIPS, 2.96DMIPS/MHz
-O3:   18359.7DMIPS, 6.12DMIPS/MHz

没想到老i7的效率这么高, 单核性能还能达到R5-3600X的3/4, 同频性能还略高一点点

redroof 发表于 2022-1-15 12:05:51

tomzbj 发表于 2022-1-15 09:40
在我的旧x1c上也试了一下, i7-4600u, 睿频3GHz

-Os:   8893.0DMIPS, 2.96DMIPS/MHz


没毛病啊
英特尔挤牙膏挤了好多年了{:titter:}
很老的CPU其实单线程执行性能都是足够好的
最近很多年都是提升多核了,单核快到顶了
还有,你的换算的时候要按睿频的主频算,单核肯定是跑睿频最高值的,跟标称频率没关系

redroof 发表于 2022-1-15 14:22:21

tomzbj 发表于 2022-1-15 09:40
在我的旧x1c上也试了一下, i7-4600u, 睿频3GHz

-Os:   8893.0DMIPS, 2.96DMIPS/MHz


刚我查了,你的i7-4600U睿频是3.3G
18359/3300=5.56 DMIPS/MHz
跟你的AMD CPU几乎一样
我的I7-9850是5.89,这样就比较正常了。第9代比第5代i7只提高了6%的同频性能{:titter:}

PPS 发表于 2022-1-15 14:32:42

redroof 发表于 2022-1-15 14:22
刚我查了,你的i7-4600U睿频是3.3G
18359/3300=5.56 DMIPS/MHz
跟你的AMD CPU几乎一样


这个楼彻底歪了{:lol:} {:lol:} {:lol:}

tomzbj 发表于 2022-1-15 17:29:55

PPS 发表于 2022-1-15 14:32
这个楼彻底歪了

我就奇怪, 为啥等这么久没有个STC的正经数据?
要么STC大佬们把STC16, STC32什么的开发板给redroof和我一人发一块, 我们帮他测呗.

redroof 发表于 2022-1-17 11:50:36

tomzbj 发表于 2022-1-15 17:29
我就奇怪, 为啥等这么久没有个STC的正经数据?
要么STC大佬们把STC16, STC32什么的开发板给redroof和我一 ...

我没空测啊,超过10年没用过51系列了,给你测就行。
你都测过那么多板子了,多测一个也是手到擒来{:titter:}
我对这种低性能CPU的精确参数不感兴趣,反正都是菜鸡互啄,知道个大概就行了

modbus 发表于 2022-1-17 12:15:57

tomzbj 发表于 2022-1-15 17:29
我就奇怪, 为啥等这么久没有个STC的正经数据?
要么STC大佬们把STC16, STC32什么的开发板给redroof和我一 ...

看过官方测试数据,不进行针对性优化下(数据都放在XDATA区),S80251XC3内核(STC32G)为0.665DMIPS/MHz,S8051XC3内核(STC8)为0.088DMIPS/MHz

kundi 发表于 2022-1-17 14:13:13

modbus 发表于 2022-1-17 12:15
看过官方测试数据,不进行针对性优化下(数据都放在XDATA区),S80251XC3内核(STC32G)为0.665DMIPS/MHz ...

CAST的S80251XC3,官方网站上却说是0.65DIMPS/MHz。不过相差也不大
STC官方并没有说STC16/8就是原封不动的用了CAST的内核,不排除在已买内核上自己又做了小修改的可能

tomzbj 发表于 2022-1-17 17:15:19

modbus 发表于 2022-1-17 12:15
看过官方测试数据,不进行针对性优化下(数据都放在XDATA区),S80251XC3内核(STC32G)为0.665DMIPS/MHz ...

zan
这个数据和我测的一致,STC8A8K64S4A, opt-code-speed,   sdcc 3.8.0, 2.24DMIPS@24MHz,0.09DMIPS/MHz

STC32这个0.665DMIPS/MHz超过AVR了, 不过不知道主频最高能跑到多少? 和M0的0.9DMIPS/MHz还有点距离。

kundi 发表于 2022-2-8 15:56:33

最近几天官方网站上说STC32位8051晶圆即将要回来了

矩阵时间 发表于 2022-3-6 11:20:34

kundi 发表于 2022-1-17 14:13
CAST的S80251XC3,官方网站上却说是0.65DIMPS/MHz。不过相差也不大
STC官方并没有说STC16/8就是原封不动 ...
(引用自74楼)



查了一下,CAST 公司的 S8051XC3 核现在有 3 种规格了

kundi 发表于 2022-3-6 17:57:42

我申请的STC32G样片到货了

rclong 发表于 2022-3-12 22:48:45

kundi 发表于 2022-3-6 17:57
我申请的STC32G样片到货了
(引用自78楼)

现在他们还出PDIP40封装的啊

modbus 发表于 2022-3-13 10:43:59

STC要准备搞500MHz的32位8051

kundi 发表于 2022-3-13 18:38:35

rclong 发表于 2022-3-12 22:48
现在他们还出PDIP40封装的啊
(引用自79楼)

是呀,说是为了方便大家测试。

lb0857 发表于 2022-3-14 08:27:55

kundi 发表于 2022-3-6 17:57
我申请的STC32G样片到货了
(引用自78楼)

STc_link 赠送吗{:tongue:}

zllhfl 发表于 2022-3-14 19:41:45

测试 STC32G2路can接收1ms发给他一次 直接can中断就再也进不去了

国学芯用 发表于 2022-3-15 11:32:22

本帖最后由 国学芯用 于 2022-3-15 11:33 编辑

zllhfl 发表于 2022-3-14 19:41
测试 STC32G2路can接收1ms发给他一次 直接can中断就再也进不去了
(引用自83楼)



国学芯用 发表于 2022-3-15 11:34:41

STC32G12K128单片机手册,3/12:https://www.stcmcudata.com/STC8F-DATASHEET/STC32G.pdf
STC32G实验箱演示程序,3/11:https://www.stcmcudata.com/STC8F-DATASHEET/STC32G-DEMO-CODE.ZIP
最新STC32G/STC8H实验箱原理图:https://www.stcmcudata.com/STC8F-DATASHEET/STC8H8K64U-V9.3-20220224-SCH.pdf

zllhfl 发表于 2022-3-16 08:51:54

国学芯用 发表于 2022-3-15 11:34
STC32G12K128单片机手册,3/12:https://www.stcmcudata.com/STC8F-DATASHEET/STC32G.pdf
STC32G实验箱演示 ...
(引用自85楼)





今天下载官网例程 测试 标准帧开2路,用can盒子1ms发一次,没有问题,
但是扩展帧 会报SR=0XA0

国学芯用 发表于 2022-3-16 16:14:04

zllhfl 发表于 2022-3-16 08:51
今天下载官网例程 测试 标准帧开2路,用can盒子1ms发一次,没有问题,
但是扩展帧 会报SR=0XA0 ...
(引用自86楼)

STC32G12K128的 2组独立CAN, 具体如何使用,请 直接 电话 STC, CAN 应用 工程师 :陈工198-6458,5985,<9:00-12:00,13:00-17:30,工作日的 周一到周五,其他时间按国家规定休息时间>
页: [1]
查看完整版本: STC 的核武器STC32 啥时候出来呀,我也给客户吹牛逼STC有高端芯片