搜索
bottom↓
回复: 35

DSP和cortex A9做运算对比,感觉有点差异啊。

[复制链接]

出0入22汤圆

发表于 2017-4-11 16:36:45 | 显示全部楼层 |阅读模式
测试代码如下:

  1. void img_test(void)
  2. {
  3.         volatile unsigned int i,j,k,l;
  4.         volatile double a,b,c,d;
  5.         a=1;
  6.         b=2;
  7.         c=3;
  8.         d=4;
  9.         for(i=0;i<1000;i++)
  10.         {
  11.                 a+=0.3;
  12.         }
  13.         for(j=0;j<1000;j++)
  14.         {
  15.                 b-=0.3;
  16.         }
  17.         for(k=0;k<1000;k++)
  18.         {
  19.                 c*=0.3;
  20.         }
  21.         for(l=0;l<1000;l++)
  22.         {
  23.                 d/=0.3;
  24.         }
  25. }
复制代码


测试方法:使用一个led,测试其翻转速度,从而得到运行时间。
A9使用的是zynq,xc7z020,667Mhz,
DSP使用的BF531,40M晶振,倍频到600M,初始化代码如下,不知道是不是正确:
  1. void Init_PLL(void)
  2. {
  3.         volatile int test=0;
  4.         sysreg_write(reg_SYSCFG, 0x32);                //Initialize System Configuration Register
  5.         *pVR_CTL = 0x00fB;
  6.         idle();
  7.         *pSIC_IWR = 0x1;
  8.         *pPLL_CTL = 0x1e00;                                        // MSEL is 15, which gives:        VCO of 600 MHz (40*15=600)
  9.         *pPLL_DIV = 0x5;                                        // SSEL is 5, which gives:        SCLK of 133 MHz (600/5=133)                               
  10.         ssync();
  11.         //*pVR_CTL = 0x00fB;
  12.         ssync();
  13.         idle();
  14. }//end Init_PLL
复制代码


测试结果:
A9大概需要105us左右,运算一次。
BF531大概需要500us。

看起来差别比较大啊,为啥DSP会比A9慢呢?是不是初始化配置不对?

阿莫论坛20周年了!感谢大家的支持与爱护!!

一只鸟敢站在脆弱的枝条上歇脚,它依仗的不是枝条不会断,而是自己有翅膀,会飞。

出0入0汤圆

发表于 2017-4-11 16:50:10 | 显示全部楼层
用FFT之类的计算看看。

出0入22汤圆

 楼主| 发表于 2017-4-11 17:44:55 | 显示全部楼层
Excellence 发表于 2017-4-11 16:50
用FFT之类的计算看看。


在网上找了段FFT的代码
计算了256个点的fft
测试结果如下:
DSP需要5.6ms
A9需要780us
差距任然有点大

出0入0汤圆

发表于 2017-4-11 17:52:55 | 显示全部楼层
测试io翻转没有意义的
dsp就是设计来计算的
特别是迭代计算的

必须用计算类程序测试

出0入22汤圆

 楼主| 发表于 2017-4-11 17:57:16 | 显示全部楼层
BFXY5433 发表于 2017-4-11 17:52
测试io翻转没有意义的
dsp就是设计来计算的
特别是迭代计算的

好吧,可能是我没表述清楚,我测试方法是用的运行一段程序,运行完成后,翻转io,然后测量翻转时间,来测量程序运行时间。
虽然不是很准,但是应该能够很大程度上反应运算所需要的时间的。

出0入0汤圆

发表于 2017-4-11 18:21:02 来自手机 | 显示全部楼层
因为你做的浮点运算

出0入0汤圆

发表于 2017-4-11 18:28:50 来自手机 | 显示全部楼层
bf531是16位定点处理器吧?做浮点用模拟运算肯定慢了。a9好歹是有双精度浮点处理器的,自然比不上……你换28345试试?

出0入0汤圆

发表于 2017-4-11 19:07:41 来自手机 | 显示全部楼层
DSP了解不多,Cortex-A9里面有NEON,矩阵并行运算,不算慢,

出0入0汤圆

发表于 2017-4-11 19:09:13 来自手机 | 显示全部楼层
浮点比不上DSP,逻辑指令(ARM只要目的就是跑逻辑)比DSP快

出0入618汤圆

发表于 2017-4-11 19:12:07 | 显示全部楼层
BF531是个定点DSP,你拿来跟带NEON FPU的Cortex-A9比浮点……
更何况Cortex-A9的DSP性能本来就在Blackfin系列之上。

出0入0汤圆

发表于 2017-4-11 21:11:03 | 显示全部楼层
楼主有BF531的范例么,能发给我点么?

出0入0汤圆

发表于 2017-4-11 21:33:15 | 显示全部楼层
定点的肯定搞不赢浮点了,你要用定点计算来比较

出0入18汤圆

发表于 2017-4-11 21:44:58 | 显示全部楼层
531 多少钱  A9 多少钱

出0入0汤圆

发表于 2017-4-11 21:52:39 | 显示全部楼层
用定点来比比看

出200入657汤圆

发表于 2017-4-11 23:35:03 | 显示全部楼层
blackfin531比A9早好几年出的,比起来真是太不公平
我怀疑即便比定点数,531还是逊于A9
比浮点数真是差太多了,何况楼主没有优化过呢
否则真实差距二三十倍,那就叫被秒杀,哈哈哈哈
曾经纠结过用A9还是dsp
后来发现A9的计算能力真让人满意,比原先估计的快了好几倍
然后呢,不用去熟悉恐怖的dsp优化(dsp的浮点运算指令集都可以成一本书了,对外人太难用了吧?)

出0入0汤圆

发表于 2017-4-11 23:45:17 | 显示全部楼层
这么多DSP不选,你选个16bit定点DSP,你试试TI的67XX ,ADI的214XX系列对比下

出0入0汤圆

发表于 2017-4-11 23:55:52 | 显示全部楼层


感觉也是 531 太老了。  

出0入0汤圆

发表于 2017-4-12 21:37:15 | 显示全部楼层
BF531是不是 很便宜?blackfin的其它型号似乎价格很贵吧,楼主用它用啥?

出0入71汤圆

发表于 2017-4-12 23:04:34 | 显示全部楼层
你把BF531的CACHE开了试试 , 搞BF531 很多人都忘开CACHE , 如果程序小 , 就把程序放在芯片内部的SRAM里面运行  ,  不要在SDRAM里面运行!  还有 , 就是PK 定点数 , 不要把浮点数拿来搞BF531 ,  这个太不公平了.

出0入0汤圆

发表于 2017-4-13 08:25:28 | 显示全部楼层
dsp做算法需要使用特定的规则才能调用其强大的加速功能 比如ti的dsp 最好是用内联函数和官方库 而不是标准C 编写算法

出100入101汤圆

发表于 2017-4-13 09:18:15 | 显示全部楼层
A9也是裸奔?

出0入22汤圆

 楼主| 发表于 2017-4-13 09:57:49 | 显示全部楼层
90999 发表于 2017-4-11 21:11
楼主有BF531的范例么,能发给我点么?

我用的是VDSP开发环境,你也需要么?

出0入22汤圆

 楼主| 发表于 2017-4-13 09:59:00 | 显示全部楼层
dengxiaofeng 发表于 2017-4-11 21:44
531 多少钱  A9 多少钱

531价格50左右,A9贵点,zynq的最便宜的A9,100多点,不过他外围集成了FPGA,单就A9的价格,应该差不多。

出0入22汤圆

 楼主| 发表于 2017-4-13 09:59:52 | 显示全部楼层
NJ8888 发表于 2017-4-11 21:52
用定点来比比看

定点,没有优化的情况下,DSP跟A9的差距缩小,不过也还是比不过A9。
http://www.amobbs.com/thread-5672245-1-1.html

出0入22汤圆

 楼主| 发表于 2017-4-13 10:00:55 | 显示全部楼层
ziruo2002ab 发表于 2017-4-11 23:35
blackfin531比A9早好几年出的,比起来真是太不公平
我怀疑即便比定点数,531还是逊于A9
比浮点数真是差太多 ...

看来你是做过测试的,我今天再用fft,经过优化后测试了一下,DSP的性能提高了不少

http://www.amobbs.com/thread-5672242-1-1.html

出0入22汤圆

 楼主| 发表于 2017-4-13 10:01:29 | 显示全部楼层
pazulin 发表于 2017-4-11 23:45
这么多DSP不选,你选个16bit定点DSP,你试试TI的67XX ,ADI的214XX系列对比下

手里没有这个系列的dsp,只有BF531,所以就只有他顶上来测测了。

出0入22汤圆

 楼主| 发表于 2017-4-13 10:02:09 | 显示全部楼层
liurangzhou 发表于 2017-4-12 21:37
BF531是不是 很便宜?blackfin的其它型号似乎价格很贵吧,楼主用它用啥?

不做啥,就是准备用来做做图像处理,看看两个备选处理器的性能,然后决定用哪个。

出0入22汤圆

 楼主| 发表于 2017-4-13 10:02:50 | 显示全部楼层
dellric 发表于 2017-4-12 23:04
你把BF531的CACHE开了试试 , 搞BF531 很多人都忘开CACHE , 如果程序小 , 就把程序放在芯片内部的SRAM里面运 ...

请问您知道如何开启cache么?我没找到相关资料。

出0入22汤圆

 楼主| 发表于 2017-4-13 10:03:35 | 显示全部楼层
zhangsusu 发表于 2017-4-13 08:25
dsp做算法需要使用特定的规则才能调用其强大的加速功能 比如ti的dsp 最好是用内联函数和官方库 而不是标准C ...

确实,今天调用了ADI经过优化后的FFT函数,性能提升了非常非常多

http://www.amobbs.com/thread-5672242-1-1.html

出0入22汤圆

 楼主| 发表于 2017-4-13 10:03:59 | 显示全部楼层

是的,A9,裸奔的。没跑系统。

出0入0汤圆

发表于 2017-4-13 10:19:08 | 显示全部楼层
zxq6 发表于 2017-4-13 09:57
我用的是VDSP开发环境,你也需要么?

可以的,能有得看就不错了,能详细点最好。
我在网上找不到,淘宝问了至少要500,单买开发板只给接口范例。

出0入22汤圆

 楼主| 发表于 2017-4-13 11:25:58 | 显示全部楼层
90999 发表于 2017-4-13 10:19
可以的,能有得看就不错了,能详细点最好。
我在网上找不到,淘宝问了至少要500,单买开发板只给接口范例 ...



你看看附件,希望对你有帮助。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

出0入0汤圆

发表于 2017-4-13 11:47:36 | 显示全部楼层
zxq6 发表于 2017-4-13 11:25
你看看附件,希望对你有帮助。

好,谢谢了。

出0入0汤圆

发表于 2017-4-13 12:21:54 来自手机 | 显示全部楼层
不知道价格差了多少

出0入0汤圆

发表于 2017-4-13 14:20:09 | 显示全部楼层
zxq6 发表于 2017-4-13 10:03
确实,今天调用了ADI经过优化后的FFT函数,性能提升了非常非常多

http://www.amobbs.com/thread-5672242 ...

赞一个

楼主进步非常快

出0入0汤圆

发表于 2017-4-15 18:00:19 | 显示全部楼层
1。相同的数据类型运算对比。比如相同的256点单精度浮点fft。定点N阶fir滤波器
    楼主位的数据类型定义就不专业。double,int到底是多少位的没人知道。stdint等头文件里面有int32_t float64_t之类的标准类型
2. 完成相同的功能的速度对比
  项目选型时只需要能完成相同的功能即可。对数据精度并不关注。可以拿16位dsp的256点定点fft速度和浮点dsp的255点fft速度做对比。
3。算法对比应该都是在足够的优化后对比
回帖提示: 反政府言论将被立即封锁ID 在按“提交”前,请自问一下:我这样表达会给举报吗,会给自己惹麻烦吗? 另外:尽量不要使用Mark、顶等没有意义的回复。不得大量使用大字体和彩色字。【本论坛不允许直接上传手机拍摄图片,浪费大家下载带宽和论坛服务器空间,请压缩后(图片小于1兆)才上传。压缩方法可以在微信里面发给自己(不要勾选“原图),然后下载,就能得到压缩后的图片】。另外,手机版只能上传图片,要上传附件需要切换到电脑版(不需要使用电脑,手机上切换到电脑版就行,页面底部)。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|amobbs.com 阿莫电子技术论坛 ( 粤ICP备2022115958号, 版权所有:东莞阿莫电子贸易商行 创办于2004年 (公安交互式论坛备案:44190002001997 ) )

GMT+8, 2024-3-29 09:03

© Since 2004 www.amobbs.com, 原www.ourdev.cn, 原www.ouravr.com

快速回复 返回顶部 返回列表