数组定义在片内SRAM和片外SDRAM的差异有多大？

zhyu · 发表于 2016-10-13 16:59:21

本帖最后由 zhyu 于 2016-10-13 17:13 编辑

开发环境是dsp 6713 +SEEDXDS510PLUS+CCS3.3
跑算法时，发现时间开销花在数组存取数据上。暂不考虑数据结构问题，后续我改成了循环队列。
for(i=1;i<20;i++)
{
Sxn[i-1]=Sxn;
Sdn[i-1]=Sdn;

}
发现将数组Sxn和Sdn定义在片内SRAM和片外SDRAM中，花销的时间差3倍。SDRAM 频率100MHz，dsp主频 300MHz。
后来发现用CCS软仿，算法的耗时也一样。
具体情况如下：

一数组定义在片外
.cmd:
MEMORY
{
L2SRAM: o = 00000000h l = 00030000h  /* L2 SRAM 192k*/
L2CACHE: o = 00030000h l = 00010000h  /* L2 CACHE 64*/
SDRAM: o = 80000000h l = 01000000h
}
SECTIONS
{
。。。。。。
   Audio_dat > SDRAM
}
main:
#pragma DATA_SECTION(Sxn, "Audio_dat")
short  Sxn[20];  //外部噪声信号
#pragma DATA_SECTION(Sdn, "Audio_dat")
short Sdn[20]; //内部误差信号
此时上面的for循环要3100 cycles.

二数组直接定义在片内
short  Sxn[NUM3];
short Sdn[NUM3];
此时上面的for循环要1000个cpu clock cycles。

想问为什么会差这么多，和cache有关系么？这是正常的么，因为插入等待周期？

RAMILE · 发表于 2016-10-13 17:34:00

本帖最后由 RAMILE 于 2016-10-13 17:35 编辑

SDRAM本来就很慢，尤其是单个读取的时候，CLK的利用效率很低，要写入两次地址，插入n个等待，才有数据返回

另外，楼下补充

aozima · 发表于 2016-10-13 17:49:59

这么大字还斜着不累么。。

没有cache或buffer的情况，可以先在SRAM中计算好，然后memcpy或dma搬到SDRAM中。

zhyu · 发表于 2016-10-14 08:27:27

aozima 发表于 2016-10-13 17:49
这么大字还斜着不累么。。

没有cache或buffer的情况，可以先在SRAM中计算好，然后memcpy或dma搬到SDRAM中 ...

是累，但是不会弄。。。。
嗯，已经把数据定义在片内SRAM，并且优化了算法，每次只搬移一个数。
但是想弄清楚为啥会差这么

lindabell · 发表于 2016-10-14 08:37:01

看到这个字体就像举报

Mickey25 · 发表于 2016-10-14 08:42:07

lindabell 发表于 2016-10-14 08:37
看到这个字体就像举报

有同感，看着累........

bias · 发表于 2016-10-14 08:57:07

手机看着累，好大

jm2011 · 发表于 2016-10-14 11:00:22

SDRAM是地址线分时复用的，组成行列结构；读一次数据至少需要发一个行地址，再发一个列地址（不算猝发和背靠背等）；

而且要不停的刷新，否则数据会丢；读完了还要预充电（关闭行）。如果是32位的数据，16位的片子还要读两次；

SRAM只有一个地址，一个数据，快的话，一个时钟数据就出来了；cache和芯片内部的MEM都是SRAM的结构的；

再优化优化，看看能不能再提高点；在优化的时候多考虑点计算机体系，例如CACHE的大小、起始位置，争取都次的

操作都在一个cache行内。

wx85105157 · 发表于 2016-10-16 07:03:34

优化传输的数据量，尽量用sdram的突发传输模式，写一次行列地址读写多字节

Traveler · 发表于 2016-10-16 22:45:33

mark~~~~~~~~!

ljy99731 · 发表于 2016-10-16 23:23:06

zhyu 发表于 2016-10-14 08:27
是累，但是不会弄。。。。
嗯，已经把数据定义在片内SRAM，并且优化了算法，每次只搬移一个数。
但是想弄 ...

重新编辑，去掉各种字体格式，大字体是会封ID的

zchong · 发表于 2016-10-17 07:23:38

wx85105157 发表于 2016-10-16 07:03
优化传输的数据量，尽量用sdram的突发传输模式，写一次行列地址读写多字节 ...

这个是需要设置还是sdram控制器自动实现的？

LearningASM · 发表于 2016-10-17 09:34:45

楼主位的字看得怪怪的，好不顺眼啊

LearningASM · 发表于 2016-10-17 09:35:22

本帖最后由 LearningASM 于 2016-10-17 09:36 编辑

SDRAM本来就这样，需要等待时间

suebillt · 发表于 2016-10-17 09:37:43

肯定慢啊，有什么好问的

NJ8888 · 发表于 2016-10-17 09:56:36

以前研究过2812，内部RAM之间倒腾数据确实比外部快，如果加密，访问更慢，慢九倍

数组定义在片内SRAM和片外SDRAM的差异有多大？

阿莫论坛20周年了！感谢大家的支持与爱护！！