搜索
bottom↓
回复: 21

64Gb/s的数据有办法存储吗?用什么存储器?

[复制链接]

出200入657汤圆

发表于 2017-2-19 21:27:41 | 显示全部楼层 |阅读模式
本帖最后由 ziruo2002ab 于 2017-2-20 20:05 编辑

公司预研项目,有一个变态项目要求数据量达到64Gbits/second的读写操作,用FPGA管理
数据是连续不断过来的,一次猝发达到2Gbits,要求这2Gb要能全部保存下来
要求至少10ns内进行一次“读-加-回写”数据,也就是10ns之内"Read-Add-WriteBack"操作640bits
我算了下,如果用sram,要20片,每片要100Mbit,不说有没有办法layout,fpga管脚够不够,光是成本就顶天
如果用动态存储器,因为它要定时刷新,所以至少要用计算量的两倍,否则无法连续存储,所以实际要128Gbps
看了下fpga 的 ddr控制器的最大带宽,感觉很难做到这么大? 而且fpga的ddr控制器个数也是有限的。
有办法达到连续稳定的64Gbps吗?

阿莫论坛20周年了!感谢大家的支持与爱护!!

一只鸟敢站在脆弱的枝条上歇脚,它依仗的不是枝条不会断,而是自己有翅膀,会飞。

出0入0汤圆

发表于 2017-2-19 21:46:48 | 显示全部楼层
我要搞 10ns之内"Read-Add-WriteBack"操作64bits 的
是你的1 / 10,简单一点......................

出0入0汤圆

发表于 2017-2-19 21:52:41 | 显示全部楼层
你没有写位宽不好讨论
fpga也要涉及主频的
64G/s如果是单位处理要64G主频
基本不可能了

如果是32位宽,主频要2G
如果是64位宽,主频要1G

如果有办法位宽再宽一些,
主频可以低,就好选片

出0入0汤圆

发表于 2017-2-19 21:55:55 | 显示全部楼层
你居然写sdram
不知道你怎么想的
DDR4内存频率最高有可能高达4266MHz
16位宽
每秒64Gb/s

出200入657汤圆

 楼主| 发表于 2017-2-19 22:28:45 | 显示全部楼层
BFXY5433 发表于 2017-2-19 21:52
你没有写位宽不好讨论
fpga也要涉及主频的
64G/s如果是单位处理要64G主频

位宽是可以自由选择的,
优选64位、128、32位
我看了下资料,的确是可以的
单个pin很难达到64gbps,但是一个pin达到1Gpbs还是有可能的
先考虑用ddr3、ddr4

还有怎么保证连续的2Gbit数据完整的处理还真是个复杂的问题
看来最好是请教以前做fpga的同事吧,这个太专业

我刚看了Altera的2017准备出了一款stratix 10 SIP 芯片,单个pin最大可以做到56gbps
一个巨大的芯片,最大可以处理1Tbits/s
里面n多存储器,还有cortexA53
N多浮点处理单元
被intel收购后就财大气粗
一个芯片估计得上万美金





出200入657汤圆

 楼主| 发表于 2017-2-19 22:30:36 | 显示全部楼层
gwnpeter 发表于 2017-2-19 21:46
我要搞 10ns之内"Read-Add-WriteBack"操作64bits 的
是你的1 / 10,简单一点...................... ...

你这个就容易多了
我这边主要是要处理猝发的2Gbits数据比较麻烦

一般fpga做到100MHz很容易,6。4gbps,用一个64bit带宽处理就OK了

出0入0汤圆

发表于 2017-2-20 00:37:21 来自手机 | 显示全部楼层
用DDR3,64bit吧

出0入0汤圆

发表于 2017-2-20 08:51:05 来自手机 | 显示全部楼层
显卡不知道连续吞吐是多少

出0入0汤圆

发表于 2017-2-20 10:27:55 | 显示全部楼层
标记一下,楼主完成了给我再讲讲,好高的带宽

出0入36汤圆

发表于 2017-2-20 10:55:06 | 显示全部楼层
这种高并发的数据只能走离散化后并行写入的路子,否则从软硬件上来说非并行不太可能实现的,就算勉强实现代价也会很高

出200入657汤圆

 楼主| 发表于 2017-2-20 11:24:11 | 显示全部楼层
考虑用arria 10,加上4片 32bit位宽的ddr4,
arria10的每个ddr4 pin最高带宽可以做到2400Gbps左右,留50%余量,该fpga应该有4个ddr控制器
理论上可行,不过难度非常大,而且一个字贵!!! 每个fpga芯片要1万人民币以上
或者用xilinx的ultrascale方案,同样达到1万人民币以上的芯片价格

出200入657汤圆

 楼主| 发表于 2017-2-20 11:27:54 | 显示全部楼层
norman33 发表于 2017-2-20 10:55
这种高并发的数据只能走离散化后并行写入的路子,否则从软硬件上来说非并行不太可能实现的,就算勉强实现代 ...

已经无法并行化了
4路32bit ddr4再并行化只能编程256bit、512bit的位宽
哪个fpga有这么多的IO和ddr sdram控制器?

出0入36汤圆

发表于 2017-2-20 15:59:51 | 显示全部楼层
ziruo2002ab 发表于 2017-2-20 11:27
已经无法并行化了
4路32bit ddr4再并行化只能编程256bit、512bit的位宽
哪个fpga有这么多的IO和ddr sdram ...

你说的是接口的并行又不是数据写入的并行,其实你这个需求的本质就是生产和消费的平衡,打个比方数据入口加入高速离散处理然后平均分成n组放入下面的fifo,fifo后端加入低速的写入接口,写入接口串还是并这是是无关的,只要消费速度能跟上生产速度就OK(消费的速度要求只有(原来带宽)/n+开销),存储的瓶颈在IO速度,现在关键阶段在前面离散分组上,这部分完全可以用高速器件来做,而后端写入的速度理论上只有(原来带宽/n),当然要这个处理其实难度也很大的毕竟你那个带宽要求不是高的一点半点

出0入0汤圆

发表于 2017-2-20 17:25:25 | 显示全部楼层
norman33 发表于 2017-2-20 15:59
你说的是接口的并行又不是数据写入的并行,其实你这个需求的本质就是生产和消费的平衡,打个比方数据入口 ...

关键还有响应速度的要求呢。

出0入13汤圆

发表于 2017-2-20 17:28:15 | 显示全部楼层
变态的要求是不是不懂技术?你看看20TB的交换机,里面数据怎么交换?怎么传输了?或者100GB的CFP接口?

出200入657汤圆

 楼主| 发表于 2017-2-20 20:00:47 | 显示全部楼层
liao-ljj 发表于 2017-2-20 17:28
变态的要求是不是不懂技术?你看看20TB的交换机,里面数据怎么交换?怎么传输了?或者100GB的CFP接口? ...


交换机干的什么?根据mac地址表决定转发的端口而已,收到即转发,不用存数据,不用存数据
所以,千兆的phy那么小、发热量那么低,交换机那么便宜
理论上讲,如果系统总线100MHz,那么1000位的并行数据就是100G了
1000位对于逻辑处理单元的资源来讲连根毛都不是
这里难点在于存储,在于存储之前还要读出之前的数据,并且做运算后再存储

出0入13汤圆

发表于 2017-2-20 21:28:50 | 显示全部楼层
我知道单板的100GB的线卡,FPGA的DDR大概有128GB,防火墙板块就更多了!

出100入0汤圆

发表于 2017-2-21 08:48:36 | 显示全部楼层
还没达到这个水平

出0入0汤圆

发表于 2017-2-21 14:28:14 | 显示全部楼层
上内存条

出0入0汤圆

发表于 2017-2-21 14:38:21 | 显示全部楼层
难点是存储啊,我原来移位GHz的示波器,存储就够牛逼了,你的要求比那还要高上很多。

出0入0汤圆

发表于 2017-2-21 16:29:24 | 显示全部楼层
这么高的要求 ,成本就不要去优先考虑 了。

出0入37汤圆

发表于 2017-2-21 18:23:56 | 显示全部楼层
把数据按照位分,分成10份或者更多,然后并行存到10个或者更多存储器,
回帖提示: 反政府言论将被立即封锁ID 在按“提交”前,请自问一下:我这样表达会给举报吗,会给自己惹麻烦吗? 另外:尽量不要使用Mark、顶等没有意义的回复。不得大量使用大字体和彩色字。【本论坛不允许直接上传手机拍摄图片,浪费大家下载带宽和论坛服务器空间,请压缩后(图片小于1兆)才上传。压缩方法可以在微信里面发给自己(不要勾选“原图),然后下载,就能得到压缩后的图片】。另外,手机版只能上传图片,要上传附件需要切换到电脑版(不需要使用电脑,手机上切换到电脑版就行,页面底部)。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|amobbs.com 阿莫电子技术论坛 ( 粤ICP备2022115958号, 版权所有:东莞阿莫电子贸易商行 创办于2004年 (公安交互式论坛备案:44190002001997 ) )

GMT+8, 2024-3-29 06:05

© Since 2004 www.amobbs.com, 原www.ourdev.cn, 原www.ouravr.com

快速回复 返回顶部 返回列表