【博文连载】失控----FPGA去中心化设计 <二>

接上文,这篇博客非独立文章,可能您需先读上一篇。

SOC图     EOC NOC 图对比

资源是有限的,怎样才能做到资源利用率最大化?

FPGA里面有个RAM,一般的RAM最大只有两个读取口,但是现在我希望有RAM能支持上千的读取口。

可能会问会有这种需求吗?服务器的数据库就是需要这种短时并发查询的,过年刷红包,就是每秒上亿次并发查询。

EoC NoC 的方式就可以很简单的实现这种并发设计,上千个master对一个slaver,速度可以和单口时一样快,至少我可以设计得一样快,而且是流水设计(不是指reg级别,而是模块基本,这个模块的输出是下一模块的输入),如果按200M时钟计算,那么就是5ns一次查询,每秒就是2亿次查询,开玩笑的说腾讯只需要一个K7的板就行了。(RAM不会存详细数据,只需要存数据表的外键映射就行,再不结果输出分发出去,其实数据很大,放到DDR也是可以的,速度会降一个数量级,设计难度也会升高),最大的问题不是RAM能不能存这么多数据,而是服务器没有到FPGA合理的IO能力,简单的说就是我FPGA可是可以达到这个速度,但是你服务器倒是能不能按这个速度给我发数据,和接受我的数据?

再说一个例子,比如最近热门的词“蓝鲸游戏”,腾讯需要从每天的和过去的QQ群海量聊天数据中筛选出信息,来锁定某些问题群。因为是突发问题,直接在服务器端做实时统计也只能筛选未来的数据,对以前的数据无效,如果用服务器简单的对以前的数据做筛选,又太耗费时间(不能快速锁定)和资源。这个时候可以尝试用FPGA的方式,把数据导给FPGA,FPGA在按自己的并行流水工作方式,来处理,只要发现问题就给服务器反馈。

这个速度又能到多少呢?,一个DDR3 1600M DIMM条的理论计算带宽是102G/bps,按内存60%利用率计算(保守计算),工作带宽就是60Gbps,一半带宽做服务器数据接收口,一半做处理口,那么处理的能力也就能达到十分恐怖的30Gpbs,完全轻轻松松处理P级的数据(1Pbit = 1KTbit = 1MGbit)。完全得益于EOC NOC的分布式设计对资源利用率的控制。我们熟悉的VDMA也是EOC NOC的一种,VDMA对DDR的利用率也是很高的,可惜的是无论Altera 还是Xilinx,都把VDMA至于CPU ctrl的淫威下。

回头想想,挺有趣的,NOC,EOC 的设计初衷只是Network,互联。资源利用率并不是考量,至少不是主要考量。虽然没有刻意去设计,但是这种方式确实有最佳的利用率。KK在《失控》也说----“只是提供合适环境,阳光,时间,这个生态系统就自己完成其他工作,你不知道它什么时候建成的,又是怎么工作的,只知道它已经在那里了”。实际工程中,我做Ethernet设计,当时只是考虑用NOC EOC的方式实现不同协议和应用路由,速度只要到75%带宽就行。最后设计到的带宽是93%,网络能到的理论带宽就是93%,也就是说,NOC EOC已经撑满整个网络!!

为什么是FPGA

CPU速度太太太慢

GPU可能有点慢,功能定制能力可能有点弱

ASIC,基本不可能为了筛选一个词“蓝鲸游戏”去开发一款IC,即使是做一款筛选不定关键词的IC,你的量又有多大?还有就是可配置性,你这个IC,有没有数据库查询功能?

 

(0)

相关推荐

  • 高速FPGA系统设计几条军规 | 电子创新网赛灵思社区

    作者:小卓,来源:FPGA技术联盟 如果符合一些简单的设计原则,采用最新的Xilinx7系列FPGA架构上实现无线通信.Xilinx公司已经创建了典型无线数据路径的设计范例,表明中速级(-2)器件上使 ...

  • FPGA 片上网络(NoC)的八大好处

    关于诸如FPGA之类的可编程解决方案的传统想法是,您必须愿意在灵活性方面做出很多权衡.在许多情况下确实是这种情况.即使只是通过芯片获取数据也会消耗宝贵的路由资源,并增加大量开销.当需要大范围或快速数据 ...

  • GPU分类和应用现状分析

    GPU最初用在PC和移动端上运行绘图运算工作的微处理器,与CPU集成以集成显卡(核显)的形态发挥功能.NVIDIA于2007年率先推出独立GPU(独显),使其作为"协处理器"在PC ...

  • 系统级芯片(SoC)设计选择:内核、IP、EDA和NoC

    系统级芯片(SoC)是一个将计算处理器和其它电子系统集成到单一芯片的集成电路.SoC可以处理数字信号.模拟信号.混合信号,甚至射频信号,常常应用在嵌入式系统中.尽管微控制器(MCU)通常只有不到100 ...

  • 【精品博文】失控----FPGA去中心化设计 <二>

    资源是有限的,怎样才能做到资源利用率最大化? FPGA里面有个RAM,一般的RAM最大只有两个读取口,但是现在我希望有RAM能支持上千的读取口. 可能会问会有这种需求吗?服务器的数据库就是需要这种短时 ...

  • 【精品博文】失控----FPGA去中心化设计 <三>

    看了莫老师的回复,有必要写一篇来介绍NoC的network实现的方式,也就是第一篇中的箭头连线代表的是什么,虽然很复杂,很难讲清楚. 现在先抛开SOC EOC  NOC,这些词,可能我对这些专业词汇的 ...

  • 【精品博文】失控----FPGA去中心化设计

    最近在看KK的<失控>,KK的观点刚好切合FPGA目前的发展------去中心化设计.这篇文章就来讲讲去中心化设计. 假设一个项目: 一.拥有的外设:4路SPI分别接外MCU,4路I2C分 ...

  • “去客厅化”设计越来越普遍,只有入住后,才知道有多好用

    "去客厅化"设计,相信很多人都听过,并且在当下新房设计中,也越来越普遍.而所谓的"去客厅化"设计,也并不是不要客厅,而是弱化客厅固有的功能性,并延伸出更多的功能 ...

  • 区块链去中心化多币种钱包APP搭建(现有案例)

    我们知道在区块链中,"钱包"是用于存储和使用数字货币的工具,并且一种货币对应于钱包.它用于存储货币或"交易"货币.简单地说,"冷钱包"是一个 ...

  • 云集六年:去中心化的胜利

    电商历史上,2015年是一个特殊的年份.这一年,移动购物在整体电商占比中超过50%,整个电商生态完成从PC到移动端的转移:这一年,B2C占网络购物的比例首次过半,增速高于C2C,中小商家的时代似乎即将 ...

  • 去中心化计算的未来:通过 RPC 从微服务过渡到 WASM

    在另外一篇文章<区块链.硬件与面向服务的架构,WASM 即将迎来大爆发?>,里面有绝佳的浏览器内的 WASM 应用程序示例,并辅以了对WebAssembly(Wasm)的详细解释. 但正如 ...

  • 重新认识去中心化交易所

    今天的文章分为三个部分: 1.对 DEX的再认识(去中心化交易所) 2.夸克区块链上的DEX 不同于传统金融世界,区块链世界的金融系统是由多个机构共同控制的,金融机构之间的交流效率极低,比如,你的存款 ...

  • 协议实验室发布NFT.Storage,免费去中心化存储NFT数据

    4月30日,协议实验室官方发表最新博客,推出用于免费存储NFT数据的NFT.Storage存储新服务,其将为NFT在分布式存储协议和星际文件系统上提供免费的去中心化存储及带宽.此前,胡安曾表示&quo ...