亚马逊网络服务(AWS)首席布道者(Chief Evangelist)Jeff Barr在一个开发者预告 (Developer Preview)中公布了AWS ( Amazon Web Services ) F1 实例,公布的该实例是一个什么样的东西呢??
Barr 在博文中写到:
“基于硬件的可定制化解决方案中一个最具吸引力的方法就是可编程门阵列,即 FPGA。专为某种功能而设计的专用芯片往往功能单一,电路连接也比较死板固定,与之相比 FPGA 则更加的灵活。把 FPGA 板卡插到 PC 主板的卡槽里,我们可以对其进行现场编程。每款 FPGA 器件都有一定的可编程逻辑门资源。对 FPGA 编程操作非常 ‘简单’ ,只需与之建立连接,我们就可以利用 ‘与(AND)、或(OR)、异或(XOR)’ 等创建想要的逻辑功能,或者利用触发器(flip-flop)、移位寄存器来实现存储模块。众所周知 CPU 是串行执行命令的(也有一些并行元素),指令集也是有限的,而且数据宽度一般是 32 位或者 64 位,而 FPGA 则可以执行任何并行操作,而且数据宽度几乎是可以任意的,可大可小。”
“这种高度并行的计算模式非常适合搭建自定义加速器来处理计算密集型应用。例如对于基因组排序、地震分析、金融风险分析、大数据搜索和加密算法等应用,采用 FPGA 解决方案能够带来 30 倍的速度提升。”
“我希望这听起来非常棒,而且你也迫不及待的想用 FPGA 来加速你的应用。”
... ...
“今天我们在预告中发布的最新 F1 实例,除了用它来构建你自己的应用和服务外,你还可以将其打包在 AWS 云市场进行出售和复用。将其整合在一起,你就可以避免所有曾经单独使用 FPGA 所不得不面对的费钱费力的步骤,用一种和使用其他所有类型的软件都非常类似的商业模式。我们为用户提供了使用云工具设计自己的逻辑功能、仿真以及验证,然后将自己的设计在几天内玄素上市的能力。”
F1 采用的是 Intel Broadwell E5 2686 V4 处理器(普通模式 2.3 GHz,Turbo 模式所有核可达 2.7 GHz,单核可达 3.0 GHz),高达 976 GB 的内存,以及 4 TB NVMe SSD 内存,集成 1 到 8 个 FPGA 芯片,因此可以说给用户提供了丰富的可用资源和强大的性能。 FPGA 器件为每个 F1 实例专用,不支持多用户共享使用。
F1 采用的 FPGA 规格(每个 F1 实例最高可支持 8 个这种类型的 FPGA):
Xilinx UltraScale+ VU9P,16nm工艺;
2.64 GiB ECC (错误检查与纠错)保护内存,288 位总线带宽,4 个 DDR4 通道;
专用的 PCIe x16 接口,实现与 CPU 通信;
大约 2500 万个逻辑元件;
大约 6800 个 DSP 模块;
虚拟的 JTAG 接口,用于调试。
“实例中不只有一个 FPGA, 专用的 PCIe 接口支持不同 FPGA 之间共享同一存储地址空间,互相之间可以通过 PCIe 架构进行高速通信,每个方向上数据通信传输速率可达 12Gbps。一个实例中的所有 FPGA 可以实现 400 Gbps 的双向通信环路,低延迟高带宽,当然这需要用户自定义协议来充分利用这一高级特性。
“除此之外 Amazon 还发布了一个开发者工具:AMI,“一套你可以在 AWS 云服务器免费使用的开发工具”,用以支持 AWS F1 应用开发。”
注:想了解更多关于在云服务环境下 Xilinx 所提供的硬件加速技术支持,可以访问 Xilinx Acceleration Zone:
https://china.xilinx.com/products/design-tools/acceleration-zone.html
你会找到很多有用的信息,很多是关于最新推出的“可重配置加速堆栈” 的。
转载自微信公众号:赛灵思