来源:)eettaiwan
时间:2014-11-28
在美国有一家由两个青少年所创立的新公司 Rex Computing ,开发了一款平行架构处理器,期望能为高阶系统带来10倍的每瓦效能提升;该公司并打算将指令集架构转为开放源码,以拉拢支持者。
这家新创公司的雄心不小,近终于到了可以自己签公司合约年纪(18岁)的该公司执行长Thomas Sohmers的目标,是打造目前处理器与加速器的替代技术──现有的方案若要升级至研究人员期望在未来十年达到的exaflop等级性能,要付出的代价太高(主要是功耗方面)。
Sohmers 表示,运算产业界面前是一条艰辛的长路;大家广泛接受的是继续与英特尔(Intel)、Nvidia一起遵循摩尔定律(Moore"s Law)路线往下走:“现在有一个很好的机会能让我们能提早实现exascale等级系统,我们需要的是很新的东西,我们也正在尝试推广它,不过这是一桩 困难的生意,很多人抗拒新的东西。”
近Sohmers当选为Facebook发起的开放运算计画(Open Compute Project,OCP)高性能工作小组共同主席;他预期Rex快能在明年1月完成其Neo核心的开发,并且透过OCP将该处理器架构开放:“我们的想法是让它成为一个基础架构,让其他人能利用它打造未来的系统。”
Neo核心架构
Sohmers 透露这会是个全力实现晶片的OCP专案,其他成员将协助提供晶片互连、以及实际的Verilog、RTL等设计程序。3W的Neo处理器在80mm2 面积内包含256个核心(核心架构如上图),每个核心具备64位元ALU、128Kbyte容量的SRAM暂存记忆体。
每个Neo核心之间有16Gbyte/s的互连,晶片之间的总频宽约384 Gbytes/s。该处理器架构的灵感来自于Adapteva 的Epiphany晶片,Sohmers 用它做出了代原型晶片,不过该原型的记忆体频宽不够、也达不到他想要的双倍精度。
Rex Computing规划的系统设计
Rex Computing规划了一个系统设计(如上图),只需利用三分之一的OCP 1U伺服器节点,采用4x4的晶片阵列,由一个次元件来控制──该公司打算一开始采用FPGA方案;Sohmers表示,该设计可达到50 Gflops/watt、双倍精度浮点运算。
执行Linux软体的控制晶片能提供Neo阵列存取功能,并能以C语言编写高度平行化的应用程式;不过Sohmers强调,要让新架构处理器充分发挥效能, 会需要用到一些新兴的平行编程解决方案,例如Unified C或Erlang。该新架构系统锁定的应用市场包括石油/天然气探勘、机器学习等等,Rex Computing正在筹募种子基金,为Neo处理器投片做准备。
在不久前的Supercomputing 2014大会上,Sohmers 与来自Cray、IBM、美国国家实验室的技术菁英们一起参与了一场座谈会,探讨exascale 等级系统的未来发展;有人认为,该类系统将会是远超过可预期的未来,部分原因是目前系统的性能都被高估了。
不过Sohmers认为,全球 百大超级电脑仍是利用已经有30年历史的Linpack基准,根本无法强调记忆体频宽或是模拟实际应用;而HPCG (high-performance conjugant gradient)基准是更实际的量测,采用该基准所列出的系统评比结果,只有Linpack基准性能的60分之一,因此现今强大的系统可能只有还构不上petaflop等级的一半:“这真的很糟糕。”