光子计算初创公司Lightmatter近期筹集了4亿美元,旨在突破现代数据中心的瓶颈。这家公司开发的光学互连层能够让数百个GPU同步工作,大幅简化了AI模型训练和运行的复杂任务,降低了成本。
随着AI的快速发展,对计算资源的需求也在急剧增加,数据中心行业因此蓬勃发展。然而,增加成千上万的GPU并不是解决问题的简单方式。高性能计算领域的专家们早就明白了这一点:如果超级计算机的节点在一半时间里都在等待数据,那么这些节点的速度再快也没有用。
真正将成堆的CPU和GPU整合成一个巨大机器的关键,是互连层的速度——互连层越快,数据中心的速度也就越快。Lightmatter自2018年以来一直致力于开发光子芯片,目前看来,他们的互连层在速度上远远领先于其他竞争者。
Lightmatter的创始人兼CEO尼克·哈里斯(Nick Harris)在接受TechCrunch采访时提到,“如果超大规模企业想要构建拥有百万节点的计算机,他们不能依赖传统的Cisco交换机。一旦超出机架范围,互连密度就会骤降,效率如同在用‘杯子和绳子’通话。”
目前的行业尖端技术是Nvidia的NVLink平台,尤其是NVL72,能将72个Nvidia Blackwell单元连接在一起,最高支持1.4 exaFLOPs(FP4精度下)。然而,这些计算能力依赖的7 terabit网络速度仍是一个限制因素。
哈里斯指出,“对于百万GPU来说,需要多个交换层,而这会导致巨大的延迟。”电到光、光到电的转换过程不仅耗能巨大,还极大增加了时间成本,特别是在更大的集群中。
Lightmatter的创新在于其大量使用光纤。通过纯光学接口,每根光纤可支持1.6 terabit的带宽,每个芯片最多能支持256根光纤连接。相比之下,72个GPU用7 terabit的带宽显得相形见绌。
“光子技术的到来比人们预期的要快得多,虽然大家一直在为此努力,但我们已经实现了。”哈里斯表示,经过七年的艰苦奋斗,他们的光子互连技术现已达到30 terabit的速度,并且设计了一种特殊的机架,能让1024个GPU同步工作。更令人期待的是,100 terabit的速度也已在开发中。
市场对这种技术的需求非常庞大,从微软、亚马逊到xAI和OpenAI等,所有大型数据中心公司都对计算资源表现出无尽的渴望。虽然哈里斯没有透露具体客户,但他指出,很多超大规模企业已经成为他们的客户。
此次Lightmatter的D轮融资让公司估值达到了44亿美元,使其成为全球最大的光子技术公司。哈里斯表示,未来他们还计划开发新型芯片基板,以便通过光子技术实现更精密的网络任务。他还预测,未来十年内,芯片间的互连将成为推动摩尔定律的关键力量。
Lightmatter的技术无疑正站在未来计算技术的前沿,准备在接下来的技术变革中引领潮流。