相信这款低配版芯片将受到中国市场欢迎。
英特尔将推出两款专供中国市场的Gaudi 3 AI加速器,根据美国出台的制裁政策对性能做出大幅“阉割”。
英特尔在其Gaudi 3白皮书中详细介绍这两款获准在中国销售的芯片型号。两款专为中国制造的处理器分别为HL-328与HL-388,分别采用OAM与PCIe外形规格。前者计划于6月推出,后者则将同其他PCIe规格的Gaudi 3芯片一同于9月上市。
总体而言,HL-328与H:-388芯片同其他家族成员基本相同,仍采用128 GB HBM2e VRAM,带宽为3.7 TB/秒、96 MB缓存、配备PCIe 5.0 x 16接口并采用相同的解码标准。
唯一的区别只体现在设计功率方面——OAM与PCIe两个版本均为450瓦,远低于家族内的其他兄弟产品。非中版PCIe HL-338的设计功率为600瓦,OAM规格的HL-325L及HL-335设计功率更是高达900瓦。中版Gaudi 3芯片在设计功率方面相对较低,很可能是因为不提供液冷版本。
尽管白皮书中未做明确说明,但几乎可以肯定的是,此举是为了遵守美国政府提出的处理器出口管制政策。管制条文禁止美国企业向中国出口高性能芯片,所以此番“阉割”实属无奈之举。
目前还不清楚英特尔对中版Gaudi 3做出了哪些修改,也很难判断面向中国市场的这批芯片在修改之后执行速度如何。单从已知线索来看,中版HL-328与HL-388与其他Gaudi 3版本一样采用双芯片设计,毕竟其内存及缓存配置未受影响。这种双芯片设计有助于降低性能密度,确保产品不致超过4800总处理能力(TPP)的出口管制上限。
所谓4800 TPP,换算成常规性能代表芯片最高只能在16位精度下提供150 TFLOPS性能。由于Gaudi 3在16位精度下可达到1835 TFLOPS,因此英特尔必须大幅削减其性能水平,包括大规模下调核心数量、时钟速率或采取其他性能限制方法。
我们已经就中版Gaudi 3芯片的具体细节向英特尔公司求证,但尚未收到回复。若英特尔后续披露更多信息,我们将第一时间发布更新。
根据合理推测,HL-328与HL-388的性能将与英伟达H20相似——H20是GPU巨头目前获准在中国销售的最强加速芯片,拥有148 TFLOPS的16位精度性能,略低于150 TFOPS的政策限制。
由于H20和Gaudi 3中版处理器的原始核心性能基本相当,因此区别主要体现在内存(英特尔方面内存容量更大但带宽略低)与配套软件(英伟达向来以GPU开发生态为卖点)层面。