中昊芯英创始人兼CEO杨龚轶凡带领团队于2023年成功研发中国首颗量产级GPTPU架构AI专用算力芯片“刹那®”,实现性能、能耗、成本全面突破。公司由前谷歌TPU核心研发专家杨龚轶凡于2020年在杭州创立,专注于高性能AI芯片及计算集群研发,已推出“刹那”芯片及“泰则”计算集群,在算力性能与能效比上取得进展,是国家级专精特新“小巨人”企业。
《科创板日报》记者获悉,中昊芯英选择深耕自研TPU技术路线,放弃跟随主流GPU架构,成为国内TPU赛道先行者。杨龚轶凡指出,GPU源于图形处理架构,并非专为深度学习设计,执行AI任务时存在效率损耗,软件栈复杂导致核心利用率不高。而TPU针对深度学习计算模式定制,在计算效率、核心利用和软件调度方面更为简洁高效,同等工艺和成本下可实现比传统GPU高出3至5倍的性能表现。
TPU面向神经网络计算体系,对一类算法具备良好通用适配能力。当前大模型结构趋于收敛,主要以Transformer类为基础,计算模式简化,使TPU这类采用DSA架构的技术路线更符合时代需求。尽管随机森林等非深度学习算法不适用于TPU,但当前主流大模型多不含排序操作,TPU价值得以体现。
在成本方面,TPU与GPU生产成本相近,但在相同工艺、成本与能耗背景下,TPU通常能实现3-5倍性能提升,性价比更高。云端场景中,同算力条件下TPU性价比达传统GPU两倍以上,有利于大模型企业降低开销,推动应用快速落地。
目前中昊芯英是国内唯一实现高性能TPU AI芯片量产交付的企业。杨龚轶凡表示将坚持自研TPU路线,希望通过提供更优质、便宜的算力,为人工智能浪潮奠定基础。公司早期融资艰难,因当时AI算法遇瓶颈,大芯片方向未被广泛认可。天使轮获1000多万人民币投资,杭州国资参与并带动社会资本支持。2023年后赛道爆发,后期融资难度降低。
杨龚轶凡认为未来3到5年推理算力将成为最主要增长动力。当前部分领域如人机对话已转向推理需求,自动驾驶等领域仍以训练为主。预计今年中国算力芯片销售额800-1000亿元人民币,美国约1000亿美元。美国市场明年或将增长至2000-3000亿美元,增量主要来自推理需求。随着应用场景涌现,推理芯片销售占比将逐步超越训练芯片。
国产AI芯片已在多个层面实现突破:硬件设计完成从0到1跨越,涌现出多家具备大芯片设计能力企业;国内晶圆厂制造能力提升,支撑国产化生产;自主芯片使国内企业获得与国际同行竞争入场券。预计再经3到5年发展,国产芯片有望在性价比方面与国际领先企业正面竞争,深化国产替代并开拓国际市场。
中美在算力芯片采购量上差距显著,基础设施存在鸿沟。未来5到10年内仍将处于美国领跑、中国追赶状态。待算法成熟度提高、国产芯片性能迭代进步、性价比拉平甚至形成成本优势时,可能出现新拐点。长期需保持追赶态势。
谷歌TPU最初服务于自身云服务和大模型能力,近两年开始对外供应,迅速获得Anthropic、Meta、苹果等企业巨额订单,关键在于其显著性价比优势。TPU目前已占全球算力供给30%以上,根据产能规划,预计明年全球市场份额有望与英伟达持平甚至反超,印证TPU架构在效率与成本方面的竞争力。
中昊芯英目标不仅是芯片设计企业,更是推动算力发展的参与者,通过TPU芯片带动AI赛道发展、落地与高速迭代,成为未来赛道核心推动力之一。公司是少数已盈利的AI芯片企业,盈利源于国家支持国产化进程以及创新带来的高性价比产品结构。业务关注生态渗透率与市场共建,除销售芯片外,还参与“智算中心”共建,构建完整基础设施生态闭环。
研发投入持续倾斜,涵盖硬件迭代升级、软件栈开发与生态打造。第一代产品于2023年落地,第二代芯片正在测试,计划明年入市,后续保持一年至一年半迭代节奏。与天普股份合作属框架性协作,旨在各取所长共同推进人工智能发展。
杨龚轶凡在美国经历强化了对创新的认可及不畏困难的精神,推崇任正非、史蒂夫·乔布斯和埃隆·马斯克的创新理念与极简要求,管理上博采众长,致力于建立适合中昊芯英的企业文化与运营模式。
