云端AI推理需求将在2022年迎来爆发。继去年底发布首款面向数据中心的AI训练芯片“邃思”及加速卡“云燧T10”后,燧原科技又发布了首款面向云端的高性能推理卡。
疫情加快了数据中心建设步伐和AI应用的速度。“传统数据中心和AI没有直接关系,就是X86+GPU加一堆存储和数据搬运,但现在数据中心越来越多引入AI加速平台。AI的渗透率会越来越高,我们预计渗透率会从5%到25%-30%,市场非常庞大。”燧原科技CEO赵立东在接受采访时表示。
12月21日,燧原科技发布首款面向数据中心的AI推理产品 “云燧i10”。该公司是腾讯投资的国内AI芯片初创企业。2018年8月,燧原科技由腾讯领投获得Pre-A轮融资3.4亿元人民币。今年5月,燧原科技宣布完成B轮融资7亿元人民币,由半导体产业基金武岳峰资本领投,腾讯、上海双创等跟投。
按使用场景划分,AI芯片主要分为云端和终端芯片。目前主流的神经网络深度学习包括训练和推断两个部分。云端追求高性能,开发成本更大,终端更侧重低成本和低功耗。目前中国AI初创企业主要布局在终端和边缘侧。
赵立东认为,面向数据中心的高性能AI计算芯片及分布式集群作为人工智能产业的基础设施,从架构升级到应用场景的落地,都蕴含了巨大的市场空间和机遇。
除了训练侧,云端AI推理的需求也不断攀升。研究机构赛迪顾问报告显示,从2019年到2021年三年中国AI芯片市场规模仍将保持50%以上的增长速度,到2021年,市场规模将达到305.7亿元。其中,随着大规模地方性数据中心的建设陆续完成,云端训练芯片增长速度放缓;而随着各领域市场需求的释放,云端推断芯片、终端推断芯片市场增长速度将持续呈上升趋势。
数据显示,从2019年到2024年,云端训练芯片的年复合增长率为32%,而云端推理的增长率将达69%。到2022年,中国云端推理芯片市场规模将达到189亿元,首次超过云端训练市场规模。
赵立东表示,AI真正起步在过去五六年,国内更晚,BAT等大企业从2018、2019年才开始大量采购英伟达V100训练芯片,“训练跟推理的关系是——训练出来的模型被部署到推理产品上使用。当模型、算法不成熟,你需要不断训练、迭代,成熟了才能被部署到推理上去真正应用。从2018年开始到2022年,很多场景的算法和模型经过这几年开始逐渐成熟,真正规模化应用。当推理芯片销售收入超过训练芯片,很多算法、模型已经开始被广泛应用了。对AI领域来讲,2022年是个重要的节点。”
在生态合作方面,燧原科技COO张亚林称:“云燧i10已完成与浪潮、新华三及Supermicro等服务器厂商推理服务器的适配。可适用于视频图像、语音、自然语言处理、知识图谱等多种应用场景,并针对内容理解、推荐、识别等高精度场景做了优化。”
据悉,云燧i10是单槽位标准卡,支持PCIe 4.0,FP32算力达17.6TFLOPS,BF16/FP16算力70.4TFLOPS,将于明年第一季度上市。同时,燧原科技发布了推理引擎“鉴算TopsInference”。
燧原科技的云端训练产品已实现商业落地。今年9月,燧原科技称,“云燧T10”和由其组成的多卡分布式训练集群已在云数据中心落地,正式进入商用阶段。腾讯是燧原科技的重要合作伙伴,赵立东告诉第一财经,双方将进一步加强合作的广度和深度。不过,他指出,“腾讯是我们起步期(破冰)的重要伙伴,起步是最难的,从0到1。腾讯给我们很大帮助,是我们第一个具有战略意义的重要客户,但绝对不是唯一的。”
据介绍,燧原科技有三大目标市场,一是云服务提供商,包括公有云、私有云、混合云等,这类企业有大量的流量和数据,需要训练算法加速AI相关应用;二是专注于金融、保险、医疗、交通等领域的行业服务商;三是AI超算中心和智慧城市等领域。
(第一财经)