当前位置:主页 > 创新 > 案例 >
    云端推理爆发,瀚博半导体发布云端推理AI芯片
      时间:2021-07-12 14:47 作 者:

  近年来,云端AI芯片厂商不断涌现,2021年首批初创企业逐步商业化。今年世界人工智能大会期间,燧原科技、天数智芯、瀚博半导体等多家云端AI芯片厂商纷纷携带最新产品,在这一场人工智能盛会上亮相。

  随着技术演进,算法模型精度、性能等关键指标在众多领域不断取得进展,人工智能已进入算法规模化应用落地阶段。

  “随着我们的模型训练逐渐成熟,AI应用逐渐落地,推理的市场已经逐渐超过了训练的市场。”瀚博半导体创始人兼CEO钱军在接受采访时表示,正是看到了这一市场,瀚博半导体设计了推理专用的云端芯片。

  《2020-2021中国人工智能计算力发展评估报告》预测,2021年中国市场AI服务器的推理负载有望超过训练负载。随着AI进入应用期,数据中心推理算力需求的复合增长率是训练侧的2倍以上。

  研究机构赛迪顾问报告显示,从2019年到2021年三年中国AI芯片市场规模仍将保持50%以上的增长速度,到2021年,市场规模将达到305.7亿元。其中,随着大规模地方性数据中心的建设陆续完成,云端训练芯片增长速度放缓;而随着各领域市场需求的释放,云端推断芯片、终端推断芯片市场增长速度将持续呈上升趋势。

  钱军表示,对推理算力的需求在快速增长,下游客户多样化的算力应用场景催生了多样化的AI计算加速芯片需求,但是目前市面上却鲜有主流GPU厂商外其他更优解决方案。“GPU在推理侧不是最好的架构方案,性能远不如DSA(专用领域处理器架构)。”

  此外,他认为,与云端训练侧相比,推理侧的生态更容易被突破。通过强大的配套基础设施平台CUDA,英伟达在AI训练侧基本处于垄断地位。

  在此次大会期间,瀚博半导体发布了首款云端通用AI推理芯片SV100系列及VA1通用推理加速卡,预计将于今年四季度量产上市。

  瀚博半导体成立于2018年,A轮融资由快手、红点创投中国基金、五源资本联合领投;今年4月完成了5亿元人民币A+轮融资,由经纬中国和中国互联网投资基金联合领投。该公司专主要研发高性能通用加速芯片,针对多种深度学习推理负载而优化,应用场景为计算机视觉、智能视频处理、自然语言处理等。

  对于商业落地问题,钱军表示,和投资方快手合作非常紧密,“占据过半中国AI应用市场的计算机视觉应用需要高密度的视频解码算力配合AI算力实现端到端的计算加速。要解决好视频,AI要为视频做好优化,我们要匹配我们的芯片。”

  除了快手,钱军称,正在与国内外多家头部互联网公司合作,“很多公司和我们的合作已经有一段时间了,等着测试我们的产品。”
 

(第一财经)





发表评论

最新评论
 
 
热点文章
浏览排行