当前位置:主页 > 创新 > 战略 >
    解锁音频黑科技:腾讯会议与赛道“痛点”
      时间:2021-07-12 16:25 作 者:

  在云会议赛道,腾讯会议无疑是一匹黑马。自2019年12月25日正式发布,腾讯会议只用了245天用户数便突破1亿。

  腾讯会议的高速发展,得益于疫情催生的巨大线上办公需求,当时,腾讯会议作为一款视频会议产品,解决了很多企业远程办公的问题。但实际上,腾讯会议对自己的定位,已远不止一个产品那么简单。

  腾讯会议产品经理陈薇丹告诉记者,在后疫情时代,人们已经培养出视频会议的习惯,所以即便回到办公室,他们在很多场景也会选择视频会议来进行沟通,所以,线上线下协同开会的混合式会议,将是未来企业办公的一个标配。

  但在传统的会议室场景中,视频会议存在很多挑战和痛点,比如会议室噪音较多、远距离麦克拾音会出现声信号衰减等情况。

  针对这些痛点,腾讯会议旗下天籁实验室近日正式推出了天籁语音模组方案。基于该方案,视频会议可以实现12米超长距离拾音,并能消除超过200种会议噪声,在双讲、回声消除等方面,该方案也均实现突破性升级。

  音频“黑科技”

  “腾讯天籁”,是腾讯于去年9月对外发布的实时音频技术品牌,天籁实验室则是腾讯会议旗下音频实时通信和处理研发团队。

  天籁实验室技术研发专家余涛告诉记者,在技术路径上,天籁实验室一直持续通过语音信号本身去做降噪,从近场开始,向中场、远场进行突破,在这个领域,实验室已经积累了长期的经验。

  “另一方面是从全局出发,其实不止硬件,还包括电路、声学和算法等,总之是采用多维度、多模态的方式,进行音视频的研究”,余涛称,“在技术路线上,我们已经走得比较全面,而且在未来一段时间会不断呈现出一些黑科技”。

  实际上,天籁语音模组便是天籁实验室推出的黑科技之一。据悉,天籁语音模组首次结合房间声场感知、采集和空间声场重建技术,开创性地解决了会议室复杂场景下,远场多人音频通信、多讲话人实时追踪、多人自动取景等实时音视频技术难题。

  比如同一会议室中,随着人与音视频设备的距离变远,声音在传播过程中也会逐渐减弱,因此参加企业培训、工作汇报等企业会议时,最常见的一个现象就是听不清甚至听不到。

  针对这一点,天籁语音模组方案将多个MEMS麦克风板嵌入到会议大屏中,结合音频处理器,能够实现180度广角、12米超长距离拾音,相当于参会者即使相隔4层楼的距离,也完全可以像面对面交流一样。

  此外,天籁语音模组还基于深度学习模型,将空调声、风扇声等平稳噪声和手写笔触屏声、键盘声、手指敲桌子、放水杯、翻纸等会议室场景下超200种突发噪声进行针对性消除。

  余涛表示,想要消除这么多噪音其实并不容易,天籁实验室在技术研发过程中,是通过将方案在实际用户场景中反复测试,才建立起一个噪声库。有了噪声库之后,则需要不断进行技术优化,来将这些噪声消除。

  据记者了解,天籁实验室今年还联合学术界和工业界一起举办了国际Conferencing Speech远场比赛,正是通过这样的比赛来推动远场语音降噪技术不断迭代,才有了天籁语音模组的商用落地。

  把“钥匙”交给合作伙伴

  从腾讯会议的角度来看,为了更好的用户体验,实时音视频技术的门槛其实在不断升高,但是从行业的角度,硬件设备厂商提升会议体验的门槛却在降低。

  这是因为在软硬件一体化的会议室场景中,腾讯会议Rooms提供的是软件能力,同时,腾讯会议还明确表示不会自己去做硬件。所以,腾讯会议也会与硬件设备厂商合作打造智能化的会议室。

  腾讯天籁实验室总经理商世东告诉记者,腾讯会议不做硬件是商业模式所决定的,“我们的商业模式是做连接,是帮助各种外设、各种用户在各种各样的场景下,能够有一个清晰流畅的会议体验”。

  其实腾讯会议要做的事情,在其他行业已经有很多成熟案例。比如芯片厂商于手机厂商,或者微软于计算机,他们提供的都是一种“交钥匙”方案,让合作伙伴可以直接使用到他们的技术能力。

  所以对硬件厂商而言,当它们在复杂的声学场景下解决不好用户体验的时候,可以直接通过腾讯会议的技术授权,便享受到最前沿的、高门槛的技术方案,据了解,此次发布的天籁语音模组方案,已率先授权开放给腾讯会议Rooms专款硬件合作伙伴。

  实际上,“有所为有所不为”,是腾讯在发力B端业务时的一个重要原则,腾讯高级执行副总裁、云与智慧产业事业群CEO汤道生也在多个公开场合表示,生态共创将是腾讯To B的重要战略。

  因此,面对云会议场景,腾讯会议的定位也十分清晰,即聚焦在产品、技术等软件层面,并通过开放自身的技术能力,与硬件厂商合作服务企业客户。

  商世东表示,对天籁语音模组来说,首先选择All-in-One的大屏厂商,因为大屏的功能更全面,包括音频、视频、交互、白板等,它在集成天籁语音模组时也会更加顺畅。

  据其透露,天籁语音模组的第一批合作伙伴已经进入市场化推广阶段,正在量产的大屏包括86英寸和65英寸,分别对应的是中大型会议室和中小型会议室。

  商世东称,目前,视频会议和面对面的沟通还存在很大差异,不断缩小这个差距,也是天籁实验室的工作目标。在其看来,未来实时音视频行业的水平能够让视频会议的体验接近面对面沟通,甚至在某些领域能够实现超越。
 

(21世纪经济报道)





发表评论

最新评论
 
 
热点文章
浏览排行