腾讯会议推出天籁语音模组方案

　　自疫情以来，远程办公的旺盛需求推高了视频会议产品的发展热潮。自去年 9 月，腾讯会议发布企业版以及包含软硬件在内的解决方案“腾讯会议Rooms”之后。7 月上旬，腾讯会议再次推出了旗下天籁实验室负责研发的天籁语音模组方案。

　　之所以围绕会议室场景推出语音模组，是因为在企业衍生出的线上线下协同开会的混合式会议需求中，时长面临会议室场景下面临的声学挑战。

　　一方面，在远场情景下，讲话者会因离麦克风距离远，导致麦克风采集到的有效信号逐渐减弱，信噪比降低。另一方面则经常因为会议室场地空旷，声音经过玻璃和墙面的折射后产生反射声和混响、各类噪声也会严重影响到开会质量。

　　由此，腾讯会议基于会议室的特定场景，推出天籁语音模组方案，首次结合房间声场感知、采集和空间声场重建技术，解决了会议室复杂场景下，远场多人音频通信、多讲话人实时追踪、多人自动取景等实时音视频技术难题，帮助企业和用户实现在远场复杂物理空间下通信体验的提升。

　　例如，同一会议室中，随着人与音视频设备的距离变远，声音在传播过程中也会逐渐减弱，因此参加企业培训、工作汇报等企业会议时，最常见的一个现象就是听不清甚至听不到。

　　针对这一点，天籁语音模组方案将多个MEMS麦克风板嵌入到会议大屏中，结合音频处理器，能够实现180度广角、12米超长距离拾音，相当于参会者即使相隔4层楼的距离，也完全可以像面对面交流般清晰、自然。

　　针对语音模组涉及的硬件部分，由于腾讯会议本身并不生产和销售硬件，所以选择了授权给合作伙伴的形式进行。

　　“目前all in one的大屏厂商是我们模组最好的合作伙伴，大屏包括音频、视频、交互、白板这些功能全在这面，现在all in one的大屏厂商可以非常顺利地集成我们的解决方案。”腾讯天籁实验室总经理商世东对 36 氪表示。

　　在远程会议中，很多人经常会遇到延迟而导致的声音卡顿、声音忽快忽慢，甚至与会者同时安静或同时说话等尴尬的情况，极易破坏会议沟通思路，影响会议沟通进度。为了解决这一痛点，天籁语音模组方案突破性地将设备上行时延降低至几十毫秒，可以让远程语音交流如面对面交谈般实时。

　　针对多人同时说话时声音明显失真现象，天籁语音模组方案则能有效实现双讲无剪切、无回声泄露、无近端语音抑制，有效确保多人讨论时，每个人的声音都听得见、听得清、听得真，提升会议参与感。

　　天籁语音模组还基于深度学习模型，将空调声、风扇声等平稳噪声的降噪深度提高至40dB，还对包括写笔触屏声、键盘声、手指敲桌子、放水杯、翻纸等会议室场景下超200种各种突发噪声进行针对性消除，提升语音信噪比。

　　从远程办公的需求来看，视频会议场景已成为多家巨头争抢的对象。不论是估值暴涨的巨头ZOOM，还是国内科技公司阿里云（钉钉）、华为云，目前都已上线相关的视频会议系统，同样也包括软硬件在内的全套会议服务。

（36氪）