第(1/3)页 深圳企鹅公司的产品创新实验室里,白板上的构想已经超越了文字和静态图片。 一条清晰的演进路径被勾勒出来:文字聊天 -> 表情/图片 -> 实时语音。 路径的尽头,画着一个象征性的声波图案,旁边标注着“QQ语音聊天室”。 “文字的沟通是基础,表情和头像丰富了表达,但人类最本能、最富感染力的交流方式,始终是声音。”黎秶在项目启动会上,向新组建的语音技术团队阐述着愿景,“我们要让用户不仅能‘见字如面’,更能‘闻声如晤’。 满足他们实时语音交流、在线K歌、甚至举办语音派对的需求!” 愿景很美好,但技术现实却异常骨感。 项目组长,一位专攻音频处理的工程师,面色凝重地摊开技术难点: “黎总,实时语音传输,挑战巨大。 首先是带宽,当时的网络环境,稳定的文字传输已属不易,要实时传输语音数据,对网络波动极其敏感,容易卡顿、延迟。” “其次是编解码技术,要在有限的带宽下尽可能保证音质清晰,需要高效的压缩算法,这对CPU也有一定要求。” “第三是回声消除和降噪,如何避免麦克风收录的声音又被扬声器播放出来形成刺耳的回啸?如何过滤掉键盘声、环境噪音,让主要说话人的声音清晰可辨?这些都是世界级的难题。” 第(1/3)页