走出单纯硬件战争,智能音箱比拼创新落地与盈利

2019-10-08| 发布者: admin| 查看: |

北京时间5月7日上午,谷歌在第11届GoogleI/O大会上发布了10英寸带屏音箱NestHubMax,售价229美元,这也是自Nest并入谷歌后双方共同打造的第一款产品。

虽然还有不少人质疑带屏智能音箱是鸡肋产品,不过与纯语音交互相比,带屏幕的互动更直观。目前,互联网巨头包括亚马逊、谷歌、Facebook和百度等都推出了带屏智能音箱,将智能音箱作为入口,提供自己原有的服务。

市场调研机构StrategyAnalytics的最新研究显示,智能音箱是2018年最热门的消费电子产品。2018年第四季度的出货量增长了95%,达到3850万台,超过了2017年的总量。其中,带屏智能音箱占智能音箱的总出货量需求的10%以上。

Strategy Analytics总监华特金斯评论道:“谷歌的HomeHub、亚马逊的EchoShow和百度的小度在家等带屏智能音箱受到消费者的欢迎,他们被音视频结合吸引。与仅有语音交互而言,带屏智能音箱使用场景更多。预计到2019年,带屏智能音箱将成为市场增长的重要推动力。”

走出单纯硬件战争,智能音箱比拼创新落地与盈利

创新落地的载体

k8.com凯发真人天猫精灵,今天北京天气如何?”“今天北京天气晴,12℃~28℃,空气指数30。”

拥有天猫精灵音箱的小伙伴对于上述对话一定不会陌生。天猫精灵体现的是对话式人工智能,整个人机交互过程可分为唤醒、识别、理解、反馈四个环节。

“今天北京天气如何?”这段语音能够通过语音识别转换成文字,提取“今天”、“北京”、“天气”等关键词,通过背后的天气预报网站将数据调取出来;从天气预报网站调取出来的数据组装成自然语音,就是语音合成,即“今天北京天气晴,12℃~28℃,空气指数30。”

“之所以加入阿里巴巴,主要是自己更偏向于技术落地的工作。”天猫精灵语音技术负责人聂再清在接受第一财经记者采访时表示,此前在微软亚洲研究院工作时带领的研究项目就比较偏创新和实际技术落地的结合。

加入阿里巴巴人工智能实验后,让他感受最强烈的是这里创新落地的速度,以及前沿技术与产品配合的紧密程度。自2017年10月9日加入阿里巴巴以来,聂再清就一直负责天猫精灵语音助手算法的研发工作。

阿里巴巴人工智能实验室并不是一个纯研究部门,它与业务和商业是紧密相关的,即使是前沿技术研发也是为未来的业务与商业研发。这意味着,实验室除了学术以外,还有自己的产品以及商业逻辑。

以连续对话能力为例,很多用户都表示过每次和天猫精灵说话前都要叫一次“天猫精灵”有点累,能不能实现一个功能使得用户在短时间内和天猫精灵的多次交互只需唤醒天猫精灵一次?要实现这个连续对话能力的最大的技术挑战是能够区分用户的哪些话是对天猫精灵说的,哪些话不是。为了识别用户对天猫精灵说的话这里有两类信息可用:用户说的语义内容和用户声音的强弱、停顿、方向等声学特征。

天猫精灵的语音语义科学家们经过多次脑暴,一起独创了融合语音和语义特征的混合神经网络,融入了长短期记忆网络,卷积网络和注意力机制,并结合预训练的语言模型,通过海量数据的训练,深度网络自主学习到人机对话提取的能力。最终,在让用户能够享受到便捷的连续交互的同时,实现了业界最低的误打扰率。聂再清透露,目前已经有超过一百万用户主动打开这个功能,成为语音交互一种新的对话模式。

不过,每个人的兴趣爱好不同,一个家庭中多个成员共用一个天猫精灵,此前就存在天猫精灵将父母喜欢的歌曲推荐给女儿的情形。

聂再清表示,声纹算法科学家和个性化推荐科学家一起提出了一种不依赖于声纹注册的开创性的解决方案:把语音指令的声学特征在我们的个性化推荐深度学习模型中直接使用,创造性地解决了声纹注册率低和声纹聚类不准导致的语音助手多人混用的个性化推荐技术难题。大众盲评的用户调研数据显示,加入声纹后大大降低了歌曲推荐的兴趣混乱程度,有效地解决了多人混用的推荐难题,用户的人均时长提升10%。

不再是单纯的硬件战争

智能音箱的战争不再是单纯的硬件战争,更多场景的升级和创新功能的加入或许是更加重要的一环。数字中国峰会现场,百度CEO李彦宏称,以智能音箱为代表的智能家居,可以说是AI时代搜索的新入口,它让人们用更自然的方式和机器进行交互,也是家庭里面的信息服务的入口。