语音识别技术的出现让计算机能够以一种更简单、直接的方式接收人类的信息,而语音识别加人工智能的组合,更是让各种IT设备变得越来越像真正的智能机器人——以语音对话的方式与人类交流。
当苹果公司iPhone软件部门高级副总裁斯科特·福斯特尔在讲台上演示iPhone 4S中加入的Siri语音识别系统时,下边的观众给予了热烈的掌声和一阵阵惊叹。随后,语音识别技术再次成为了热门的话题——人类和机器对话,这不正是我们在很多科幻电影中看到的场景吗?不过,在当时看到Siri的演示时,我首先想到的却是2011年早些时候的另一则新闻:IBM制造的“沃森”机器人在“危机边缘”智力抢答挑战赛中击败了两个人类选手。同样是采用了语音识别的技术,但是“沃森”机器人更直观地展示了语音识别技术真正的核心推动力——“人工智能”。
“说话”是人类的本能,也是表达自己思想直接、便利的手段,因此语音识别技术才会备受关注。人们很早就开始尝试研究语音识别,从1952年第一套仅能辨识10个发音的语音识别系统诞生开始,工程师们一直在进行着语音识别技术的研究。但是如果没有人工智能,那么语音识别系统或许只能像IBM的ViaVoice软件那样用于文字输入;而不会像Siri和Google Now(智能语音助手)这样“听懂”我们所说的话。人工智能的加入,让语音识别技术开始迸发出耀眼的光芒,它让计算机能够“听懂”而不仅仅是“听见”我们所说的话。也许在不久的将来,大家就会习惯在早上醒来时对自己的手机说:“嗨,哥们儿,来点儿好听的音乐吧!”