微软在 Build 大会,揭露智慧助理如何带给人更好的生活。透过 Cortana 加 Bot Framework 实现的个人语音秘书,以及直接在 Build 大会会场的实时会议逐字稿系统,看到微软在语音数据处理和转换的能耐,将要逐步商品化进入大众的生活。Cortana 加 Bot Framework 制作的个人语音秘书功能愿景,透过事前录制的情境影片,人人都有的行事历程序加上语音指令功能,而且不只是简单辨识你说的话语,还能做出对应的后续行动。像是更改行程,原先的餐会确认谁会不会与会,并且确认后,自动完成邀请原先没有在名单上的人,全部靠说话方式下完指令,就像董事长、总经理身边的秘书,全部改由 Bot 处理。
尽管微软影片中的语音秘书还是未来愿景,Build 大会上随着舞台上演讲、展示人员的说话话语,Conversation Transcription 实时对话转文字系统默默的运作,在屏幕上稍微延迟的时间差,实时出现台上人的话语语音识别,以及转换为文字。尽管仍有大约 5 秒钟的差距,对于事后弄逐字稿,可说相当方便。微软为了取信大家,特地安排微软人员现场示范念一段含有专有名词的话语。示范人员用一般计算机上的麦克风取音,一位念了一段包括大量信息技术术语的片段,一位念包含一堆医学相关术语的片段。结果均成功抓到对的字词。微软在语音识别和智慧应用上有相当深厚的基础研究,开发应用也相当注重人们的需求。微软在 Build 大会火力展示,有未来技术愿景,还有现在技术能做到的程度。目前 Conversation Transcription 处于 preview 状态。相关内文来源至: