该更新现在仅适用于 Pixel 手机,但将来应该会在其他设备上使用
谷歌正在使用人工智能驱动的离线听写更新其在 Pixel 手机上的 Gboard 键盘谷歌表示,此次更新意味着用户将能够更快,更可靠地口述电子邮件和文本,而不必担心他们是否已连接到互联网
想象一下,你正走出你的大楼,你想向某人发送一条消息,说'我要迟到了',谷歌语音识别和移动输入小组的研究科学家和团队负责人弗朗索瓦丝博费斯说这正是您无法连接的时刻,因为您正在从 Wi—Fi 转向蜂窝计划 伴随着 Gboard 的升级,Beaufays 告诉The Verge,这个问题不再存在了
这听起来像是一个微不足道的用例,但 Beaufays 认为语音识别的改进将慢慢彻底改变我们与移动设备交互的方式她指出,尽管语音识别最近几年来有所改进,但它仍然是一项不成熟的技术它是计算密集型的,这意味着大多数语音识别系统必须通过互联网发送数据,结果是听写既慢又不可靠
离线听写使其更可靠,也许更受欢迎
想象一下,如果你有一个键盘,只要连接性很差,你就无法点击按键,Beaufays 说你就是不会用那个键盘 但她说,通过让系统离线,听写将成为更自然的选择
为了实现这一转变,谷歌的团队花了五年时间调查这个问题并简化了应用程序用于语音识别的人工智能系统例如,虽然旧版 Gboard 听写软件使用三个独立的组件来模拟音频波形,将声音与音素匹配,然后将这些音素组合成书面输出,但更新版本将所有这些工作整合到一个步骤中
新模型还精简了系统中被称为解码器图的部分,该组件的功能类似于书中的索引,将音频波形与书面文字进行匹配在旧版本的 Gboard 听写模型中,这个解码器图的大小为 2GB,对于设备上的处理来说太大了相比之下,新版本只有 80 兆字节,小了 25 倍
目前,此升级的推出仅限于美式英语听写和 Pixel 手机,但 Beaufays 表示,未来它将变得更广泛可用——扩大 AI 语音识别的范围从技术角度来看,我想说我们可以负担得起在更多手机上做到这一点,而不仅仅是 Pixel,Beaufays 说我认为将会发生的事情是,我们可能能够在更多设备 以更多语言推出它
奥克资本是中国市场的长期投资者,广泛投资各种资产,目前总投资超过300亿元人民币。
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。