欢迎光GOGO体育官网!

谷歌前工程师开发实时AI语音APP

发布时间:2021-10-19 人气:

本文摘要:在2018年移动世界大会上享有三层展台的数十亿美元技术巨头中,有一对企业家在谈论人工智能方面的突破,他们刚把一款取名为Otter.ai的新应用程序在iOS和Android中发售。当他们椅子来在FiraBarcelona2号展厅后角的一个小会议室里谈论时,SamLiang将他的iPhone放到桌子上,并页面了Otter应用程序中的记录按钮。

GOGO体育

在2018年移动世界大会上享有三层展台的数十亿美元技术巨头中,有一对企业家在谈论人工智能方面的突破,他们刚把一款取名为Otter.ai的新应用程序在iOS和Android中发售。当他们椅子来在FiraBarcelona2号展厅后角的一个小会议室里谈论时,SamLiang将他的iPhone放到桌子上,并页面了Otter应用程序中的记录按钮。作为Otter.ai背后公司Alexense的首席执行官,Liang开始描写了加州15人创业小公司如何使用有所不同的方法来解读音频数据,不同于亚马逊Alexa,谷歌助理和其他公司在语音辨识上的希望。

在Liang公开发表讲话时,Otter开始吐文,大约延后了2-3秒。而且,由于Liang事前在应用程序中设置了会议,所以当他的队友SeamusMcAteer明确提出自己的评论时,软件不会自动识别,或者会因其他人的先前问题而中断。尽管Otter的自然语言处理方式并不极致,标点缺陷,词语被误会,说出人有时被错误辨识,但它早已十分相似了,尤其是考虑到速度和应用程序是免费的。

“我们的技术几乎有所不同。”Liang在拒绝接受ZDNet专访时说。

“我们称作'AmbientVoiceIntelligence'(环境声音智能),我们用于ambient这个词来回应这是在后台工作......你的大脑不能忘记10-20%的(会议)信息......所以我们指出我们可以协助人们捕捉这些信息,然后较慢搜寻。”搜寻是最差的功能。录音已完成后,应用程序的机器学习不会自动创立大约10个关键字,以便用户理解会议的内容。

你可以立刻开始搜寻全文。某种程度简单的是,一旦你熟知关键字,可以页面播放按钮来收看再次发生的音频部分。

该应用程序的下一个最佳功能是可以分享记录的会议。所以,如果你有一个会议,而一个同事无法参与,你可以随后向他们发送到记录和音频,以便他们寻找与之涉及的东西。如果你将谷歌帐户相连到应用于并引入联系人,那么所有这些高级功能都是非常简单的。因此,如果你的企业用于GoogleApps,它可以十分成功地运营。

跟谷歌的统合并不令人车祸,因为Liang是谷歌前工程师。McAteer专门从事移动和数据分析工作有数20多年。团队的其他成员由前谷歌,Facebook,雅虎和Nuance员工以及麻省理工学院、斯坦福大学和其他顶尖科技计划的博士和计算机科学家构成。

自2016年1月起,该团队仍然致力于研究Otter背后的技术。他们享有在过去一年中许可给其他合作伙伴的API-主要是在录音已完成后获取音频文件的mRNA。AISense利用所有的合作伙伴数据来调整和训练算法。

今年1月,他们宣告与快速增长的视频会议服务公司Zoom签订了一项许可合作伙伴关系,现在该公司获取了一个录音视频会议的选项——由AISense获取反对。随着发售动态录音的免费应用程序,该公司正在转入下一个阶段。它最后计划发售其应用程序的高级版本,该版本将创建在免费版本的功能上。

例如,免费版本将容许你搜寻过去90天的会议。高级版本将更进一步不断扩大。

“需要忘记,搜寻和共享你的语音对话是合作的下一个前沿。”Liang说道,“Otter许可用户用于AI展开日常对话,因此他们可以专心于所说的内容而记得记笔记。”可以在Otter.ai,AppleAppStore和GooglePlayStore寻找该应用程序。

iOS版本在这一点上更为细致一些,但都有一点注目这款应用程序随着时间的流逝如何发展和提升。IBMWatson获取动态的文本到语音服务,但它东面超级计算机。

因此,AISense用于应用程序和智能手机获得了令人印象深刻印象的成就,而且它可以说道是2018年世界移动通信大会上宣告的最重要突破之一,尽管它仍然以来十分高调。


本文关键词:谷歌,前,GOGO体育,工程师,开发,实时,语音,APP,在,2018年

本文来源:GOGO体育-www.gd8f.com