亚马逊发布最强AI语音模型,赛博女友不是梦!

user avatar
Bun

2月17日,在OpenAI拿出文生视频Sora、谷歌拿出最强聊天机器人Gemini后,亚马逊发布了目前最强的AI语音生成模型BASE TTS,能够学习模拟多语言的说话人,在超过10万小时的公共语音数据进行训练,参数达到10亿规模,标志着语音合成领域的重大突破!

亚马逊发布最强AI语音模型,赛博女友不是梦!


今年初,包括“GPT GirlFriend”、“哄哄模拟器”的AI应用爆火,通过GPT技术加上对人类语音的模拟,再加上DALLE图像生成,一款有天使般面容、优雅甜美的嗓音、具备思考能力的定制版赛博女友诞生。

亚马逊发布最强AI语音模型,赛博女友不是梦!

去年OpenAI首届开发者大会上,山姆·奥特曼推出了文字转语音模型OpenAI TTS,即Text-to-Speech文生语音模型,能够利用AI语音克隆功能,模拟出用户自己的声音,OpenAI提供了六款内置声音,同时支持多种语言的语音生成,通过流媒体平台进行实时音频输出。

亚马逊发布最强AI语音模型,赛博女友不是梦!

我们可以看到,随着生成式深度学习模型的飞速发展,自然语言处理(NLP)和计算机视觉(CV)领域已经发生了翻天覆地的变化,在语音处理领域和语音合成领域(TTS),类似的变革也正在悄然发生,亚马逊近期公开了论文BASE TTS!

亚马逊发布最强AI语音模型,赛博女友不是梦!

得益于海量数据的训练,BASE TTS模型能够生成更加逼真、自然的语音,使用 10 万小时的音频数据进行训练,与真人语音之间的差距不断缩小,亚马逊直接将AI语音生成模型的规模推到10亿参数级别,相当于此前最大 TTS 模型参数规模的 10 倍,这标志着 TTS 领域迈入了新的里程碑!

亚马逊发布最强AI语音模型,赛博女友不是梦!

BASE TTS同样是基于LLM的Transformer的自回归模型,泛化能力更强,能够适应不同语境和风格的文本,支持英语、中文、西班牙语等世界主流语言,亚马逊提出了一种新的 TTS 模型架构,利用新型的离散语音表示法,能够在高压缩率下保持高质量的语音合成。

亚马逊发布最强AI语音模型,赛博女友不是梦!

论文中,亚马逊还特别强调BASE TTS也出现了像ChatGPT、Sora等模型拥有的智能“涌现”能力,亚马逊开发了一个“涌现能力”测试集,专门用于评估大规模 TTS 模型文本理解和渲染的能力,目前BASE TTS 模型在语音质量、泛化能力和多语言能力方面均取得了显著的提升。

亚马逊发布最强AI语音模型,赛博女友不是梦!

从技术上看,亚马逊TTS代表着文本生成语音领域的重大突破,但是在现实生活中,也会造成不必要的困扰,BASE TTS模型能够生成非常逼真的语音,这也非常容易拿来造假,亚马逊因担心BASE TTS被不法分子使用,仅提供给学校或者商业公司的研究人员,暂时不会对公众开放。

亚马逊发布最强AI语音模型,赛博女友不是梦!


ChatGPT:

聊天机器人——ChatGPT全网爆红,马斯克惊叹夸赞!

聊天机器人——ChatGPT小白注册教程,勿被电商割韭菜!

ChatGPT移动端——使用教程,5分钟注册iOS账号!

微软——解散元宇宙,900亿投资压注ChatGPT!

ChatGPT王炸官宣——仅需2.7美元,即可输出100万词!

火爆全网——AI生成的漂亮小姐姐,形象逼近真人!

英伟达重磅:AI读取视频,可直出3D游戏模型!

黄仁勋:给AI圈一点小小的英伟达震撼,11分钟训练ChatGPT!

ChatGPT免费开源平替——200亿参数,前OpenAI团队打造!

ChatGPT王炸升级——可识别图片,考试成绩超九成人类!

ChatGPT史诗升级——1秒生成网站,看图玩梗能力堪比真人!

ChatGPT加强版——60秒生成弹球游戏,零基础也能开发游戏!

ChatGPT王炸官宣——正式解除封印,接入互联网开放插件!

ChatGPT重磅升级——新增函数功能,价格大幅下降!

ChatGPT:预计3亿人将失业,斯坦福封神开源GPT平替版!

ChatGPT突发:iOS版应用上线,冲到总榜第二!

ChatGPT之父:重磅推出世界币,将成为AI时代“身份证”!

ChatGPT之父:奥特曼没有公司股份,因为热爱创造了GPT!

ChatGPT:微软联手奥特曼,重磅投资核聚变发电!

游戏界大变天:斯坦福最新成果,AI角色可模拟真人小镇!

人工智能“觉醒”:自主学习,AutoGPT会颠覆ChatGPT吗?

ChatGPT最强挑战者:谷歌Claude,免注册支持中文!

ChatGPT最强竞品:谷歌免费升级克劳德,20秒逆天速通百页论文!

ChatGPT:显卡每日电费500万,谷歌大脑合并阿尔法狗母公司!

ChatGPT:玩转《我的世界》,北京大学强化学习攻克复杂任务!

ChatGPT:成功让AI听懂人话,学会与人类合作!

ChatGPT:7分钟开发一款游戏,成本仅0.3美元!

OpenAI重磅突破:用AI学习AI,开创人工智能新道路!

OpenAI王炸——AI绘画集成ChatGPT,“大力3”来了!

微软重磅官宣:GPT-4接入Win11,下周二免费推送更新!

乔布斯剧本:奥特曼被OpenAI开除,美女工程师接任!

奥特曼回归?OpenAI员工施压希望召回奥特曼!

奥特曼宣布:加入微软,光速跳槽甲方!

奥特曼回归:OpenAI上演“宫斗”大结局!

GPT商店上线:“AI女友”机器人成热门应用!

OpenAI新模型:会冲击影视行业吗?技术解读

OpenAI新模型:会颠覆游戏行业吗?技术解读

#gd的ai&游戏杂谈#

#ai人工智能#

声明:本站内容,如无特殊说明或标注,均为本站原创发布。未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,请联系。
0 条回复
comment avatar
{{show.info ? '确认修改' : '修改资料'}}
upImage
  1. 暂无讨论,说说你的看法吧
有新私信 私信列表
搜索