OpenAI的新“语音引擎”只需15秒即可克隆语音_每日快讯(日常热点指南)

OpenAI的新“语音引擎”只需15秒即可克隆语音


OpenAI的新“语音引擎”只需15秒即可克隆语音

  2024-04-07 09:09:22     简体|繁體
http://news.qghjm.com/1060687.html

数字货币网报道:

主导生成人工智能工具ChatGPT背后的人工智能公司OpenAI推出了一种新的语音克隆技术,称之为“语音引擎”。这种音频模型可以基于相对较小的原始音频样本复制一个人的声音、语调和其他明显的人类语音模式。

该公司在周五的博客文章中表示:“值得注意的是,一个15秒样本的小模型可以创造出情绪化和现实的声音。”。

相比之下,人工智能语音平台ElevenLabs提供了一个即时语音克隆工具,需要至少一分钟的样本。为了获得最佳效果,其专业服务水平需要近10分钟的连续演讲。

该公司展示了这项技术的不同功能。在一个例子中,一位因血管性脑瘤而失去大部分说话能力的年轻患者的声音是使用她为一个学校项目制作的旧录音克隆的。据OpenAI报道,这就是她今天的声音。

OpenAI与布朗大学医学院附属的非营利组织Lifespan合作,并创建了一款名为Livox的工具,这是一款为残疾人构建的“替代通信应用程序”。该团队能够处理该女子为学校演讲制作的录音:

然后,开放式人工智能语音引擎能够提供即时文本到语音的功能,使患者能够有效地用自己的声音说话:

OpenAI还展示了HeyGen如何使用其技术将以特定语言上传的语音生成另一种语言的自然翻译。

该公司表示,语音引擎于2022年底首次开发,目前已用于为OpenAI的文本到速度API以及ChatGPT的语音和朗读功能中的预设语音提供动力。随着最新进展,该公司表示,在更广泛的发布之前,将保持谨慎。

OpenAI写道:“我们希望就负责任地部署合成声音以及社会如何适应这些新功能展开对话。

事实上,Meta去年夏天披露,其人工智能语音工具被搁置,特别是因为“潜在的滥用风险”

OpenAI解释道:“根据我们对人工智能安全的态度和我们的自愿承诺,我们选择预览但目前不广泛发布这项技术。”。

甚至在公开发布之前,OpenAI就对语音引擎进行了限制,包括一份不会效仿的知名人士名单。

OpenAI写道:“我们认为,合成语音技术的任何广泛部署都应该伴随着语音认证体验,以验证原始说话者是否有意将自己的语音添加到服务中,以及一个禁止语音列表,该列表可以检测并防止产生与知名人物过于相似的语音。”。

今天测试语音引擎的合作伙伴已经同意OpenAI的使用政策,该政策禁止未经同意冒充其他个人或组织。此外,该公司需要原始演讲者的明确和知情同意,他们不允许开发者为个人用户克隆自己的声音。

博客文章写道:“根据这些对话和这些小规模测试的结果,我们将对是否以及如何大规模部署这项技术做出更明智的决定。”。

除了语音引擎,开放人工智能正在并行处理多个项目。首席执行官Sam Altman透露,该公司正致力于今年发布GPT-5。该公司还展示了其生成视频工具Sora。该公司声称索拉将成为市场上最先进的视频生成器,超过Pika、Stable video Diffusion和Runway ML等型号。

索拉目前只适用于Open AI招募的“红队成员”,以确保其不会被滥用。

语音引擎肯定会胜过其他语音克隆工具,包括Meta、ElevenLabs、WellSaid Labs和RVC等开源模型。

Open AI也在进行一个名为Q*的秘密项目,其中只有它的名字被泄露了。萨姆·奥特曼拒绝透露任何细节,但表示研究团队专注于寻找让人工智能推理变得更好的技术和方法。

由Ryan Ozawa编辑。



编辑:web3528btc 来源:加密钱包代币

免责声明:以上文章内容信息均搜集自互联网或用户发布,并不代表本站观点或立场,本站不对其真实合法性负责。如有信息侵犯了您的权益,请联系本站将立即删除。
分享到:

  • 上一篇
    下一篇

  • 今日要闻|实事关注

    每日快讯(日常热点指南)
    手机查看(二维码扫一扫)

    每日快讯网为您提供最新的行业简讯、新闻报道,以及今日热点内容,重大事件等实时资讯,24小时不间断播报,让您获得最新行业信息。
    « 2026年 » « 02月 »
    1
    2345678
    9101112131415
    16171819202122
    232425262728

    最新资讯

    视频丨长三角医疗一体化 让百姓在家门口看得上病、看得好病
  • 2026-01-13 10:19:31

     

    内蒙古五原县市场监督管理局开展春节前药品安全检查
  • 2026-01-13 10:11:24

     

    A股收评:成交3.64万亿创新高!三大指数均涨超1%,沪指17连阳!AI应用、商业航天引爆市场
  • 2026-01-13 10:03:18

     

    投资者提问:您好,请问截止1月10日最新的股东人数是多少?望告知一下,谢谢
  • 2026-01-13 09:55:12

     

    投资者提问:董秘你好,自从控股股东变更后,股价一路向下,请问是什么原因,不...
  • 2026-01-13 09:47:06

     

    投资者提问:请问公司1月10日的股东人数是多少?
  • 2026-01-13 09:39:00

     

    我是成都凌搜的广告销售高丽,[代运营托管] 百度(baidu) 头条社交app下载,代运营服务,我们是乙方综合性服务商,欢迎点击对接合作与我联系。
  • 2026-01-13 09:30:53

     

    我是有信科技的市场总监卢文羽,[开户代运营]腾讯 抖快 红书 投条 百度(baidu)等全媒体广告,房产汽车、医美大健康、珠宝k12等全行业可投 源头端口 不限资质 行业 地区,我们是广告
  • 2026-01-13 09:22:47

     

    我是江西恒新的商务经理罗相信,[开户代运营]oppo vivo信息流代理商,电商cid,跳禾量小程序,有量 需要联系,我们是广告媒体方,欢迎点击对接合作与我联系。
  • 2026-01-13 09:14:41

     

    我是亿企互联的媒介经理黄兰兰,[开户代运营]青少年特训,家庭教育,家装工装装修,月子中心,学历提升培训,培训机构,展会,出国移民留学,我们是乙方综合性服务商,欢迎点击对接合作与我联系。
  • 2026-01-13 09:06:35

     

    我是杭州文洪的运营经理李秀德,[开户代运营]广点通股票资质方放户,要跑户的来,可跑视频号!可跑视频号!,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-13 08:58:29

     

    我是上海山升云的广告销售张丽丽,[开户代运营]广点通企业贷无去重包 要80-100成本的来,实力运营,专治客户各种不服,我们是,欢迎点击对接合作与我联系。
  • 2026-01-13 08:50:23

     

    我是星动起量的商务总监王镇,[开户代运营]千川直开返点对公2,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-13 08:42:17

     

    我是赢时新的市场经理周晓德,[开户代运营]:抖音本地推开户推广运营,9年广告经验,期待合作!,我们是推广代运营服务商,欢迎点击对接合作与我联系。
  • 2026-01-13 08:34:10

     

    腾讯系官方微信朋友圈广告 视频号广告 抖音广告 全国稀缺行业均可加白推广 找我详谈
  • 2026-01-13 08:26:04