OpenAI 推出语音引擎 只需15秒样本即能重建任何人的声音_每日快讯(日常热点指南)

OpenAI 推出语音引擎 只需15秒样本即能重建任何人的声音


OpenAI 推出语音引擎 只需15秒样本即能重建任何人的声音

  2024-04-02 01:43:07     简体|繁體
http://news.qghjm.com/1058973.html

数字货币网报道:

        OpenAI 又带来了一项超酷的进展!周五(3月29日)推出了一项名为 Voice Engine 的语音引擎,仅凭一段15秒的声音样本,便能够精准模仿出那个人的声音。

   lnwMv3FlVu9WSyxeIpR6akH41r229R7pP1jEBo5e.png

        Voice Engine 的独特之处在于,它能通过简单的文本输入和短短音频样本,创造出非常接近原始说话者的自然声音。这意味着无论你让它读什么语言的文字,都能以那个人独有的声音风格朗读,效果既逼真又充满感情。总而言之,OpenAI 通过这项新技术展示了人工智能复制人声的惊人可能性,接下来让我们一起看下吧~

Voice Engine 两年前已开始研发

事实上,OpenAI 早在 2022 年末便启动了 Voice Engine 的开发,并已利用此技术为其文本到语音 API、ChatGPT Voice 以及朗读功能装配了预设声音。在技术成功开发后,OpenAI 并未立即向市场全面推广,而是选择与一小群早期测试者“小心翼翼”地合作,共同探索其应用可能性和潜在风险。

在与 TechCrunch 的采访中,OpenAI 产品团队成员 Jeff Harris 透露,该模型是在“已获授权和公开可用数据的结合”上进行训练的。该技术将仅限于大约 10 名开发者使用,获准访问的组织包括教育技术企业 Age of Learning、视觉叙事平台 HeyGen、前沿健康软件制造商 Dimagi、AI 通信应用开发者 Livox 以及医疗健康系统 Lifespan。

OpenAI在官网展示出了一些已经开始应用的例子:

1. 生成更自然、富有情感的声音

通过自然、富有情感的声音,比预设的声音更能代表更广泛的说话者,为非读者和儿童提供阅读帮助,致力于儿童学业的教育技术公司Age of Learning使用这其生成预先编写好的配音内容。此外,语音引擎和GPT-4创建实时、个性化的响应来与学生互动。

2. 翻译视频和播客等内容

为了让创作者和企业以其独有的声音接触到全球更多的听众,HeyGen,— 一家专注于AI视觉叙事的平台,成为了此技术的早期采用者。他们为从产品营销到销售展示的广泛内容制作定制化、仿真的头像。借助Voice Engine技术将视频内容翻译成多种语言,以此拓宽其全球受众的范围。这项技术的一大特色是在翻译过程中能够保留演讲者原有的口音特征,例如,使用一位法国演讲者的声音样本进行英语翻译时,生成的语音将保留有法国口音,为翻译增添了更多的真实感和个性化色彩。

3. 改善偏远地区的基本服务

OpenAI 强调自身的存在是希望为全球社区带来福祉,因此正在和当地合力为社区卫生工作提供各类基础服务,例如向哺乳期母亲提供专业咨询。为了促进这些工作者技能的提升,采用Voice Engine擎和GPT-4技术,以工作者的母语提供互动式反馈。

4.支持言语障碍人士提供帮助

为非言语人群提供支持,例如开发针对语言障碍者的治疗应用,以及为有特殊学习需求的人提供教育辅助。Livox是一款采用人工智能的替代及增强通信(AAC)应用,能够赋能残障人士进行沟通。通过利用先进的语音引擎,Livox能为用户提供独一无二、非机械化的声音,涵盖多种语言。这使得用户能够选择最能体现其个性的声音,并且对于那些使用多种语言的用户,保持在各种语言中声音的一致性。

5. 帮助患者恢复他们的声音

针对那些受到突发性或退行性语言障碍影响的人群,OpenAI与Norman Prince 神经科学研究所合作,正在研究AI在临床设置中的应用。他们最近启动了一个试点项目,为那些因癌症或神经病理学问题而遭受语言障碍的患者提供Voice Engine服务。这项技术的一个显著优点是它仅需很短的音频样本即可运作。因此,医生Fatima Mirza、Rohaid Ali和Konstantina Svokos得以使用一位年轻患者之前为学校项目录制的视频音频,成功恢复了她因血管性脑瘤而失去的流畅语言能力。

5AsYqYOI3Yqw9TUbGM8czu3SOR86jxZnCHgbdMkm.png

        OpenAI 的 Voice Engine人工智能拟人的无限可能,让我们得以用新的方式“听见”世界。但是,正如我们所见,这项技术也带来了不小的挑战和道德考验。随着这样的技术越来越成熟,我们必须更加认真地考虑如何平衡创新和安全。我们该如何确保技术的发展能够促进人类福祉,而不是成为操控和欺诈的工具?

GSbE8xmVVQCpLM8ShQiuaIBEjh4e5RbMyivITvaW.png

       

        “这是一个敏感的领域,处理得当极为重要,”OpenAI 产品经理 Jeff Harris 在采访中指出。OpenAI也承认,生成人类声音的技术确实携带着严重的风险。Open AI 正在探索为合成声音添加水印或其他控制措施的方法,以防止技术被用来模仿政治人物或其他公众人物的声音。

        OpenAI 希望引发有关合成声音负责任使用的对话,以及社会如何适应这些新兴技能的讨论。根据这些对话和小规模测试的结果,OpenAI 将做出更明智的决策,以确定是否以及如何在更大范围内部署这项技术。

        而现阶段,由于技术目前只面向合作伙伴的使用,OpenAI要求使用者们遵循一项使用政策,该政策禁止未经同意或合法权利冒充他人或组织,要求合作伙伴从原始说话者处获得明确和知情的同意,并禁止开发者构建允许个人用户创建自己声音的工具。合作伙伴还必须向其听众清楚地披露他们听到的声音是由 AI 生成的。此外,还实施了一系列安全跟踪措施,包括水印技术,以追踪任何由 Voice Engine 生成的音频的来源,以及主动监控其使用方式。

 



编辑:web3528btc 来源:加密钱包代币

免责声明:以上文章内容信息均搜集自互联网或用户发布,并不代表本站观点或立场,本站不对其真实合法性负责。如有信息侵犯了您的权益,请联系本站将立即删除。
分享到:

  • 上一篇
    下一篇

  • 今日要闻|实事关注

    每日快讯(日常热点指南)
    手机查看(二维码扫一扫)

    每日快讯网为您提供最新的行业简讯、新闻报道,以及今日热点内容,重大事件等实时资讯,24小时不间断播报,让您获得最新行业信息。
    « 2023年 » « 12月 »
    123
    45678910
    11121314151617
    18192021222324
    25262728293031

    最新资讯

    泰山区上高街道学苑社区开展反走私“进社区”宣传活动
  • 2025-07-20 07:22:09

     

    巾帼送暖,爱在身边——泰山区北上高村妇联开展“爱心妈妈”走访慰问活动
  • 2025-07-20 07:13:05

     

    热搜爆了!短剧演员于龙杨伊璐官宣求婚,粉丝:童话都不敢这么写
  • 2025-07-20 07:04:02

     

    沂蒙赤子的星河归舟—— 记孔令建博士的归乡守护
  • 2025-07-20 06:54:58

     

    《无间毒票2毒之战》新疆库尔勒演员海选收官 发掘本土新星助力银幕梦想
  • 2025-07-20 06:45:55

     

    艺术家李牧遥在英国伦敦获奖
  • 2025-07-20 06:36:52

     

    CHEERS FOR MUSIX为音乐欢呼 2025TMEA腾讯音乐娱乐盛典官宣
  • 2025-07-20 06:27:48

     

    王文涛部长会见美国英伟达公司总裁兼首席执行官黄仁勋
  • 2025-07-20 06:18:45

     

    《正当防卫》导演李云亮谈:悬疑外壳下的法理内核 多维视角解读正义边界
  • 2025-07-20 06:09:42

     

    南京河西美容医院姜海千提醒:医美麻醉要注意这三点
  • 2025-07-20 06:00:38

     

    TCL空调荣膺中国家电健康之星产品奖
  • 2025-07-20 05:51:34

     

    [开户代运营]FB,海外股粉,马来,西班牙,法国等国家,一手团队,欢迎加全网竞价搜索开户信息流开户,全国广告托管投放
  • 2025-07-20 05:42:31

     

    [开户代运营]小红书复投客户15对公的返点
  • 2025-07-20 05:33:28

     

    [开户代运营]oppo核代:养生粉/快应用/AI课,体量大数据稳定,政策美丽需要的来聊。
  • 2025-07-20 05:24:24

     

    好戏登台 用微短剧讲好新区故事——青岛西海岸新区举办赛轮杯“我在你身边·看见西海岸”主题微短剧大赛获奖作品创作分享沙龙
  • 2025-07-20 05:15:21