谷歌发布最强文生图大模型 Imagen 2,逼真程度达到新高度_每日快讯(日常热点指南)

谷歌发布最强文生图大模型 Imagen 2,逼真程度达到新高度


谷歌发布最强文生图大模型 Imagen 2,逼真程度达到新高度

  2023-12-15 23:09:20     简体|繁體
http://news.qghjm.com/1018756.html

图片来源:由无界 AI生成

谷歌刚刚发布了其最强大的文生图大模型 Imagen 2,可提供与用户提示词紧密结合且一致的高质量、逼真的图像输出。 它可以通过使用训练数据的自然分布来生成更逼真的图像,而不是采用预先编程的风格。

谷歌的增强模型 Imagen 2 是利用谷歌旗舰人工智能实验室 Google DeepMind 的技术开发的,该模型在 5 月份的科技巨头 I/O 大会上悄悄推出了预览版。 谷歌声称,与第一代 Imagen 相比,它在图像质量方面“显着”提高,并引入了新功能,包括渲染文本和 Logo 的能力。

谷歌云首席执行官托马斯·库里安(Thomas Kurian)在周二的新闻发布会上表示,“如果你想创建带有文本叠加的图像——例如广告——你可以做到。”

谷歌生成媒体产品主管 Vishy Tirumalasetty 表示,

“Imagen 2 可以生成……徽章、字母标记和抽象徽标……[并且]能够将这些徽标覆盖到产品、服装、名片和其他表面上。”

得益于“新颖的训练和建模技术”,Imagen 2 还可以理解更具描述性的长格式提示,并对有关图像中元素的问题提供“详细答案”。 谷歌表示,这些技术还增强了 Imagen 2 的多语言理解能力——允许模型将一种语言的提示翻译成另一种语言的输出(例如 Logo)。

Imagen 2 利用 SynthID(DeepMind 开发的一种方法)将隐形水印应用到其创建的图像上。 当然,检测这些水印(谷歌声称这些水印能够适应图像编辑,包括压缩、滤镜和颜色调整)需要谷歌提供的工具,而第三方无法使用该工具。

目前开发人员和谷歌云客户已经可以体验 Imagen 2 的强大:

https://cloud.google.com/blog/products/ai-machine-learning/imagen-2-on-vertex-ai-is-now-generally-available


图像逼真程度达到新高度


看下图,你能一眼猜到是 AI 生成的吗?

提示词:一张 32 岁女性在丛林中的照片,她是一位崭露头角的自然资源保护主义者; 运动型短卷发,笑容温暖

提示词:深蓝色背景上的水母

提示词:一幅小画布油画,显示案板上的橘子。 光线穿过橙色部分,在切菜板的一部分上投射出橙色光。 背景中有一块蓝色和白色的布。 焦散、反射光、富有表现力的笔触


对图像提示词的理解达到新的高度


文生图模型学习根据训练数据集的图像和文字说明中的详细信息生成与用户提示相匹配的图像。 但对于每个图像和蚊子说明,这些配对的细节质量和准确性可能会有很大差异。

为了帮助创建更高质量、更准确的图像,更好地符合用户的提示,谷歌在 Imagen 2 训练数据集中的图像说明文字中添加了进一步的描述,帮助 Imagen 2 学习不同的文字说明样式并进行概括,以更好地理解广泛的用户提示。

这些增强的图像-文字说明配对有助于 Imagen 2 更好地理解图像和文字之间的关系,从而增强对上下文和细微差别的理解。

以下是 Imagen 2 快速理解的示例:

1. AI 生成油画图像:

提示词:“溪水轻柔地流淌,鸟儿重新唱出它们的音符,它们混合的音乐在空中飘荡。” (菲利斯·惠特利的《晚间赞美诗》)

2. 人工智能生成水下场景彩绘图像

提示词:“考虑大海的微妙; 其中最可怕的生物如何在水下滑行,大部分时间是不可见的,并且危险地隐藏在最美丽的蔚蓝色调下。”(赫尔曼·梅尔维尔的《白鲸》)

3. 人工智能生成逼真的歌唱知更鸟图像

提示词:“知更鸟从摇曳的常春藤丛中飞到了墙顶上,张开喙,唱起了响亮、可爱的颤音,只是为了炫耀。 世界上没有什么比知更鸟炫耀时更可爱了——而且它们几乎总是这样做。”(弗朗西斯·霍奇森·伯内特的《秘密花园》)


更真实的图像生成


Imagen 2 的数据集和模型进步在文本转图像工具经常难以解决的许多领域提供了改进,包括渲染逼真的手和人脸以及保持图像免受分散注意力的视觉伪影。

Imagen 2 生成逼真的手和人脸的示例

谷歌根据人类对良好照明、取景、曝光、清晰度等品质的偏好,训练了专门的图像美学模型。 每张图像都会获得一个美观评分,这有助于调节 Imagen 2,使其训练数据集中的图像具有更多权重,以符合人类喜欢的品质。 该技术提高了 Imagen 2 生成更高质量图像的能力。

AI 使用提示“花”生成的图像,美学分数较低(左)到较高分数(右)


流体式调理


Imagen 2 基于扩散的技术提供了高度的灵活性,使得控制和调整图像的风格变得更加容易。 通过提供参考风格图像与文本提示相结合,我们可以调节 Imagen 2 以生成遵循相同风格的新图像。

可视化显示 Imagen 2 如何通过在文本提示旁边使用参考图像来更轻松地控制输出样式。


高级修图功能


Imagen 2 还支持“inpainting”和“outpainting”等图像编辑功能。 通过提供参考图像和图像蒙版,用户可以使用称为修复的技术直接在原始图像中生成新内容,或者通过修复将原始图像扩展到其边界之外。 这项技术计划在新的一年用于谷歌云的 Vertex AI。

Imagen 2 可以通过 inpainting 扩图功能直接在原始图像中生成新内容。

Imagen 2 可以通过 outpainting 将原始图像扩展到其边界之外。

参考资料:

https://deepmind.google/technologies/imagen-2/

https://techcrunch.com/2023/12/13/google-debuts-imagen-2-with-text-and-logo-generation/



编辑:web3528btc 来源:加密钱包代币

免责声明:以上文章内容信息均搜集自互联网或用户发布,并不代表本站观点或立场,本站不对其真实合法性负责。如有信息侵犯了您的权益,请联系本站将立即删除。
分享到:

  • 上一篇
    下一篇

  • 今日要闻|实事关注

    每日快讯(日常热点指南)
    手机查看(二维码扫一扫)

    每日快讯网为您提供最新的行业简讯、新闻报道,以及今日热点内容,重大事件等实时资讯,24小时不间断播报,让您获得最新行业信息。
    « 1994年 » « 07月 »
    123
    45678910
    11121314151617
    18192021222324
    25262728293031

    最新资讯

    反转!王岳伦怒发声维护女儿,李湘没想到,一家人步入潘长江后尘
  • 2026-02-04 19:40:24

     

    六年沉寂无人问,一朝黄袍天下知!朱亚文演技封神,赞天选宋太祖
  • 2026-02-04 19:32:19

     

    孙涛含泪维权护家人!被造谣牵连遭网暴 硬刚启动法律程序
  • 2026-02-04 19:24:12

     

    孙涛崩溃大哭不到2天,荒唐的一幕出现了,闫学晶真是把他害惨了
  • 2026-02-04 19:16:06

     

    张雨绮风波持续发酵,曝多个商务被取消,曝巴黎行程可能受影响
  • 2026-02-04 19:07:59

     

    谣言与真相:邓丽君之死!“祸国殃民”遭秘密处决?
  • 2026-02-04 18:59:53

     

    聂欢:任嘉伦背后的女人,用青春换他荣光,全职太太的付出不该被忽视
  • 2026-02-04 18:51:47

     

    蒋奇明“一夜爆火”?不,这是厚积薄发的“王炸”逆袭!
  • 2026-02-04 18:43:41

     

    官媒亲宣,62岁甄子丹再打破天花板,让李连杰和影视圈“沉默”了
  • 2026-02-04 18:35:35

     

    徐璐海边泳装绝了!薄纱配比基尼纯欲封神,转身婚纱秒变在逃女神
  • 2026-02-04 18:27:29

     

    何健麒尿检无犯罪证明全上了,前女友却称全是假动作,这瓜该信谁
  • 2026-02-04 18:19:22

     

    沈腾苦追12年娶王琦,因月嫂合照被传出轨生子,这场闹剧谁该道歉
  • 2026-02-04 18:11:17

     

    我是北京星耀五月文化的运营黄浩,[开户代运营]抖音 快手 腾讯 百度(baidu)开户及代运营,提供抖音 腾讯 企业贷 免领 ai均可按a 缺量的甲方来,我们是广告媒体代理商,欢迎点击对接合作与我联系
  • 2026-02-04 18:03:10

     

    我是点量互动的销售总监樊德鹏,[开户代运营]AI剪辑课,回收,婚恋,运势测算,证劵财商,手机租赁,国学测算,法律维权,养生免领,各类医疗等,我们是,欢迎点击对接合作与我联系。
  • 2026-02-04 17:55:04

     

    按A成人学历提升、研究生等腾讯广点通数据,抖音一级代理,可代运营,稳定高质,寻优质甲方。
  • 2026-02-04 17:46:58