微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

#今日论文推荐#多模态图像合成与编辑这么火,马普所、南洋理工等出了份详细综述

#今日论文推荐#多模态图像合成与编辑这么火,马普所、南洋理工等出了份详细综述

本篇综述通过对现有的多模态图像合成与编辑方法的归纳总结,对该领域目前的挑战和未来方向进行了探讨和分析。
近期 OpenAI 发布的 DALLE-2 和谷歌发布的 Imagen 等实现了令人惊叹的文字到图像的生成效果,引发了广泛关注并且衍生出了很多有趣的应用。而文字到图像的生成属于多模态图像合成与编辑领域的一个典型任务。
近日,来自马普所和南洋理工等机构的研究人员对多模态图像合成与编辑这一大领域的研究现状和未来发展做了详细的调查和分析。

在第一章节,该综述描述了多模态图像合成与编辑任务的意义和整体发展,以及本论文的贡献与总体结构。
在第二章节,根据引导图片合成与编辑的数据模态,该综述论文介绍了比较常用的视觉引导(比如 语义图,关键点图,边缘图),文字引导,语音引导,场景图(scene graph)引导和相应模态数据的处理方法以及统一的表示框架。
在第三章节,根据图像合成与编辑的模型框架,该论文对目前的各种方法进行了分类包括基于 GAN 的方法,自回归方法,扩散模型方法,和神经辐射场(NeRF)方法

论文题目:Multimodal Image Synthesis and Editing: A Survey
详细解读:https://www.aminer.cn/research_report/6304d30a7cb68b460f0a2594

icon-default.png?t=M7J4

https://www.aminer.cn/research_report/6304d30a7cb68b460f0a2594
Aminer链接https://www.aminer.cn/?f=cs

原文地址:https://www.jb51.cc/wenti/3287407.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐