MEUX「四月」AI设计观察

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

百度MEUX

2025-04-29

0 评论 947 浏览 0 收藏

9 分钟

四月的AI设计领域迎来了一系列令人瞩目的创新和突破。百度MEUX团队的观察涵盖了从图像生成到视频制作，再到数字人创建等多个方面的最新进展。这些技术进步不仅展示了人工智能在创意产业中的潜力，也为设计师和开发者提供了新的工具和平台。

【1】重磅推出ChatGPT-4o文生图

【2】Runway发布AI视频生成模型Gen-4

【3】Midjourney发布AI图片生成模型V7

【4】AnimeGamer打造无限动漫人生模拟器

【5】即梦3.0内测：可直出2K商业海报

【6】ComfyUI-Copilot发布

【7】DomoAI推出语音图像生成数字人功能

【8】Ready AI：输入提示词即可生成专业级网页

【9】DeepSeek-V3发布：技术圈沸腾的低调升级

【10】通义开源发布「超写实3D数字人」大模型

1.重磅推出ChatGPT-4o文生图

ChatGPT推出基于GPT-4o的原生图像生成功能，升级后功能更加精确，能更好地遵循指示、渲染文字，并支持多轮迭代优化图像。该升级解决了AI图像生成器理解提示词能力差的问题，并增强了图像编辑功能。新功能适用于商业应用，如卡片自定义生成和游戏角色设计等。目前，该功能已向所有用户推出，未来几周内开发者可通过API调用。

2.Runway发布AI视频生成模型Gen-4

Runway公司发布了最新AI视频生成模型Gen-4，该模型能高度保持角色、地点和物体的一致性，生成连贯世界环境的视频，无需模型微调或额外训练。Gen-4通过学习海量视频数据生成新合成视频，表现出卓越的运动效果和对现实世界规律的理解。Runway期望通过Gen-4等新产品实现年化收入目标，同时AI视频生成工具正对电影电视行业带来颠覆性挑战。

3.Midjourney发布AI图片生成模型V7

Midjourney公司旗下AI图片生成模型V7版本开启了alpha测试，主要升级了“草图模式”。该模式耗时和资源消耗减半，同时提供对话式交互界面，支持实时编辑和语音识别生成功能，用户可通过语音指令调整图片。此外V7版本增强了文本理解能力和细节纹理质感，默认启用个性化模型功能。不过“草图模式”下生成的图片分辨率较低，部分功能仍调用V6模型，未来将逐步升级。

4.AnimeGamer打造无限动漫人生模拟器

腾讯ARC实验室与香港城市大学联合发布了名为“AnimeGamer”的创新项目，该项目利用多模态大语言模型实现无限动漫人生模拟，用户可通过自然语言指令与动漫世界实时互动，扮演角色并体验不同动漫作品的角色联动。AnimeGamer展现了多模态大语言模型在创意内容生成方面的巨大潜力，为动漫文化爱好者和AI研究注入新活力。

5.即梦3.0内测

可直出2K商业海报即梦3.0模型在图像生成领域实现了重大技术飞跃，其能够通过简单的文字提示生成细节丰富、品质卓越的图像。与前代相比，该模型在场景布局、色彩搭配及细节刻画上均有显著提升，尤其在处理复杂场景时表现突出。即梦3.0的生成速度极快，极大地提高了创意迭代的效率，为设计师和创意工作者提供了强大的辅助工具。这一突破有望颠覆传统图像创作方式，开启AI图像生成的新纪元。