寻星者的笔触:AI设计与未来想象

0 评论 1254 浏览 4 收藏 19 分钟

本期U享会很荣幸邀请到Jovi,高级产品设计专家,AICC创始人,UX Lib用户体验社区创始人,Jovi老师,为大家带来《寻星者的笔触:AI设计与未来想象》主题分享。与我们分享AI设计兴起、动向及未来的可能。

一、点燃AI之火

1)AI 兴趣的初燃

首先先从AICC的开始说起,起初ChatGPT、Midjourney相继发布之后,很快在我们建立的体验社群里大家讨论、开始学习浅偿,试着应用,了解Midjourney的能力限制。随着发展,大家开始关注如何把AI很好的利用在自己工作上,甚至投资新技术的探索上面。

2)技术应用与创新扩散

随着AI的火热,一部分人的探索与尝试,放在整个市场中还是属于少数的,停留在早期探索,存在着认知的差异性。但未来全面的普及时代也不会太远。

3)早期采用者的机会和现状

根据美国知名媒体The Verge的调查报告,大约三分之一的人尝试过AI工具,主要是80、90年轻一代用户更倾向于使用。调研的工作者中大部分会认为AI可以让工作变的更好。

于此同时AI也正在展现跨行业能力,广泛的应用场景:其中则蕴含巨大的机会和行业基础的变革。在AI的发展中需要更多的领悟,也需要内心平静下来做事,不必过度焦虑。

4)MS工作趋势指数年度报告

在工作趋势指数年度报告中体现出更多企业倾向提升员工生产力, 而非裁员。而“分析判断力”、“灵活性”和“情感智能”则是必备的关键技能,是新的工作方式,现在的时代,需要我们对整个工作能力结构做一次增强能力的调整。

二、AI在画布上的奇迹

ChatGPT经历了大语言模型到对话式交互、数字人等最终回归行业和细分应用上,AI设计也经历异曲同工的探索路径,下面从我们共创人的几个项目中来了解AI绘画的探索及方向趋势。

1)AICC — AI SOUP 电商项目(共创人:Rsky 杭州玩转互动 & AI Soup CEO)

1、AICC和 AI SOUP共同举办了一场设计比赛,是一个行业级别的项目,主题是为某博物馆文物进行二创,设计文创产品。主办方提供了10个文物,耗时14天,参与设计师90人,参赛作品共计410份。我们在参加这个比赛中,使用Midjourney生成作品,最终落地10件,并且已经在生产制作出实体产品。相比来说,从选品或是创意来说是都比传统设计的效率高很多,出图成功率4.1% 大幅度降了尝试风格成本。

2、SD生产实例-AI SOUP

这个项目是利用GPT和AI图片融合生成商家需要的图文并茂的产品图,从拍照——抠图——摆拍—自动融合——成品,只需2步,等待10秒即可生成让普通商家也能玩得起的品牌级的图。

3、AICC — 灵光石珠宝(共创人:卷儿 灵光石Virtual stone CEO)

这个项目是一个探索AI在垂直市场的应用。主要针对的是珠宝行业, 因行业的独特性,内行人才能了解比较多的专业知识,实际是已有一些行业壁垒。再看AI如何去给它赋能探索。

1)可以提供虚拟在线珠宝定制服务。利用AI技术,包括虚拟导购、stable diffusion 生成的图像和文生图、图生图等能力,为客户提供一站式虚拟定制体验。比如选择自己想要的首饰珠宝,元素,实时预览生成效果图,虚拟试戴,通过设计师跟进和优化交付工厂加工制作,完成首饰定制。珠宝的定制能力都可以完全由AI提供。

2)利用Checkpoint进行一键替换宝石的测试。可以快速替换珠宝材质,宝石替换,可以直观查看效果,定制自己喜欢的样式。(如图)右侧图片中的首饰为Ai产出设计稿,进行加工后,最终做出的成品展示。整体过程可行性都很强。由于stable diffusion 模型的多样性,客户还可以根据自己的喜好选择风格化程度,满足各类人群的设计需求。

通过利用AI在珠宝行业的探索,及项目的应用,总结出3个点:1)利用 AI可以节省不少的运营成本 2)客户也可以实现“自助式”设计体验,让用户感受前所未有的被重视的感觉 3)可以使流程更加高效。

3)AICC — 电商展台 Checkpoint(共创人:HL 电商 ckpt 训练)

在这个项目中AI是更深入到工作流程中去,用时也遇到更多有难度的问题需要克服。这是电商展台 Checkpoint 训练,通过 stable diffusion 训练 Checkpoint 批量产出电商设计优质素材,AI大大提高工作效率。

在训练过程中也得到一些经验:1、在训练比较垂类的模型之前,先了解相关基础知识,提高标注的准确性和效率 2、善用工具,如 chatgpt,帮助自己学习新知识 3、模型训练不是一蹴而就的,需要不断的迭代优化 4、模型想要商业落地,那么一定要增强可控性。

4)AICC — SD 3D 模型(共创人:忠忠 前端UI框架 Element Plus 设计负责人)

共创者忠忠更多探索的是一些模型能力的边界,探索细节多一些,使用 AI设计工具进行了非常多的尝试,这些项目是他的一些项目总结。其中 BDicon模型和微软风Lora可能是大家见过比较多的。

在过程中需要不断拆解,再拼,根据模型上色,调色,这些都是对设计师的挑战,如果坚持选择这个方向,不断学习,探索,将会收获很多。

5)AICC — AI 建筑设计应用(共创人:吾皇 AI 自媒体)

吾皇同学和她的团队同样在探索垂直市场中的应用,曾经在建筑装饰行业的我也表示出极大的兴趣。7月的线下活动中阿哓老师也分享了他在实际工作中应用AI技术,在各个环节引入AI生产力,实际的发展,可能比我们想象中还要快。例如在家装或者工装过程中,提供一张草图或者毛坯照片。通过AI设计的能力,很快有了一大批的设计创意,这些以前都要靠人来完成,也不会有那么多的探索空间和意向的选择机会。同样可以应用在景观设计,建筑设计等领域。依托行业自身壁垒 AI+ 赋能市场规模、想像空间巨大的。

通过以上5位共创人,我们了解了他们的项目,和AI绘画探索几个典型方向。

三、AI设计背后的科学

接下来和大家一起交流一下AI背后的科学,谈到AI图像,这个图是绕不开的:2021 年发布的潜空间扩散模型框架图。这里是AI生成图像的核心,可贵在它是开源的,后来 AUTOMATIC1111 做了SD模型的开源 Web UI的界面,让它可以被大家广泛的应用起来,通过 Web 界面来方便的应用 SD 模型。

这张图是用公式和图表的形式直观的表达了文字、图片怎么通过在潜空间对神经卷积网络的一系列操作把文本,图片降维到潜空间进行噪点操作,再升维到高维像素空间得到我们看到的图片的过程。

在扩散模型的架构还包含一些必要的组件:

比如我们输入的提示词,关于图像的描述需要经过文本编码:分词,令牌化也就是 token 然后嵌入模型,进行扩散操作然后编码后的张量用图像编码器生成图片。

说完原理,通过一个例子来给大家更通俗的解释一下,比如 1、唐伯虎看到的景象,这个鹰或者一个条件,是一个高维的,或者是提示。

2 唐伯虎要先想清楚重点,要画什么:像 CLIP Text,降维开始构思绘画的细节,比如布局,雄鹰的特点什么神态等等这些特征类的思维 这里是潜空间操作的过程,基于他学过的绘画技法,表现能力,和作画要求 :像扩散的过程。

3 想好了以后用潇洒的笔法把这些抽象的想法,特征,构思画出来 :像降噪,图像编码的过程,完成升维。

通过对原理的了解,会在无形中对事物的应用、探索、判断和预测都会产生影响,比如你在做产品时,对未来市场的预测也都会受到影响。

四、AI设计的双刃剑

了解前面的内容之后, 我们一起再交流一下AI设计的优势和痛点,说到AI设计工具会提到主流的AI设计生产工具——Midjourney和stable diffusion。这两个工具都有着不同的特点:Midjourney 定制性差,上手容易,stable diffusion定制性强,上手更难。基于 AI 设计的基础,做为创业者、投资或者是普通的学习,我思考总结了一些机会:

  1. 先发平台,早接触,可能会建立起强大的市场地位,从中获益。
  2. 如果在细分或已有市场有变现资源或是个人,利用AI就可以成为行业独角兽。
  3. 随AI艺术技术的普及,大众对学习的AI的需求就会增加, 提供教育和学习资源就会成为一个新的中长期机会。
  4. 本身拥有强大资源的先行者可能快速改变市场格局,但在AI增强之前,他们都将是这个资源中的黑马。

同时AI设计有这些机会,也拥有着风险:

  1. 初期市场可能会面临一些风险,如技术尚未成熟,成本过高等,这可能阻碍 AI 艺术的发展。
  2. AI艺术需要一定的时间来被市场接受,如果破壁时间过长,可能会对投入回报产生负面影响。比如细分市场的测试或早期产品的研发、前期投入。
  3. AI 技术的发展有可能会带来新的、未预见的技术架构或模式,会在其他领域找到新的应用,语言是文明的基础,所以AI有很强的跨域能力,这既是机会也是风险。
  4. 用三体中黑森林法则比喻现在的市场,现在市场情况在某种程度上很相似,创业者需要面对一个充满竞争和不确定的市场环境,他们要在有限的资源和时间内,开发和推出具有创新性和竞争力的产品,同时也要防止被其他创业者或大公司抢占市场或模仿抄袭。所以这种赌注风险是很高的。

五、一次探索的启航

分享到这里也要接近尾声了,通过分享AI的原理,分享一些项目,来窥探未来的可能性。由于现在技术的特殊性,现在大部分情况就是科学家把基础技术研究好,技术专家解决了落地的技术问题,市场应用专家把故事讲好,最终获得收益。说到技术,我们下面可以一起看几个关于技术的案例。

1、Segment Anything这个模型被设计为可接受提示(prompt),这意味着它能够根据具体的指示来识别图像中的对象,提供了更大的灵活性,给图像(视频)带来了很大的操作空间。

2、Rerender A Video

RAV是提出了新的一种翻译框架,该框架包括两个部分:关键帧翻译和全视频翻译。给初代 AI 视频带来了更佳观感体验的可能性。

3、MetaHuman

可以仅使用从iPhone拍摄的视频就能创建逼真的面部动画。

上面的这几个案例又能说明AI设计的领域和相对于的传统领域,已经可以基本覆盖多形态内容领域。

刚刚讲到这些,其实就是一个知识进化的过程,从开始的零散的点,各种信息,到后面串联起来,形成知识,最终形成一个完成的画面。同样科技也有类似的过程。

六、3个方向与大家共勉

  1. 时刻关注 AI 技术。
  2. 要基于LLM重构个人能力的结构,需要自己完善深入的去思考,做专门的研究。
  3. 实践出真知,应用是关键。

以上是本次分享的全部内容,希望对大家有所帮助~

再次感谢Jovi老师,为我们带来这么多优秀的作品分享和经验之谈。小伙伴们有任何问题或者对U享会的建议,欢迎在下方留言,期待下次再见。

另外感谢U享会所有成员的辛勤付出:

赵德馨、张俊枫、康盼盼、马亚荟、伍思晟、连盟

分享者:Jovi老师,整理:佟佳昕

来源公众号:58UXD(ID:i58UXD),58UXD,全称58同城用户体验设计中心。

本文由人人都是产品经理合作媒体 @58UXD 授权发布于人人都是产品经理。未经许可,禁止转载。

题图来自 Unsplash,基于CC0协议。

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!