定义一个AI产品的六个步骤

6 评论 18274 浏览 67 收藏 18 分钟

本文作者将与我们分享的是:如何去定义一个AI产品的基本流程。enjoy~

对每个公司而言,阶段的不同,商业模式的不同,以及部门性质的不同,都会使得工作流程发生变化。

比如说:

  • A公司是做AI赋能的商业模式,它的模式就是在AI某个领域(比如图像识别),根据客户的需求或者客户业务流程当中可优化的部分,去定制解决方案(譬如说帮青旅和民宿定制短租客刷脸开锁的解决方案,这个服务面向的可能都不是民宿或者青旅,面向的是向这些民宿青旅提供电子锁服务的公司)
  • B公司想要使用图像生成技术为核心,打造一款全新的UGC社交产品面向C端。或者更加模糊的一些,想用AI打造UGC产品。
  • 再比如做智能玩具的C公司,做自动驾驶专用芯片的D公司等…

这些例子是我随便乱说的,想表达的是,在不同的场景、业务逻辑和商业模式下,工作流程、每天的工作内容和重点,都可能会有很大不同。

所以我想,今天的议题有很多种视角可以去谈,我因为自己在创业,所以主要从一个创业公司,或者说是早期创业者的角度,来分享下我的理解。另外,我今天要偷个懒,我只分享如何去定义一个AI产品的基本流程。因为作为初创公司,更关心的是如何找准大方向并找到切入点,所以我在定义产品方面的思考会更多一些;至于产品定义以后,具体的系统化研发及项目管理,可能其他几位大公司的同志来讲会更系统化。

一、基于技术落地周期,现阶段“拿着锤子找钉子”,反而是对的

在进入正题前,想聊一下这个阶段的AI产品经理意味着什么

有个问题想与大家探讨,有过定义AI产品经验的同学可能也曾面临类似的纠结,就是我们为何给自己预设“AI”这个技术工具作为产品的边界。既然用户要的是“墙上的洞”而不是“电钻”,那不是用什么工具无所谓吗,只要解决一个问题,或满足一个需求即可。

那为什么一定叫自己是AI产品经理呢?或者换句话说,为什么一定要限制用“AI”去满足这个需求?

其实我理解的答案很简单,就是,新技术的突破,让人们看到两个希望,一是原有一些应用场景可以被颠覆式优化,二是会创造出全新的应用场景,产生全新的市场。

那么就会有这一技术的信仰者站出来,去发现可以革命的老场景,定义新场景,“为了应用AI而应用AI”,我反而觉得是对的,尽管这样会产出大量的伪需求,但最终时间会去伪存真,留下对的场景。而这个技术如果是颠覆性的,留下的场景应用就会是颠覆性的。不然容易造出“更快的马”,而很难发明“汽车”。

KK的《技术想要什么》里的核心思想是,技术作为一个特殊的有机体,也有自己的演化规律,一定程度不受创造他的主人控制。所以在技术突破、满足需求、产生新需求、技术再突破的螺旋上升中,已经很难分清是人的需求drive技术进步,还是反之。

所以可能我比较偏激,我不太认同“一切以需求为导向”的产品观(我也许是错的,需时间检验)。我反而认为这是一种局限于某个阶段的产品观,这个阶段我称之为“工具完备阶段”,比如我们认为web工具完备了,基本在web领域里,所有能想到的创意很大概率可以被实现。

所以,有人是电商产品经理、微博产品经理、github的产品经理,但没人会再说自己是web产品经理。如果做一个web产品,也不会首先想web能做啥,而是想,用户需要什么。(当然这个“工具完备”是有领域限制的,但我这时候问个问题,“用户需要永葆青春,你能实现一个治疗死亡的web app吗?”。这其实是我所说的跳出了web的领域。)

你看最早期的互联网公司,名字都叫做“网”什么,什么“net”的,从名字也可以看出来,它一定是在想“能用互联网做什么是用户需要的”,而不是想“用户需要什么可以用互联网实现”。这俩是有区别的,假如你以用户需求为主导,那如果用户需要某个东西用传统技术实现更加便捷,你做不做?你要想好如何回答这个问题。  

现在已经不太会有人强调自己是做一个互联网公司或产品了,而是更加强调应用场景,比如“社交”“婚恋”;以及细分领域,比如“00后社交”“50后婚恋”。但你观察,比如现在的VR大量公司名或产品名仍然带着“VR”,AI公司一半带“智能”“.AI”等。

这其实是技术落地的一个必然周期第一波是谁能造出锤子,第二波是谁能用好有限的几把锤子,第三波才是当锤子足够多的时候(工具完备),弄清楚用户需要什么,再去想用那把锤子能搞定这个需求。

AI我认为目前处于第一波到第二波的过渡阶段。并且第一波的技术突破,也并非齐头并进的。AI下围棋能战胜世界冠军,这是强化学习与算力综合突破的结果,能识别人脸,这是CNN结构与算力的突破,但无法因为“AI可以下围棋”就断定“AI可以参加辩论赛”,尽管这两者听起来等量齐观,但第一把锤子找到,第二把看似差不多的锤子,可能还得找十年。

其实我知道这些听起来跟咱们今天的主题关系不大,但在踩了很多坑以后,我感觉这个事情尤为重要,我自己觉得它是在技术突破伊始定义产品时,需要在心理默念的一个大前提,“我就是要拿着锤子找钉子”。

有了“AI既正义”or“AI大法好”这个基本假设。我们可以开始展开去推演,怎么定义产品。

我总结了一个螺旋图形,发给大家——

二、定义一个AI产品的六个步骤

聪明的小朋友们会发现,这特么不就是一个直线吗,从1到6步,画成螺旋是为啥?有两个很重要的原因:

  1. PPT一页放不下直线;
  2. 这样看起来更屌。

还有个原因,就是其实我在实践这个方法的路上,感性上觉得是一种“围猎真相”的过程。

1、世界将如何演化

(这里,很多是转述某个朋友的观点,感谢他跟我分享这样的认知)

其实我们活在一个注意力经济时代注意力被不断解放又不断被新事物收割,技术代替人类去完成更多简单重复的劳动,人的注意力被解放出来。

据说2020年就会实现长途货运汽车的自动驾驶,因为高速是个封闭场景。那么,中国有3000万卡车司机,这些人的注意力何处安放?一个比较明显的趋势是,他们会向虚拟世界中迁移。另一个例子大家感受下,我印象中,小时候家门口小卖店的老板,你问他话他不理你,一半以上时间是在“点钱”,铺在报纸上一堆零钱的场景我历历在目。现在报亭小卖店老板他如果不搭理你,多半在“吃鸡”。中国有500万家小卖铺,这些店员或者老板被解放出的注意力又被虚拟泛娱乐收割。

向虚拟世界迁移是个如“熵增”般不可逆的趋势。

2、AI在其中扮演什么角色

AI革命可以看作是生产力的革命,从生产力的角度讲,第一是将人类从现实世界的非创造性劳动当中解放出来,从而更快速的向虚拟世界迁移;第二是赋予创造性劳动更低的门槛,以建设更丰富的虚拟世界。

这两点我总结为叫做对人类的“去工具化”,就是说,人之所以为人,是有人固有的价值,比如“想象力创造力”,“理解另一个人类需求的共情能力”。这些很难被机器替代。而人类完成自我实现,却需要掌握大量复杂工具,逐渐将自己培养成工具。比如,你有很好的想象力,却不会有画笔,也难以完成一幅画作。掌握画笔本身就是“工具化”。

但是我认为AI可以帮助人类实现“去工具化”,真正“身随意动”的发挥人之所以为人的价值,具体就是依靠上述两点。

3、哪些方向存在机会

首先看,“解放非创造性劳动”,首先可以想到的是,简单重复的脑力劳动,其实我认为只要是封闭域的问题,即使是复杂的非创造性劳动,也应该并可以被AI代替。不过后者有争议,先不讨论。

接着看,“降低创造性劳动的工具门槛”,可以联想到AI带来的全新UGC玩法,或者AI辅助创作的工具。

好现在我们获得了三个方向,第一个是“AI代替简单重复的脑力劳动”,第二个是“AI带来的全新UGC玩法”,第三个是“AI辅助创作的工具”。

4、方向中有哪些场景

第一个方向最典型是自动驾驶,当然还有很多很多,基本是目前最被人们普遍看到的方向,具体的选择还需要考虑结合哪个行业,自己是否擅长等,在这里就不展开了,因为基本很多地方都有讨论。

我们就选第二个方向,“AI带来全新UGC玩法”。内容生产主要有四个大类,图片、视频、音乐、文字。结合对AI生成技术的了解,我们可以想到很多场景,比如说最近看到“千面”的让你用明星的脸做鬼脸,比如俄罗斯那个用风格迁移做的app,让你的照片加入梵高风格。还有,其实抖音、快手、faceU也算是AI带来的新UGC玩法(这里主要指基于面部识别的特效,而不是推荐引擎),但是为什么我们感觉这几个不是显性的AI-UGC产品呢,这里正好就引入第五个问题。

5、这些场景应用AI的价值厚度

UGC的基本逻辑是,降低“优质内容”生产门槛,并连接内容生产者与消费者,让生产者得到正向奖励,让消费者变成生产者。

那么在这个逻辑链条里面,我们可以看到,让你用明星的脸做鬼脸,这个是AI技术才能创造出来的全新玩法,那么在内容生产上,AI扮演的价值厚度就很厚。没它做不了啊。

但是,短视频社区当中的面部识别特效,仅仅是给“优质内容”的生产加了个buff,所以在价值链条上面占领的厚度并不高。

那么如果说,我们做一个AI代替人们写诗的UGC app,这是否具有足够的价值厚度呢?按理说没有AI,没几个人能写出诗,但现在AI可以写出不错的诗,这不是很有价值厚度吗?但其实未必,因为这个价值厚度在于帮助用户“创作”更有趣的内容,但如果“创作”这个动作的参与感本身被剥夺,其实是剥夺了价值。

这么看,编曲场景是不是有足够的价值厚度呢?大部分人不会编曲,但很多人都有写歌冲动,AI可以把这些冲动变成作品,同时这作品又足够属于用户,足够有创作感,哈哈!

好,暂定这个场景。那么还有最后一个问题要回答。

6、是选择“场景为脉络串联能力”还是“能力为脉络串联场景”

这个其实我们看到,市面上有很多AI赋能商业模式的公司,这是典型的能力为脉络串联场景。

比如,我做图像识别有优势,我通过图像识别作为核心能力,做API调用的云平台,赋能给大量需要图像识别的场景及应用,我自己不与自己组合成一个完整产品。

举个最明显的例子,就是BAT都会提供的OCR识别

用能力串联场景,这一能力在每个场景里的价值厚度可以很薄。比方说,一个医院的病例录入系统加入OCR,对这个医院病例录入系统本身的加分可能是5%。但这一能力具备足够的通用性,至少是在某个闭合领域里的通用性。比如你能在医疗领域做最好的OCR,你可以做这样一个商业模式。

回到我们刚才的例子,AI编曲UGC。假设我用能力串联场景,我所做的,应该是利用AI编曲的核心算法,供应给直播平台那些想发歌的主播,给视频博主提供更版权友好的商业化音乐,给词曲作者去赋能让他们更快速的写demo。

但如果我选择,用场景串联能力,可能我需要打造的是一个端到端的产品,需要培养UGC产品都要培养的自有生态。以AI生成编曲为核心,去降低用户创作音乐的门槛,以此培植一个完整的UGC产品。

如果我们选择用场景串联能力,我们基本就完成了产品的定义,那就是“通过AI编曲技术,让普通人的写歌冲动都能变成好听的作品,并明确感知创作乐趣,的原创音乐UGC社区”。

当然最后这个结论,可能拍脑袋凭直觉也有人会想到,但这不是重点,我是希望通过这个例子,分享给大家,我现阶段总结下来,系统性找到这个定义的一个方法论。

 

作者:郭靖,前迅雷、乐逗市场/产品,现创业者,曾获大数据BOT大赛冠军。公司曾开发选车聊天机器人,汽车维修门店智能助理,对话信息车险反欺诈。曾入选硅谷Draper University创业营,4个月英语从0学到能辩论并自学TensorFlow至可写主流CNN。“AI产品经理大本营”成员之一

本文由人人都是产品经理专栏作家 @黄钊 授权发布于人人都是产品经理,未经作者许可,禁止转载。

题图来自StockSnap.io,基于 CC0 协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 这个说的就一般般了

    来自安徽 回复
  2. 很有启发,感谢分享。

    来自新加坡 回复
  3. 挺有趣的PM😁

    回复
  4. “聪明的小朋友们会发现,这特么不就是一个直线吗,从1到6步,画成螺旋是为啥?有两个很重要的原因:

    PPT一页放不下直线;
    这样看起来更屌。”

    调皮,淘气

    来自北京 回复
  5. 感谢作者分享的方法论,4个月从0学英语到能辩论的方法论可以分享一下吗

    来自广东 回复
    1. 这你也信。。。

      来自江苏 回复