人工智能产品应用现状总览与未来思考

1 评论 12479 浏览 57 收藏 47 分钟

一个很大、很难成品的题目,但是自己很喜欢这一块,并且硕士期间也在从事基于深度学习的目标检测与识别的研究,所以希望能在总结与思考之后有一定的收获和一个清晰的脉络。无法一览无余,但愿能见微知著。

  1. 本篇文章,会先谈一下自己对人工智能产品的一个理解和使用体验(用户角度)。
  2. 接着以【行业应用】和【产品形式】两个角度,总结一下人工智能产品的应用情况。
  3. 最后,通过学习与总结再以一个产品人的角度,展望AI产品的未来。

【真假】“人工”智能

先从用户的角度,谈一下,现如今已经满大街都飞扬着的“人工智能”。

总结一下:说自己是AI产品的,大部分都是人工的AI;你感受不到的,却处处有AI。

我觉得上面的总结形容地应该很贴切了,由于很多普通用户对技术实现上没有太大的概念,所以总是被一些带有迷惑性质的AI宣传所欺骗,最后自己使用之后,评价基本都是:“什么破人工智能,真笨!”。而真正的人工智能技术,其实已经进入我们的生活,只是我们未曾察觉,而好的技术就是这样,不需要大张旗鼓的宣扬,却真真切切的提高了我们生活的效率。

先说说我们能看到的那些“假”人工智能。

智能水杯: 主要功能为,水温显示、水温闹钟、高温预警、饮水提醒、微信互联、定位寻找等。其实来看一下,这里面的功能,都是需要人为的在对应的智能硬件APP上设定,才能达到智能。当我们有新的想法时,还得去重新设定。是实实在在的【人工手动】智能。可这样的杯子,可以在某电商自营平台卖到300+、400+的价格。

智能水杯功能宣传图

从智能水杯,再看很多类似的“智能硬件”设备。它们通过人工的一些设定,达到自动的作用,但是如果情况有变, 我们希望更改设置时,就还需要人工的去设定,就非常的不智能了

但其实,是否需要人工设定,这个界限是有点模糊的,因为很多人工智能系统需要一个冷启动,但很多这样的智能硬件设备确实是一点AI的相关技术都没有用到,靠的是传感器显示和人工程序设定。

不过这类产品,可能也没想往AI上设计,但只是介于智能和普通之间,找不到其他好听的修饰词,所以便取了“智能”。就像刚出来的智能手机一样。这里就再不细谈这些产品是否可以算入“假”的人工智能(因为人家也没有明确自己是AI产品),但是,确实,会给用户带来一定的混淆。

【弱】人工智能产品的前因后果

不过,真正使用了”Machine Learning”的【弱】人工智能产品,才是让用户说出“什么破人工智能”的祸首。

智能机器人:现在市面上的机器人基本可以用能动的和不能动的来区分价位。在交互上,有纯语音交互的,也有视觉+语音的。这些产品集成了大量的机器学习和深度学习技术,一开始的亮相惊艳无比,但是慢慢的新鲜感就会下降。

其实出现这样的现象,根本的原因是这些产品无法自学习。虽然对比不同的交互,会有不同的设定,甚至在出现训练时没有输入过的陌生指令,也可以很好地拆解并做出反应。但是,这些算法始终都无法自学习(无监督学习),所以,某种意义上来讲,就是【弱】人工智能。

还有类似的:“智能推荐”、“个人语音助手”等,我们会发现都是在一定程度上的“智能”。这也是监督学习的一个弊端。机器无法自学习,在某种意义上就是【弱】人工智能。虽然,现在也有些“智能推荐”应用,可以根据用户的使用数据,不断学习用户行为迭代更新模型参数,但是,由于还是偏向学习用户历史行为数据,所以,这类的产品也会因为无法适应人类多变的兴趣和情感需求,而被诟病。

而对于,“聊天机器人”来讲,很多用户在使用过程中很容易跳戏,或者觉得并不智能。

清华大学的黄民烈博士表示,想要让机器像人一样与用户交流,还要需要几个关键点:

  1. 需要给机器一个固定的人格和属性。
  2. 要让机器知道交谈的话题是什么, 并且是在跟谁交谈。
  3. 要考虑对话时的一些其他环境信息,甚至考虑多方面的综合感知信息:如语音、语调、姿态和表情。

不过,以上说的这些,都是人工智能呈现一个完整的闭环产品形式在展现, 涉及到的使用场景是非常广泛开放性的,所以用户无法真切地感受到AI给我们生活中的细节末梢带来的巨大变化。

系统化、闭环形式的产品,总是难以打造的。当技术未成熟时,人工智能,很难作为一个独立的载体,开放式地为人类服务。但是,由于深度学习近几年的飞速发展,在一些细分领域上,人工智能已经可以胜任人类的工作,例如:人脸识别、智能安防、语音识别等等。

所以接下来,我们就来看看,应用了AI技术的产品都有哪些,如今的AI+ 是如何改变我们生活方式和产品形态的。

  这些年我们遇见的人工智能

这一块的内容思前想后了半天,写了又删,删了又写,主要是不知道该如何逻辑清晰地把概况都总结下来。最后还是觉得用【产品形式】和【应用行业】这两个角度进行总结,虽然有交叉的地方,但是大部分都还是有区别的,尽量全面的了解一下AI的各种应用。

AI应用中的产品形式展现

首先,先上一个导图。我按照产品的输入形式分为了4种:文字、语音、图像、视频。接下来,按照AI技术如何处理这些输入或产品的输出形式进行了举例。

AI产品——产品形式

首先要提一下,由于深度学习大量地应用到这些领域的研究中,所以从12年到现在,在上述的大部分领域中,学术界大幅地提升了算法的精度,这给产品化的应用带来了前提条件。因为,在学术界,可能提高1%就可以发论文;但是在工业界,需要有一个很高的精度,才能投入使用。并且,值得一提的是,在有些领域里,机器的准确率已经比人类还要高。

这里我们需要感谢硬件的不断发展,让我们得到了巨大的计算能力。也要感谢互联网的不断发展,让我们积累了庞大的数据。最后,也得感谢Geoff Hinton、Yann LeCun等学术泰斗,他们的坚持和创造让学术界重新看到了深度学习的无限潜力。

好了,开始细细说一下这些已经应用在我们生活中的AI产品。

文字

机器翻译:

这个大家应该都会用到:【百度翻译】、【google翻译】。目前的【google翻译】已经拥有100多种语言之间的互译功能,十分强大。虽然,对于有歧义的句子等,还是无法很正确的翻译;但是,对于日常的辅助阅读,已经十分够用了。

智能客服:

这个应该也很熟悉了,现在很多行业90%以上的客服回答都是由机器人来完成的。由于很多问题,都是相似的,可以直接对用户输入的文字做分词处理,匹配关键词,然后回答相应的问题,极大地减少了人工客服重复性的工作。

阅读理解:

让机器阅读文章并回答问题。虽然,我们让机器做阅读理解并评分意义不大,但是如果作为一个辅助技术是非常重要的:可以帮助人类在大量的文本中找到想要的答案,减少人力付出。

机器人写稿:

这项应用已经在很多细分领域中开展了。比如地震新闻、体育新闻、财经新闻等。这些领域中的新闻播报都有固定的格式,让机器学习这些模板,然后给机器输入相关的数据,可以在极短间内输出新闻报道。前段时间关于四川九寨沟发生的7.0级地震,中国地震台网机器人自动编写稿件仅用25秒出稿,写了540字并配发4张图片。

2017年8月8日21时37分15秒,中国地震网机器人自动编写的稿件

拼写补全:

我们在日常打字的时候,在我们未拼写完全的时候,输入法就会猜我们需要打什么字。这个就是利用大数据让机器更了解我们。

语音

语音识别:

这个大家就再熟悉不过了,现在手机上的主流输入法都支持语音输入,并且自己也会经常使用,自己走在路上给对方发消息,但是对方不方便接受语音消息时,依然可以抬着头走路,刚需啊!这里值得一提的是,国内的一些相关厂商在安静的环境下,中文的语音识别准确率达到97%。但是,同样,未来的技术重点也是要在这个【安静的环境】。不过语音识别更重要的意义在于,它给我们连接机器提供了一个更方便的接口。

即时翻译:

语音识别+机器翻译,就出现了现在很多即时翻译软件,出国旅游的利器。

语音合成:

这里,想要强调的是,语音合成技术是TTS系统中最基本而重要的模块。而TTS是text-to-speech.作者本人一开始居然还傻傻地以为是将两段语音合成。所以,我们在使用siri时,就是语音合成技术让她开的口。很多,阅读软件中的机器读文功能,也是通过语音合成技术模仿人声。说白了, 就是通过训练,让机器可以学习人的声音说话。

语音唤醒:

很多电影,主角一声吼,各种机器小弟来相见,这就是用到了语音唤醒。语音唤醒有两种基本方式,一种就是通过语音识别,然后匹配唤醒词。第二种,利用声学模型(音调、频率等),匹配唤醒库里发音词的发音特征,从而唤醒。

语音分离:

之前在讲语音识别时是不是提到,在嘈杂的环境下识别率会降低。这里就有语音分离的用武之地了,可以将非人声或其他噪声分离出来,只将我们想要的声音输入。

图像

人脸识别:

已经大量应用,iphone X刷脸解锁;刷脸支付也已进入试用阶段;甚至还可以通过儿童时候的照片找出长大之后的人脸;在一些安检点会通过照相匹配身份证上的人脸信息,以查看是否是本人。这都是人脸识别的应用。

目标检测&目标识别:

大多数情况下这两个技术都是同时应用的。这项技术也是整个计算机视觉的基础,很多应用的核心技术也是基于此。效果就是可以检测出一张图片中你想要检测的目标并识别出它是什么(人、动物、手机、汽车等等)。现在学术界的Yolo9000可以检测并识别9000种类别的物体,并且可以达到实时的速度。而且,目前机器识别目标的准确率早已高于人类(在一些标准数据集上的测试结果)。所以整个技术的成熟度已经很高,可以作为基础技术应用到各种复杂系统中去:例如,智能驾驶中需要检测并识别周围的物体;智能安防领域中需要检测摄像头中的感兴趣目标,等等。
最后,用一句话概括,就是可以让机器认识物体。

场景识别:

一张图片我们分为前景和背景。当人站在足球场上时,我们就可以利用目标检测和识别技术将人检测并识别出来,而场景识别呢,就可以告诉我们,这是足球场。一个是检测前景物体的,一个是检测背景的。而场景识别,要更加复杂一点。

OCR:

Optical Character Recognition——光学字符识别。是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。

这个应用就十分广泛了,而且也已深入我们的生活:比如,你在手机上添加银行卡时,很多软件会让你直接把卡放在摄像头的中央位置,然后就会自动识别出卡号。还有一些软件需要添加身份证或者是个人证件时,也可以使用相似的操作;以及你在停车场进出的时候,车牌识别,其实也算这个领域。也有很多软件应用在直接把PDF的内容转换成可编辑的文档。可谓十分广泛。也是非常基础的一个应用。

图像处理:

其实在这个领域内,有些方法并没有用到机器学习的内容,但是也有用到的。应用也是十分广泛的。现在的很多美图软件,都可以按照用户想要的效果输出处理后的图片。当然还有一些更有意义的:比如,图像去雾、图像去燥、暗光增强、失焦修复。当然还有各种滤镜啊等等。应用十分广泛。

还有值得一提的是,图像超分辨率:就是可以用深度学习模型将原始低分辨率的图像经过处理后变成高分辨率的图像。并且,效果就是,你会认为处理过后的图像就是原始图像。再多说一句,这项技术更进一步,可以达到,你给机器输入一个文字:“猫”,它就可以帮你生成一张猫的图片。

图像融合:

其实图像融合也可以算是一种图像处理的方式。目前已经有很多图像融合的APP了,并且这些图像融合不是简单的两个图像相叠加,是在风格上的融合,并保持一定的内容特征。在学术上,叫做图像风格迁移,可以让人人都成为梵高风、毕加索风的图片创造者。大家可以下一个【prisma】体验一下。

这里其实,想说,看很多文章说这样机械化的创造,会不会消灭艺术;但,我觉得,虽然机器在融合的过程中并不会加入情感和思考,但是,背后操作的人,依然有着温度。所以,作为一个工具,可以让我们人人都成为一个“假”的艺术家,可这也是艺术希望的啊。我们需要做的,就是更好地了解这些工具,并让他们成为生产力。

图像分割:

其实图像分割,就是抠图,并且是完全按照物体的轮廓扣出来的图。现在很多软件也可以做到,把你想要的前景目标按照其边界轮廓扣出来,然后,你就可以任意妄为的让它去你想去的地方了。

最后看一下两篇在各自领域内较顶级的论文中的实验截图,感受一下目标检测与识别 和 图像分割的区别。其中,左图上面的数字就是机器认为是该物体的概率(最大为1.0)。真正的技术上原始的输出是这样子的,在此基础上,到产品端给用户的展示方式和形态可以有更多的想象力。

目标检测与识别&图像分割

真正的技术上原始的输出是这样子的,在此基础上,到产品端给用户的展示方式和形态可以有更多的想象力。

视频

其实视频中的很多应用基础是上一节讲过的图像技术,因为视频都是由一张又一张的图片组成的。在处理视频时也会将其作为图片进行处理,随后再将其连贯起来看。但是需要注意的是,视频,比图片多了一个时间序列信息。而利用这个信息,也是很多视频应用中,最关键的一步。

行为分析:

当我们将视频中出现的目标按照先后关系连续去看每一个动作时,其中就蕴含着行为的特征。技术上实现的原理也是这样的,先通过把每一帧里 人的动作给识别出来,然后再放到另一个模型中连贯的去处理这些动作特征,最后得到预测的行为结果。

这个,在人机交互中有十分大的潜在应用价值。而在实际投入使用中,很多城市都安装了预警摄像头,如果在其监控范围内有潜在的犯罪行为,就会自动报警。

视频分割:

这个就是做连续的图像分割。把视频中的一些前景或背景分割出来,有利用更好的研究视频的内容信息。也可以作为一种辅助工具,用于无人机导航和智能驾驶中去。

视频语义理解:

视频语义的理解其实是一个多特征的融合。利用之前提到过的:行为分析、人脸识别、语音识别等技术,对视频的相应内容进行识别,并综合这些特征,理解视频内容。

SLAM:

Simultaneous Localization and mapping,同步定位与地图构建。是近几年很火的一项研究。我所知道的,有两个应用:

  1. 无人机在室内环境下无法利用GPS导航飞行,这个时候就需要SLAM技术,在陌生的室内环境中进行视觉导航。大致的原理就是,通过摄像头拍下室内的场景,然后进行地图的构建,随后用户就可以操作无人机飞行室内的一些指定位置了。这样就解决了之前无人机无法在室内定位导航飞行的难题。
  2. 在陆地上走的机器人,进入一个陌生的环境也需要进行导航。通过在运动过程中拍下的室内场景,构建室内地形地图特征,并定位自身位置和姿态。这个在一些灾难救援场景中,就显得尤为关键和重要。

目标跟踪:

目标跟踪就是将目标在视频中的行动轨迹给画出来,从而就能定位一个人。目标跟踪其实是在目标检测的基础之上做的一个算法跟踪。因为,因为目标检测无法区分检测到的两个人,并且,在目标被遮挡的情况下,也是无法检测到目标的。而应用目标跟踪技术,即使在遮挡的情况下,根据目标移动的轨迹也可以预测出他的位置,并且,如果同时检测到多个目标,还可以区分出这些目标的轨迹。

智能安防:

以前,我们安防预警需要靠人盯着,或者说在事发之后,需要人为地去翻看录像。而,将以上目标检测与识别、人脸识别、目标跟踪、行为分析等技术整合之后,就可以依靠机器查出犯罪嫌疑人分的移动方向,甚至在城市的其他摄像头中找到犯罪嫌疑人。也可以,让机器全天候24小时的情况下监控一些关键区域,预警是否有危险情况的出现。

智能安防是一个领域,其中需要应用到的技术是依据场景和需求而定,但其中肯定少不了AI的应用。

AR/VR:

这一块的技术应用笔者不是很了解,但是,其中肯定集成了深度学习的一些基础应用技术,例如:人脸识别、目标检测、场景识别等。而VR/AR未来可能会随着硬件的普及,重新定义一些我们的生活方式。不过,在此之前,应该先很好地解决长时间佩戴眩晕问题。

好了,到这就先告一段落了,仔细回顾一下上面所介绍的,在产品的形式上,AI几乎已经是包揽了所有的计算机软件形态(不知道这样说准确不)了。而一些基础应用,已经渗入到各行各业中,有的作为工具、有的作为零件,被集成到了行业中的系统中,为用户或使用人员带来了便利。

而其中,有一个特点,就是应用最为广泛的,是一些基础技术。它们作为工具,加快了传统的人工处理或一些传统技术处理的速度。

AI产品在各行业中的应用展现

这一章节,先上图,随后我们对这些行业进行一些简单的介绍和分析,如果有对某项应用感兴趣的,可以直接在网上搜索下面的关键词,都可以得到很多的资料和介绍。

AI产品——行业应用

以上,我挑了几个公认的AI改变巨大的行业进行了细分。

生活服务:

如今的智能手机就是集各种AI技术的产品。未来的手机,可能都是人工智能+概念,成为最懂你的生活助手。在本地收集你的信息,然后训练模型,为你进行个性化推荐。并且,手机上可以集成更多的深度学习技术。

  1. 当你游玩时看到一束花,然后打开手机的摄像头,手机就会告诉你这个花的一些信息。
  2. 当你在朋友圈看到别人发的风景照,再也不用在下面评论这是哪呀,直接点击图片搜索,就会告诉你这个游玩地点,和一些景点基本信息。

当然在生活服务方面,还有更多的事可以做。

  1. 夏天,在下班前的20分钟,将家里的空调打开。调节到事宜的温度。
  2. 出去买东西,孩子自己一个人在家里,一哭闹,手机立马报警,可能同时还有一个家庭机器人开始唱歌陪伴孩子。

其实这些事,很多已经可以做到了,就等待未来这样的生活普及到千家万户。很多智能硬件厂商,也都在积极部署自己的智能家居生态,这里,【智能音箱】成为了行业内的兵家必争之地,作为连接各个智能家居的中枢入口。

这里,看一下在国庆期间谷歌的2017秋季新品发布会,就能感受到,AI+在生活服务中的方方面面。

零售:

AI在对整个电商零售行业的改变可谓是巨大的。我们能感受到的最深刻的就是个性化推荐。

  1. 你在某平台上看羽毛球拍,基本上在其推荐区域可能就会有很多同价位的羽毛球拍的推荐。
  2. 当你买完羽毛球拍,推荐更多的可能是羽毛球或球鞋等等。

个性化推荐其实已经应用到各行各业中了,很多面对消费者的企业都将”千人千面”挂在嘴边,成了下一个战略目标。其实,真正去看实现的原理,发现确实是”千人千面”,但是由于用户画像的标签数量级很难达到另一个量级,发展到最后就依然还是“亿人千面”。

对于传统的零售行业,通过大数据+机器学习可以对未来的货品需求进行预测,大大减少了商品压仓的概率。

2017 TechWorld大会上,刘强东表示,在明年双十一之前,会将建立第一个无人仓库,没有一个操作员。京东在昆山已经有一个无人分拣中心,分拣能力可以达到9000件/小时,每个场地可以节省180人力,可以实现整个分拣大环节的全流程无人操作。

而今年7月份亮相的阿里巴巴无人超市,也让我们看到了零售实体店的未来。配合刷脸支付,试想一下,未来,你去一家这样的超市,刷一下脸,然后挑选商品,出门、抬头、支付、走人。现在看来这样可能是一件很装X的事情,但是未来,有没有可能大家都习以为常。

用马老师的话说,未来,中国每天的物流量可能都能到达现在双十一的流量。所以,人工智能的应用已经是大势所趋,可以减少大量的人工重复性工作,并且还能帮助人类完成优化决策。

教育:

我们都知道,大班教育没有小班教育好,而小班教育没有私教好。而,当人工智能应用到教育行业时,我们将较容易得体验到这些昂贵的私教服务。为用户构建私人的知识图谱,让用户更容易地、更准确地发现适合自己的内容。

美国红雀模拟器公司推出的红雀FMX型全动飞行训练装置经过了美国美国航空管理局(FAA)认证,价值几千万美金的模拟机。 中航国际曾采用这款飞行器训练我国飞行员。

而,模拟机和真机的飞行感觉没有差别, 并且,模拟机的训练更为便捷。

模拟飞行器

通过大数据+人工智能,机器人可以帮助我们更好地报考志愿,现在已经有很多这样的收费产品。输入文理专业、分数、生源地,就可以帮你推荐合适的学校和专业。并且,我觉得,通过往年的数据,不掺杂感情地预测,可能更加准确客观。并且,最大的优点是:可以更快、更准确、更全面地得到所有的选择可能。

安防:

安防领域之前已经说过很多了。想想,以前是需要人在那里盯着屏幕一直看,而人还需要休息,有时也会走神。但是,机器只要运行程序就行,只要程序没有问题,机器就可以一直工作。所以,AI在安防领域的应用也确实大大解放了很多劳动力。

上面的应用可以是实时的,作为预警作用;也可以是在刑侦办案时,帮助警方更快速地找到可疑目标。

金融:

金融行业对人工智能的青睐其实很早就开始了。

1969年,爱德华·索普利利用他发明的”科学股票市场系统”(实际上是一种股票权证定价模型),和里根合伙成立了第一个量化投资基金——可转换对冲合伙基金。

而,近几年,从海外到国内,智能投顾也开始兴起。2016年也被称为中国智能投顾的元年。

通过大数据+人工智能的技术,可以让用户最大概率的获得收益,这和金融的本质,控制分险是一致的。并且,机器在面对金融时,是不会有贪婪之意的,有非常大的优势。所以,人工智能未来还是会成为金融从业者最有力的决策工具。

除了,投资方面,人工智能技术也开始深入到了金融中的方方面面。

  1. 刷脸支付已经慢慢地开始进入到商用时代。
  2. 在后台的每一笔支付中,人工智能都在计算操作的安全性,保障我们的账户安全。(我们在外地、或新换手机支付时,有时会需要短信验证码。而在常住地,大部分时间都不需要。)

个性化推荐,也在金融获客中起到了重要的作用。如今的很多信贷产品,你只需要输入一些个人信息,金融机构就可以迅速地计算出一个合理的信贷额度。

保险产品琳琅满目,而现在的产品,也可以根据你购买行为,资产配置情况等,进行个性化推荐保险。

交通:

  • 自动驾驶,大家可能觉得就是自动驾驶小轿车,而如今,自动驾驶所应用的程度更加广泛:目前、包括Google、苹果、百度、乐视、Nvidia、Uber、福特、通用、特斯拉、奥迪、丰田、日产、本田、现代、奔驰、宝马、奥迪、Faraday Future、BOSCH、沃尔沃等众多科技或汽车厂商都已经在研究和测试自动驾驶。
  • 2017年8月中旬,中国中车研发的全球首款12米“无人驾驶”智能客车初次上路,在3公里的运行测试中表现出色。
  • 在深圳市2017年“公交出行宣传周及无车日”活动启动仪式上,深圳巴士集团董事长余钢透露,他们正在与国家智能运输技术中心、华为公司等合作,共同研发无人驾驶技术,2017年年底将在深圳市南科大等处试验推出2条无人驾驶路线。、
  • 近日,Rio Tinto公司宣布其生产的火车已经完成了首个无人驾驶任务,它实现近100公里无人驾驶。Rio Tinto希望在2018年年底之前拥有一个完全自主的列车网络。

看看以上的一些咨询和新闻,现在自动驾驶确实是百家争鸣,应用广泛。不出意外,未来,自助驾驶就会进入我们的生活了。大胆设想,如果自动驾驶非常成熟,成为了主要驾驶方式,未来的车祸率是不是会减少很多,而且也完美的解决了酒驾问题。

各厂商无人车集锦

其他的,智能交通灯系统,根据对路上车流量的检测和整个城市交通的情况分析,自动控制并调节交通信号灯的转变。

还有无人机的应用,除了无人机航拍之外,我们还可以利用无人机送货,也可以进行特殊环境下的灾难救援等等。

医疗健康:

人工智能在医疗领域的应用意义十分重大。目前,很多疾病都是由于发现不及时,而导致死亡等等。而,我们在体检的时候,一些细小的指标或者医学影像医生很难发现。此时,人工智能便可以替代人力做这样一件繁琐、重复,但十分有意义的工作。这可以辅助医生做诊断,减少误诊率,漏诊率。

在老年看护方面,我们可以在老年人身上放置一些传感器,通过对数据的实时监测,来完成对老年人的看护。

目前很多公司都开始提供基因检测服务,基本的检测在1000元以内,通过人工智能技术,我们可以在基因检测之后做进一步的诊断。

还有智能诊断,医疗机器人、康复机器人等应用产品。

不过目前,这些应用都处在初期阶段。很多产品都无法大规模的商用,而有的还处在实验室阶段。但是,未来,人工智能作为医生最好的决策助手,指日可待。

其他:

Alpha Go 已经火得不要不要的。

Camera Effects:

facebook在2017年F8大会上发布的AR平台。让相机成为变成一个AR平台,可以给人脸添加配饰,通过AR换装,在实物上涂鸦等等。并且它的意义在于,这将是一个开放式的平台,全球的发布者都可以讲自己创造的素材发布到平台里,让传统的AR添加素材更加多元化。

LipNet:

由牛津大学人工智能实验室,谷歌DeepMind和CIFAR联合发布的一篇论文。该文介绍了利用机器学习实现语句层面的自动唇读技术。结论显示,在GIRID预料库上,LipNet实现了93.4%的准确度,超过了经验丰富的人类唇读者和之前的79.6%的最佳准确度;并且,这一文本转换的速度几乎是实时的。

虽然这篇论文在学术界投稿上磕磕绊绊,但对于工业界是一个很好的应用方向和工具。

百度寻人:

平台致力于运用百度的人脸识别技术更加快捷方便地帮助走失人员回归家庭, 现已对接民政部全国救助寻亲网中近3万条走失人口信息,用户可以上传走失亲人的照片进行快速比对。并且,现已有成功寻人的案例,个人认为十分有意义。

好了,终于通过【产品形式】和【行业应用】这两个角度介绍完了大部分的人工智能产品,不知道大家看到这里,是否觉得未来,就像蒸汽机带来工业革命一样, 深度学习的这波潮流即将要带来人工智能时代?

我个人认为,此言差矣,欲问为何,还看最后一节的总结分析。

在这一章节的最后,贴上目前AI领域的四大天王以示敬意,目前已有3人在工业界任职。

从左至右:Yann Lecun、Geoffrey Hinton、Yoshua Bengio、Andrew Ng(吴恩达)

再次膜拜…

AI产品的今天和明天

首先总结一下AI产品的特点:

1.目前成熟的AI技术偏向于基础应用,呈现工具化、零件化的形态。

2.在一些领域中,由于AI程序化的设计,使得机器可以完全胜任一些重复性、繁杂的工作。解放人力,打破了传统人力在自然、人体机能前的限制。

3.由于大数据的发展,在很多方面,人工智能通过大量地学习以往经验,在掌握大量信息的情况下,可以做出准确率十分高的决策。而,与此同时,人类可能无法像机器一样考虑得全面。

4.想要应用AI的行业,必须要有大量的数据积累。也就是必须要有基础业务,而人工智能作为其中的一环或者工具依附在上,作为一种支持系统。

5.大的AI系统必须细分化,不断拆解其技术问题,通过结合大量的、成熟的基础AI应用来完成整个AI系统任务。

个人认为,以上总结的5条,体现了目前绝大多数AI产品的设计逻辑。

而我们从一些使用体验比较失败的产品身上,得到的一些结论,会发现跟前面的一些特点会恰恰相反:

  • AI所应用的领域在之前没有传统的基础业务做积淀,AI系统封闭性太强,形成了单独的闭环系统。
  • 由于监督学习的算法特点无法自学习,AI系统不够“聪明”,导致无法面对非常广泛的、开放式的环境中产生的所有情况。
  • 性价比低,由于AI算法的应用,需要更高的硬件资源,而实际达到的效果与增长的价格不符合预期,价值低。

这里,如果再做进一步的现象总结的话, 我们可以发现:用户体验不好的产品,都是属于全新的产品链,并面向C端用户的。这样的产品几乎占了上面的3条特点。而与行业内数据储备庞大、业务经验丰厚、2C端产品成熟的B端厂商相结合,提供底层的AI技术支持,是目前最成功的商业模式。

以上3条是目前一些真的人工智能产品出现的一些问题,注意,这里说的是真正的人工智能产品。这里我们可以看两则消息:

康奈尔大学的研究人员对Siri、Google Assistant、度秘等人工智能语音助手进行了智商测试。这项研究仍在进行之中,但最新公布的结果显示:Google Assistant的IQ为47.28,略低于6岁儿童的智商。而Siri则是23.9,大幅落后于后者。

Geoffrey Hinton对人工智能的未来非常担忧,在最近的一次人工智能会议上,Hinton表示自己对于反向传播[非常怀疑],并提出【应该抛弃它并重新开始】。

然而目前,反向传播是监督学习的核心,也是深度学习不可或缺的一部分,但是,就像之前提到的,利用反向传播调整模型,可能AI永远无法达到【强】人工智能。

接下来,想说,其实AI到目前为止最主要的就两个作用:

  1. 将人类从繁杂的、重复的工作中解脱出来。
  2. 通过目前已知的情况,帮助人类做出决策。

如果说大部分成功的产品都讲究一个社会阶段和环境养分的话,那么,现在的AI产品在设计时,应该本着这两条去考虑。而那些我们感觉到不尽如人意的AI产品,大都是没有按照这两条的意图去设计的。

对于“AI会让很多人失业”,“有可能威胁到人类”等反AI的观点, 我还是持相反意见的。我们的老祖先很早就说过:【以史为鉴】。只是当时没有存储数据的机制,没有相应的计算算法,更没有计算的机器。否则人工智能可能会更早的出现。而现在,这些条件都已具备,我们为什么不大胆地拥抱呢。

想想,我们可以利用多年积累的数据和经验,代替很多重复性的工作。我们可以利用存储量大于常人的机器,帮助我们记住很多信息并作出决策建议。这,并不是机器威胁人类的方式,而是人类利用机器,解放自己,从而走向更加快速发展的道路。

好了,最后了。我们聊聊未来。

其实就是一句话:理智、客观地看待人工智能的潮起潮落。

人工智能已经经历过了两次寒冬,这里,有资本过热地毒害,也有学术无法继续前进的问题,可能最冷的Winter is coming. 当监督学习无法满足一些任务,而,新的学术方法还未能出现解决时,可能最后一次寒冬就来了。

不过,可能大家会抛弃现在的算法和网络,但是,人工智能时代终究会到来,因为人类终将会用工具代替现在的自己,并开始从事其他更有意义的工作。科技永远会向前走的,人类也需要更多的人力去转动历史的车轮,去完成更有意义的事情。(这里套用一下我本科高数谢老师的一句课上名言)

人类的出现就是为了揭上帝的底牌。

虽然,可能前景一片美好,但是路漫漫,高低坑洼还有迷雾。资本需要和市场一样理智创业者也需要在做人工智能时,牢牢依附着传统行业,少一些【强】人工智能的梦想,多一点细分化场景的创造。人工智能的基础技术已经十分成熟,在各行各业中都有应用的条件,可能,现在只需要一个靠谱、新颖的idea.

而,目前,我们需要做的,了解人工智能技术的边界,深入行业研究具体业务,最后,架起一座又一座桥梁。
当然,这里我们不可能一番风顺,可能会在数据获取、数据清洗、制作数据标签时等等环节中遇到困难。但是,历史的责任,需要无数的AI从业者去理智地推动这件事。

作为一个还没有怎么经历社会历练的小鲜肉,居然在最后一章节,说了这么多装X、预测、总结的话。还望,各位看官大佬包涵。不过,希望自己能够从事到这样的一件事情中去。

文中如果有错误,希望能批评指出,也欢迎与您一起讨论。

 

本文由 @~永远的一号~ 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自Pixabay,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!