AI训练师职业是干啥的,一篇讲透!!

0 评论 1203 浏览 1 收藏 12 分钟

为什么AI越来越“懂人话”?背后离不开AI训练师的“调教”。本文试图打破“训练师=标注员”的刻板印象,从交互设计、语料构建到价值引导,重新定义AI训练师的专业边界与社会价值,并探讨这一职业的未来走向。

在任何组织里,每个角色都有自己的分工。在AI公司或者AI模型公司中,它们也有4个关键角色。

首先介绍AI训练师上游会有,AI产品经理和AI算法工程师。这里说的上游指我们的上层,而非上级。

🙋‍♂️AI产品经理:是模型功能的完善者或者落地者,负责市场调研与分析,挖掘用户在模型相关功能上的需求。

🙋‍♂️职责:将老板设定的目标具体化和落地化,具体化举例子🌰,老板要求制作一个文生图的模型,AI产品经理便开始思考我们需要哪些功能,如何实现,才能有文生图模型,用户应该如何操作才能使用这个功能。

AI产品经理是AI产品落地的核心推手,需要兼具业务洞察力、数据敏感性和技术判断力,主要负责深入挖掘业务场景,明确AI产品的核心。

🙋‍♂️AI算法:实际上是我们模型的实现者,主要使用各种框架,根据业务选择合适的基座模型,通常基于开源模型进行模型选择。

🙋‍♂️高频面试问题:当面试官问你,你们的模型是自研的吗。

通常两种回答:第一种方法是基于开源模型进行微调。

第二种类似于稍大的公司,例如百度、阿里、腾讯或者智普这类公司,他们通常从头开始进行模型训练,完全自己制作模型。

举例子🌰:可以设想一个蛋糕🎂,基于开源模型微调,实际上,你已经在市场上购买了蛋糕坯子,在底部放入大蛋糕块,再抹上奶油进行装饰即可。

完全自研的蛋糕,可能从和面开始,甚至可能从种麦子开始,自己动手制作蛋糕坯子,再加上奶油等,就可以成为一个蛋糕。

AI产品的作用是什么?

以蛋糕为例,AI产品的定义是模型的制定者和功能落地者。以蛋糕为例,AI产品的责任是确定蛋糕的尺寸、切开销售还是整体销售,以及定价是多少?这些都是由AI产品经理决定。

算法的作用是什么?以蛋糕为例,如果是完全自研的算法工程师,那么他需要从如何种麦子、将麦子磨成面粉以及将面粉制作成蛋糕坯子开始实现整个过程。

🙋‍♂️AI训练师下游:数据标注

🙋‍♂️数据标注职责:细致标注数据,作为数据的真正生产者,他们每天都在根据AI训练师,制定的规则标注大量数据。

总结一下:

整个模型团队中最常见四个角色,第一个是产品经理,第二个是算法,第三个是数据标注师,最后是AI训练师。

AI训练师介绍

职责:连接业务需求与AI模型落地的桥梁。这句话可能有些复杂,简单来说,它的核心工作就是承上启下。承上是算法和AI产品经理。

因为算法和AI产品的业务非常繁忙,他们所说的内容非常抽象。例如我们需要明确项目的赋能抓手是哪几个点,并且细化颗粒度,然后与下方对齐,确保整体水位齐全。(都是大厂自己黑话🤭)AI训练师也需要把他们常说的黑话翻译人能听懂大白话。

其二的工作是帮助他们细化需求

什么是细化需求?

举例子🌰如果我们上游AI产品经理或者算法,告诉我们需要标注出,全国的红绿灯。

那么我们应该如何标注,如何开展AI训练师的工作?

例如所有红灯都画个圈标出来,或者所有绿灯都画个方块标出来,这个问题需要明确。

这个问题不明确,当我们把这个需求传达给下面标注人员,他们也会存在这样的疑问。所以AI训练师明确目标,确定如何标注。

明确目标一:红绿灯分横着和竖着是不是都要标记

明确目标二:先从那个城市开始标注,上海还是北京开始?

我们上游AI产品经理和算法,只会告诉ai训练师,我们 要做一个红绿灯识别的大模型,需要你把全国的红绿灯都标注出来。AI训练师就需要细化需求。

到底应该怎么标注,是应该先标注哪个城市的,还是应该先标注横着的或者先标注竖着的?如果红绿灯只有红的和绿的,没有黄的怎么办?

总结:AI训练师就是细化这些规则

🙋‍♂️数据标注师VSAI训练师两个岗位区别

一句话先概括,数据标注师能胜任的工作,AI训练师必须具备。

解释一下:只有你自己能胜任,才能了解下属员工在工作时应该注意哪些细节,他们应该如何操作,才能避免被欺骗,并指导他们工作。

🙋‍♂️数据标注师是AI数据生产的执行者,需要具备规则执行力、细节敏感度、领域知识沉淀能力、数据标注操作质量自检反馈效率与规范的提升能力。

数据标注师的核心职责是理解规则,即理解他人的文档,并在查看文档时进行文档细化拆解。

🙋‍♂️AI训练师作为连接业务需求,与AI模型落地的桥梁,需要具备以下技术能力:第一,需求拆解与规则制定能力。第二,数据标注全流程管理。第三,标注团队能力培养。第四,模型效果分析与数据迭代。第五,行业知识沉淀与标准化。

传统标注与大模型标注到底有哪些区别

传统标注,例如最典型的汽车标拉框,即用一个方块标出。任务特征是面向单一场景,数据相对单一。

工作两个月后发现所有物品都是汽车,除了车你不认识别之外,你每天只需要标注图里的汽车即可。这是传统标注方式。

AI训练师的标注即大模型标注,它面向的场景非常开放。我们认为模型非常好用的原因是你提出任何问题模型都可以给出回答,这意味着它的训练数据非常多样。

例如在标注数学题时,你需要将题目进行分型,如应用题、代数题、计算题和判断题,这是否比你之前纯粹拉框困难得多?传统标注只需要认识汽车并标出车辆即可,AI训练师实际上是偏脑力劳动的人员,你需要思考数据标注规则,以及如何标注才能让模型生成更好的回复。因此它的难度也会比传统标注困难得多。

🙋‍♂️AI训练师,会对模型进行评测,了解模型的能力短板,从而制定下一次数据需要生产的方向。例如,在使用模型时,虽然模型的语文能力很强,但是数学能力较差,这种差异可能导致应用题、计算题或者推理题的差异。这时,你可以根据模型的表现制定下一次数据的优化方向。

AI训练师的能力,决定了模型能力

总结一下:

以上就是AI训练常见的工作流程和对接人员。后面也介绍了到底和传统数据标注的区别在哪些。

🙋‍♂️Ai训练师的主要职责是承接需求,即将上游需求进行细化拆解。

第二个是制定标注规则,可以针对细化的需求制定标注规则。

第三个是数据生产的全流程管理,即在有规则后需要安排人员工作并关注他们的工作。

第四个是标注团队的能力培养,即团队成员应该如何工作,如何能够工作得更好、更快,这也是需要关注的点。

第五个需要对模型效果进行分析,并且根据数据进行迭代。

AI团队构成,实际上有三个关键角色。第一,上游是产品和算法,中间是AI设计师。下游是标注团队

本文由 @小五- 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!