NLP领域AI产品经理必备的常识及术语

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

NLP领域AI产品经理必备的常识及术语

丸子笔记

2020-06-02

3 评论 5018 浏览 64 收藏

5 分钟

AI产品经理自然要了解目前AI领域的基本技术，本文介绍了NLP领域AI产品经理必备的常识及术语。与大家分享！

产品经理要了解基本的技术，那AI产品经理自然要了解目前AI领域的基本技术。

当然我们不一定要掌握那些技术但至少要了解基本的常识和专业术语，便于更好的利用AI技术创造或优化产品；同时可以与技术算法人员更轻松的沟通并拥有一定的话语权。

由于目前丸子妹在从事NLP领域相关产品实践，因此总结了目前阶段接触到的AI相关的技术以及日常接触到的专业术语。希望给正在准备入行或者刚刚入行不久的童鞋一点点帮助，如有疑问和建议欢迎各位及时指正和交流。

NLP领域目前主要有几个大的任务类别：语音识别和生成、文本分类、信息提取、实体识别、对话系统、机器翻译、情感分析、知识图谱等。而每一个大类都有比较经典常用的技术和算法模型，了解了这些常识就可以在有新的任务时做好足够的项目预判及评估。

但由于算法的不断优化创新，新的算法层出不穷。因此需要更加及时的关注领域顶会论文动态及新模型的优劣，不必一味追求最新的算法；而是通过对比分析选择更合适在自己的产品业务中落地的算法。

一、常见任务及当下经典算法

文本分类/意图识别：CNN / Bert / LSTM+Attention
实体识别：LSTM+CRF
中文分词：N-Gram / CRF / HMM
文本相似度：TF-IDF / BM25+Bert
文本摘要：Bert+Textrank
问答系统/机器翻译：Transformer+Bert / Seq2seq+Attention
情感分析：Word2vec+LSTM / CNN

二、常见知识点、术语

人工智能领域两类算法：基于统计的机器学习算法(Machine Learning) / 深度学习算法(Deep Learning)
人工智能三要素：算法、算力、数据
常用的框架：pytorch / sklearn / tensorflow /PaddlePaddle
数据标注：为模型训练提供学习语料的数据处理，一般为人工+系统相结合
预训练模型：用某个较大的数据集训练好的模型(给出了可使用的初始化参数)，你可以利用它使用自有数据集进行训练并得到合适的模型参数
词向量：即将文字数字化，利用数学领域的向量表示单词/短语
语料：语言材料，提供给算法模型进行学习的基本知识
批处理大小：即训练的 batch_size
训练数据的训练次数：训练 epoch 数
学习率：即 learning_rate

三、词向量维度：网络中词向量的维度

各层网络卷积核大小：即 kernel_size
窗口大小：skip-gram 算法中的 window_size 参数
过拟合：在模型训练过程中效果较好但在测试样本中准确率较差，表现为模型过分依赖于训练语料，反之可以理解“欠拟合”
模型蒸馏：算法能够用小型的网络从微调过的文本分类模型中学习信息
蒸馏训练次数：蒸馏过程遍历蒸馏数据的次数
评估标准：准确率、召回率、F1、AUC、ROC、损失函数
监督学习：通过已有的训练语料完成模型训练，从而在测试样本验证模型已经学习到的能力
强化学习：将一个已经训练好的模型作为另一个任务的基础模型，降低成本

好了，以上就是丸子妹根据实际工作总结的AI产品经理必备的与技术相关的常识和术语，欢迎评论区补充～

本文由 @丸子笔记原创发布于人人都是产品经理。未经许可，禁止转载。

题图来自Pixabay，基于CCO协议。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

丸子笔记

资深产品经理，微信公众号：丸子笔记

7篇作品 101870总阅读量

产品经理反内耗，3大法宝

08-211905 浏览

设计规范如何做到保持生长性与可复用性

07-314319 浏览

“抖音聊天”推出背后，隐藏着字节的社交梦？

01-044394 浏览

商业化近一年，钉钉们活得怎么样？

02-234171 浏览

产品经理需要掌握的能力：产品的原型设计

10-125041 浏览

lio

ai产品经理会在需求文档里写这些东西？

最近来自广东回复
Eric

写的很实用，希望能加个微信多交流一下，V：939999047

最近来自北京回复
willc7

只是翻譯

最近回复

掌握中式营销密码的SHEIN和TEMU，暴揍美国零售同行

04-172810 浏览
系统权限如何设计更合理

12-204695 浏览
从字节到甲方公司的工作体验：生意是一门计算概率的博弈

09-043921 浏览