"测试用例"相关的文章
AI
AI产品经理必修课!评测数据集构建方法 & 实践

AI产品经理必修课!评测数据集构建方法 & 实践

上篇文章全面详细地介绍了LLM-as-a-Judge——用大模型评估大模型的完整方法论。 这篇文章介绍AI应用构建过程中非常重要且必要的一个步骤:测试数据集的构建。从数据集的来源、测试集的分布到不同任务的测试集构建实践方法论,每一个要点本人我都在实际工作中为大家检验过。推荐各位AI产品经理及算法将本文作为测试数据集构建的小册子来食用~