DeepSeek官方推荐:R1要这样设置

量子位
0 评论 2248 浏览 4 收藏 4 分钟
🔗 产品经理专业技能指的是:需求分析、数据分析、竞品分析、商业分析、行业分析、产品设计、版本管理、用户调研等。

作为当下热门的AI模型,DeepSeek的部署和使用方式一直是开发者和用户关注的焦点。本文汇总了DeepSeek官方对R1模型的最佳设置建议,供大家参考学习。

家人们,咱们到底该如何部署DeepSeek-R1,才能体验最佳啊?

对于这个问题,DeepSeek官方发话了:

DeepSeek推荐的设置非常简单,只有四项内容。

其中三项,其实在此前相关文档中有所涉及,我们在这里再来回顾一下。

首先,是别用系统提示词(No system prompt),所有的指令都应该包含在用户提示词中。

至于原因,网友认为是因为R1就是这么被训练而来的。

其次,是把Temperature设置为0.6。

DeepSeek在GitHub文档中的解释是:

将Temperature设置在0.5-0.7(建议0.6)的范围内,以防止无休止的重复或输出不一致。

第三点,则是一份缓解模型绕过思维的指南,包含两个细分内容:

对于数学问题,建议在你的提示中包含一个指令,如:“请一步一步地推理,并将你的最终答案放在boxed{}内。”

在评估模型性能时,建议进行多次测试并对结果进行平均。

新的设置推荐

除了上述已有的三点之外,这次DeepSeek官方在推文中引入了一个新的推荐——官方提示搜索和文件上传。

DeepSeek表示:

上传文件时,请按照模板创建提示,其中{file_name}, {file_content}和{question}是参数。file_template = “””[file name]: {file_name}[file content begin]{file_content}[file content end]{question}”””
对于Web搜索,{search_results}, {cur_data}和{question}是参数。
对于中文查询,使用提示词:

对于英文查询,使用提示词:

相应内容在DeepSeek官方GitHub的README文档中也有更新,感兴趣的小伙伴可以进一步了解下~

DeepSeek官方GitHub:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/README.md

参考链接:

[1]https://x.com/deepseek_ai/status/1890324295181824107

[2]https://www.reddit.com/r/LocalLLaMA/comments/1i9k284/why_should_one_avoid_adding_a_system_prompt_with/

金磊 发自 凹非寺量子位 | 公众号 QbitAI

本文由人人都是产品经理作者【量子位】,微信公众号:【量子位】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!
专题
13434人已学习13篇文章
产品设计与用户的体验感息息相关,但是很多时候产品经理在产品设计过程中会忽略掉可能影响到用户体验感的一些因素,比如一些异常状态的出现会让用户产品卸载的想法。本专题的文章分享了产品异常场景设计指南。
专题
13256人已学习12篇文章
数据挖掘是指从大量的、不完全的、有噪声的、模糊的、随机的数据中通过算法搜索隐藏于其中信息的过程。本专题的文章分享了如何挖掘数据。
专题
70652人已学习13篇文章
什么是产品的商业模式,不同类型的产品在商业模式上有什么区别?
专题
14816人已学习13篇文章
交互设计是用户与产品以及他们使用的服务之间建立的有意义的关系。