DeepSeek官方推荐:R1要这样设置

量子位
0 评论 2279 浏览 4 收藏 4 分钟
零基础想转行产品经理?别担心!我们的实战营专为转行者设计,提供体系化课程和项目实战,帮你弥补经验短板,成功实现职业转型,拿到心仪offer。

作为当下热门的AI模型,DeepSeek的部署和使用方式一直是开发者和用户关注的焦点。本文汇总了DeepSeek官方对R1模型的最佳设置建议,供大家参考学习。

家人们,咱们到底该如何部署DeepSeek-R1,才能体验最佳啊?

对于这个问题,DeepSeek官方发话了:

DeepSeek推荐的设置非常简单,只有四项内容。

其中三项,其实在此前相关文档中有所涉及,我们在这里再来回顾一下。

首先,是别用系统提示词(No system prompt),所有的指令都应该包含在用户提示词中。

至于原因,网友认为是因为R1就是这么被训练而来的。

其次,是把Temperature设置为0.6。

DeepSeek在GitHub文档中的解释是:

将Temperature设置在0.5-0.7(建议0.6)的范围内,以防止无休止的重复或输出不一致。

第三点,则是一份缓解模型绕过思维的指南,包含两个细分内容:

对于数学问题,建议在你的提示中包含一个指令,如:“请一步一步地推理,并将你的最终答案放在boxed{}内。”

在评估模型性能时,建议进行多次测试并对结果进行平均。

新的设置推荐

除了上述已有的三点之外,这次DeepSeek官方在推文中引入了一个新的推荐——官方提示搜索和文件上传。

DeepSeek表示:

上传文件时,请按照模板创建提示,其中{file_name}, {file_content}和{question}是参数。file_template = “””[file name]: {file_name}[file content begin]{file_content}[file content end]{question}”””
对于Web搜索,{search_results}, {cur_data}和{question}是参数。
对于中文查询,使用提示词:

对于英文查询,使用提示词:

相应内容在DeepSeek官方GitHub的README文档中也有更新,感兴趣的小伙伴可以进一步了解下~

DeepSeek官方GitHub:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/README.md

参考链接:

[1]https://x.com/deepseek_ai/status/1890324295181824107

[2]https://www.reddit.com/r/LocalLLaMA/comments/1i9k284/why_should_one_avoid_adding_a_system_prompt_with/

金磊 发自 凹非寺量子位 | 公众号 QbitAI

本文由人人都是产品经理作者【量子位】,微信公众号:【量子位】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!
专题
49401人已学习16篇文章
看看别人家的PM是怎么做产品测试的。
专题
126099人已学习18篇文章
你说你会竞品分析,我信!但是肯定写的不好,不服看看别人的。
专题
15965人已学习12篇文章
运费是电商的基础功能模块之一,承担着商品运费计算的作用。本专题的文章分享了如何设计运费规则。
专题
20170人已学习13篇文章
本专题的文章分享了跨境支付的行业、发展、支付方式和商业等信息。
专题
15807人已学习13篇文章
说到“账号”,想必大家对于这个名词已经习以为常。现在市场上的大多数应用,都会有自己的账号体系。本专题的文章分享了如何搭建账号体系。
专题
17295人已学习16篇文章
为达成业务运营目标,合理使用数据工具指导运营决策的过程,就是数据化运营。本专题的文章分享了数据化运营指南。