清华大学余梦珑AI团队：DeepSeek从入门到精通(20250204)（内附下载链接）-宝哥轻创业

DeepSeek：从入门到精通

@新媒沈阳团队：余梦珑博士后

清华大学新闻与传播学院

新媒体研究中心

元宇宙文化实验室

• Deepseek是什么？

• Deepseek能够做什么？

• 如何使用Deepseek？DeepSeek是什么？

AI+国产+免费+开源+强大

• DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。

• DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。Deepseek可以做什么？

直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，

支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。文本生成

表格、列表生成（如日程安排、菜谱）

代码注释、文档撰写

结构化生成

文章/故事/诗歌写作

营销文案、广告语生成

社交媒体内容（如推文、帖子）

剧本或对话设计

文本创作

长文本摘要（论文、报告）

文本简化（降低复杂度）

多语言翻译与本地化

摘要与改写

文本生成自然语言理解与分析

知识推理

逻辑问题解答（数学、常识推

理）

因果分析（事件关联性）

语义分析

语义解析

情感分析（评论、反馈）

意图识别（客服对话、用户查询）

实体提取（人名、地点、事件）

文本分类

主题标签生成（如新闻分类）

垃圾内容检测编程与代码相关

代码调试

• 错误分析与修复

建议

• 代码性能优化提

示

技术文档处理

• API文档生成

• 代码库解释与示

例生成

代码生成

• 根据需求生成代

码片段（Python、

JavaScript）

• 自动补全与注释

生成常规绘图如何使用DeepSeek？

https://chat.deepseek.com如何从入门到精通？

当人人都会用AI时，你如何用得更好更出彩？推理模型

• 例如：DeepSeek-R1，GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。

推理大模型：推理大模型是指能够在传统的大语言模型基础上，强化推理、逻辑分析和决策能力的模型。它

们通常具备额外的技术，比如强化学习、神经符号推理、元学习等，来增强其推理和问题解决能力。

非推理大模型：适用于大多数任务，非推理大模型一般侧重于语言生成、上下文理解和自然语言处理，而不强

调深度推理能力。此类模型通常通过对大量文本数据的训练，掌握语言规律并能够生成合适的内容，但缺乏像

推理模型那样复杂的推理和决策能力。

维度推理模型通用模型

优势领域数学推导、逻辑分析、代码生成、复杂问题拆解文本生成、创意写作、多轮对话、开放性问答

劣势领域发散性任务（如诗歌创作）需要严格逻辑链的任务（如数学证明）

性能本质专精于逻辑密度高的任务擅长多样性高的任务

强弱判断并非全面更强，仅在其训练目标领域显著优于通用模型通用场景更灵活，但专项任务需依赖提示语补偿能力

• 例如：GPT-3、GPT-4（OpenAI），BERT（Google），主要用于语言生成、语言理解、文本分类、翻译

等任务。快思慢想：效能兼顾全局视野

概率预测（快速反应模型，如ChatGPT 4o）链式推理(慢速思考模型，如OpenAI o1)

性能表现响应速度快，算力成本低慢速思考，算力成本高

运算原理

基于概率预测，通过大量数据训练来快速预测可能

的答案

基于链式思维（Chain-of-Thought），逐步推理

问题的每个步骤来得到答案

决策能力依赖预设算法和规则进行决策能够自主分析情况，实时做出决策

创造力限于模式识别和优化，缺乏真正的创新能力能够生成新的创意和解决方案，具备创新能力

人机互动能力按照预设脚本响应，较难理解人类情感和意图更自然地与人互动，理解复杂情感和意图

问题解决能力擅长解决结构化和定义明确的问题

能够处理多维度和非结构化问题，提供创造性的解

决方案

伦理问题作为受控工具，几乎没有伦理问题引发自主性和控制问题的伦理讨论

CoT链式思维的出现将大模型分为了两类：“概率预测（快速反应）”模型和“链式推理（慢速思考）”模型。

前者适合快速反馈，处理即时任务；后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合

适的模型，实现最佳效果。提示语策略差异

1 推理模型 2 通用模型

• 提示语更简洁，只需明确任务目标和

需求（因其已内化推理逻辑）。

• 无需逐步指导，模型自动生成结构化

推理过程（若强行拆解步骤，反而可

能限制其能力）。

• 需显式引导推理步骤（如通过CoT提

示），否则可能跳过关键逻辑。

• 依赖提示语补偿能力短板（如要求分

步思考、提供示例）。关键原则

202502121241460.pdf

模型选择

• 优先根据任务类型而非模型热度选择（如数学任务选推理模型，创意任务选通用

模型）。

提示语设计

• 推理模型：简洁指令，聚焦目标，信任其内化能力。（“要什么直接说”）。

• 通用模型：结构化、补偿性引导（“缺什么补什么”）。

避免误区

• 不要对推理模型使用“启发式”提示（如角色扮演），可能干扰其逻辑主线。

• 不要对通用模型“过度信任”（如直接询问复杂推理问题，需分步验证结果）。从“下达指令”到“表达需求”

策略类型定义与目标适用场景示例（推理模型适用）优势与风险

指令驱动

直接给出明确步骤或

格式要求

简单任务、需快速执行

“用Python编写快速排序函

数，输出需包含注释。

”

✅ 结果精准高效

❌ 限制模型自主优化空

间

需求导向

描述问题背景与目标，

由模型规划解决路径

复杂问题、需模型自主

推理

“我需要优化用户登录流程，

请分析当前瓶颈并提出3种方

案。

”

✅ 激发模型深层推理

❌ 需清晰定义需求边界

混合模式

结合需求描述与关键

约束条件

平衡灵活性与可控性

“设计一个杭州三日游计划，

要求包含西湖和灵隐寺，且

预算控制在2000元内。

”

✅ 兼顾目标与细节

❌ 需避免过度约束

启发式提问

通过提问引导模型主

动思考（如“为什

么”“如何”）

探索性问题、需模型解

释逻辑

“为什么选择梯度下降法解

决此优化问题？请对比其他

算法。

”

✅ 触发模型自解释能力

❌ 可能偏离核心目标