DeepSeek:从入门到精通
@新媒沈阳 团队 :余梦珑博士后
清华大学新闻与传播学院
新媒体研究中心
元宇宙文化实验室
• Deepseek是什么?
• Deepseek能够做什么?
• 如何使用Deepseek?DeepSeek是什么?
AI+国产+免费+开源+强大
• DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。
• DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。Deepseek可以做什么?
直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景,
支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。文本生成
表格、列表生成(如日程安排、菜谱)
代码注释、文档撰写
结构化生成
文章/故事/诗歌写作
营销文案、广告语生成
社交媒体内容(如推文、帖子)
剧本或对话设计
文本创作
长文本摘要(论文、报告)
文本简化(降低复杂度)
多语言翻译与本地化
摘要与改写
文本生成自然语言理解与分析
知识推理
知识推理
逻辑问题解答(数学、常识推
理)
因果分析(事件关联性)
语义分析
语义解析
情感分析(评论、反馈)
意图识别(客服对话、用户查询)
实体提取(人名、地点、事件)
文本分类
文本分类
主题标签生成(如新闻分类)
垃圾内容检测编程与代码相关
代码调试
• 错误分析与修复
建议
• 代码性能优化提
示
技术文档处理
• API文档生成
• 代码库解释与示
例生成
代码生成
• 根据需求生成代
码片段(Python、
JavaScript)
• 自动补全与注释
生成常规绘图如何使用DeepSeek?
https://chat.deepseek.com如何从入门到精通?
当人人都会用AI时,你如何用得更好更出彩?推理模型
• 例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。
推理大模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它
们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。
非推理大模型: 适用于大多数任务,非推理大模型一般侧重于语言生成、上下文理解和自然语言处理,而不强
调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像
推理模型那样复杂的推理和决策能力。
维度 推理模型 通用模型
优势领域 数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答
劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明)
性能本质 专精于逻辑密度高的任务 擅长多样性高的任务
强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力
• 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译
等任务。快思慢想:效能兼顾 全局视野
概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1)
性能表现 响应速度快,算力成本低 慢速思考,算力成本高
运算原理
基于概率预测,通过大量数据训练来快速预测可能
的答案
基于链式思维(Chain-of-Thought),逐步推理
问题的每个步骤来得到答案
决策能力 依赖预设算法和规则进行决策 能够自主分析情况,实时做出决策
创造力 限于模式识别和优化,缺乏真正的创新能力 能够生成新的创意和解决方案,具备创新能力
人机互动能力 按照预设脚本响应,较难理解人类情感和意图 更自然地与人互动,理解复杂情感和意图
问题解决能力 擅长解决结构化和定义明确的问题
能够处理多维度和非结构化问题,提供创造性的解
决方案
伦理问题 作为受控工具,几乎没有伦理问题 引发自主性和控制问题的伦理讨论
CoT链式思维的出现将大模型分为了两类:“概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。
前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合
适的模型,实现最佳效果。提示语策略差异
1 推理模型 2 通用模型
• 提示语更简洁,只需明确任务目标和
需求(因其已内化推理逻辑)。
• 无需逐步指导,模型自动生成结构化
推理过程(若强行拆解步骤,反而可
能限制其能力)。
• 需显式引导推理步骤(如通过CoT提
示),否则可能跳过关键逻辑。
• 依赖提示语补偿能力短板(如要求分
步思考、提供示例)。关键原则
模型选择
• 优先根据任务类型而非模型热度选择(如数学任务选推理模型,创意任务选通用
模型)。
提示语设计
• 推理模型:简洁指令,聚焦目标,信任其内化能力。(“要什么直接说”)。
• 通用模型:结构化、补偿性引导(“缺什么补什么”)。
避免误区
• 不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。
• 不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。从“下达指令”到“表达需求”
策略类型 定义与目标 适用场景 示例(推理模型适用) 优势与风险
指令驱动
直接给出明确步骤或
格式要求
简单任务、需快速执行
“用Python编写快速排序函
数,输出需包含注释。
”
✅ 结果精准高效
❌ 限制模型自主优化空
间
需求导向
描述问题背景与目标,
由模型规划解决路径
复杂问题、需模型自主
推理
“我需要优化用户登录流程,
请分析当前瓶颈并提出3种方
案。
”
✅ 激发模型深层推理
❌ 需清晰定义需求边界
混合模式
结合需求描述与关键
约束条件
平衡灵活性与可控性
“设计一个杭州三日游计划,
要求包含西湖和灵隐寺,且
预算控制在2000元内。
”
✅ 兼顾目标与细节
❌ 需避免过度约束
启发式提问
通过提问引导模型主
动思考(如“为什
么”“如何”)
探索性问题、需模型解
释逻辑
“为什么选择梯度下降法解
决此优化问题?请对比其他
算法。
”
✅ 触发模型自解释能力
❌ 可能偏离核心目标