DeepSeek特点

更新时间：2026-08-02 09:23

10643

特点1: 大模型在训练时是将内容token化的，大模型所看到和理解的世界与你不一样

在理解模型行为之前，我们需要了解它是如何“学习”的。大型语言模型的预训练本质上是让模型建立文本片段之间的关联规律。为了实现这个目标，所有训练数据（包括书籍、网页、对话记录等）都会经过特殊处理：首先将文本切割成称为token的基本单元（类似文字的“碎片”），然后将这些token转化为数字编码。这个过程就像把现实世界的语言，翻译成只有模型能理解的“密码本”。

在推理模型出来之前，很多人非常喜欢用来考察大模型智商的一个问题是：Strawberry这个单词中有几个r字母？

此前像GPT-4、GPT-4o这类被认为很强大的大模型也没法把这个问题回答准确，这不是因为模型不够“聪明”，而是它在被训练时的特点导致了这一结果。

而所谓的token化就是大模型为了训练会将部分单词、中文字符进行拆分分解，比如在GPT3.5和GPT4的训练中，“词”这个字就被拆成了两个token，Strawberry则被拆成三个token，分别是“Str”“aw”“berry”。这种切割方式取决于训练时采用的tokenizer算法，也可能把生僻词拆解成无意义的片段。

举这个例子是想告诉你，大模型所看到的世界和你所看到的不一样。当你在数字母时看到的是连续的字符流，而模型看到的却是经过编码的token序列。所以，类似于数单词中的字母数量，或者精确要求大模型为你输出特定字数的内容都是有些强模型所难的，他的机制决定了他不擅长处理这些任务。

当然，现在推理模型理论上可以完成我例子中的任务，但是你看看他推理的过程……是不是觉得还是有些费劲，有些于心不忍。

特点2：大模型知识是存在截止时间的

虽然DeepSeek R1在2025年1月才正式发布，但其基础模型的训练数据窗口期早在数月前就已关闭。这就像出版一本百科全书——从资料收集到最终付印需要完整的生产周期。具体来说存在三重时间壁垒：

（1）预训练阶段需要处理PB级原始数据；

（2）数据清洗需要经历去重、脱敏、质量验证等工序；

（3）后期还要进行监督微调、强化学习、基于人类反馈的强化学习（RLHF）等迭代优化。

这种知识滞后性会带来一系列的问题和幻觉，比如DeepSeek R1目前还认为GPT-4是世界上最强的模型，GPT-4o、Claude 3.5 Sonnet等2024年后发布的模型它是不知道的；它也无法告诉你2024巴黎奥运会赛事结果，无法告诉你2025年春晚或春节档的电影表现。

这些都是模型训练的特点导致的，很多人拿类似任务去问R1，发现R1答非所问，轻易得出R1模型太差的结论。事实上这就像要求2020年出版的《辞海》必须记载2021年的新词——本质是知识载体的物理特性使然。

要突破这种知识限制，也有方法：

激活联网搜索功能：给R1提供自主搜索查找信息的权力；
补充必要知识：你可以通过上传文档、在提示词中提供充足的信息之后，再让R1去为你执行具有更近时效性的任务。

特点3：大模型缺乏自我认知/自我意识

DeepSeek R1或者任何模型其实都缺乏“我是谁”的概念，如果他自发有了，那可能说明AGI临近，我们可能反而该警惕了。

很多模型都不知道自己叫xx模型，这是很正常的现象，除非大模型厂商在部署的时候在系统提示词中做了设定，或者预训练完成后用了特定的语料进行微调。

以及，因为这种自我认知的缺乏会带来两个问题：

（1）AI有时候会给出错误的自我认知，比如deepseek以及很多别的模型都可能认为自己是ChatGPT，因为ChatGPT发布后，很多人将自己与ChatGPT的对话内容发布在了网上。所以你在问一个模型“你是谁”“who are you”的时候，模型偶尔的幻觉是很常见的现象。

（2）你没法让DeepSeek R1来告诉你它自己有什么样的特点，使用它有哪些技巧等等。这也是我依然需要依靠大量自己的脑力算力去写作这篇文章的原因。

特点4：记忆有限

多数大模型都有上下文长度的限制，deepseek R1目前提供的上下文只有64k token长度（官方API文档的说明，实际聊天对话的长度待确认），对应到中文字符大概是3万～4万字，这带来的问题是，你没法一次投喂太长的文档给他，以及你没法与他进行太多轮次的对话。

当你发送的文档长度超过3万字时，你可以理解为他是通过RAG，也就是检索增强的方式去选取你文档中的部分内容作为记忆的一部分来展开与你的对话的，而不是全部内容。而当你与他对话的轮次过多时，他很可能会遗忘你们最初聊天的内容。

这部分的限制在你开展让AI写代码的任务时会感受尤其明显。

特点5：输出长度有限

相比上下文对话的输入长度，大模型的输出长度则会更短得多，多数大模型会将输出长度控制在4k或者8k，也就是单次对话最多给你2千～4千中文字符。

所以，你没法复制一篇万字长文让DeepSeek一次性完成翻译，也不能让DeepSeek一次性帮你写一篇5000字以上的文章，这些都是模型输出长度限制导致，你需要理解这个问题的存在。

如果要解决这个问题的话，翻译类的任务你可以通过多次复制，或者自己写代码去调用API多次执行任务完成一篇长文甚至一本书的翻译。而长文写作类的任务，比较妥当的做法是先让R1梳理框架列出提纲目录，再根据目录一次次分别生成不同阶段的内容。

认识DeepSeek

第二章：DeepSeek功能介绍

最新热门报告作者标签

AI购物时代：服饰类目卖家如何适应美国消费者新需求

Tinuiti发布《2026年美国服装市场营销报告——GLP-1、通胀、AI和社媒的作用》。报告在2026年7月调查了1000名美国服饰消费者，分析了2026年服饰市场的发展趋势，以及消费者在经济环境变化、人工智能普及、社交媒体影响和生活方式转变下的购买行为变化。

亚马逊宠物品类Q2营收增长20%，品牌加码库存管理

2026年第二季度，宠物品类品牌收入同比增长20%，同时将因商品缺货导致的收入损失同比降低63%。

eBay完成收购Depop

eBay宣布已完成对时尚转售平台Depop的收购。此次交易完成之际，Depop在澳大利亚市场的网站流量持续增长，进一步提升了eBay在二手时尚和循环经济领域的布局。

亚马逊标题新规落地，卖家面临AI优化与广告调整等挑战

据亚马逊公布的信息，自2026年6月宣布更改产品标题格式以来，平台已有超过9.84亿个商品标题完成更新，同时，针对不符合新规则的商品Listing，AI生成的标题修改建议已于7月27日开始陆续上线。

UPS Q2营收达228亿美元，多个业务收入提升

UPS公布了截至2026年6月30日的2026财年第二季度业绩。受美国国内业务、国际业务及供应链解决方案业务收入增长推动，UPS实现营收同比增长，并扩大调整后营业利润率。同时，UPS上调2026全年业绩指引，预计全年综合营收约为912亿美元，调整后营业利润目标约为86.5亿美元。

8月2日欧盟AI透明度新规生效，相关卖家需做好合规准备

违反第50条合规要求的主体，将面临高额行政处罚。

追缴超10亿美元！美国严查进口贸易欺诈！货主、货代也会被追责！

美国清关“灰色操作”风险骤增

亚马逊AI识图动真格了！大批产品图被下架，只因为少了一个标签老虎站外说谈

亚马逊正在严查AI生成产品图，未嵌入元数据标签的图片直接拦截下架，大批卖家已中招。合规刻不容缓。

亚马逊标题新规落地，卖家面临AI优化与广告调整等挑战

亚马逊AI识图动真格了！大批产品图被下架，只因为少了一个标签老虎站外说谈

亚马逊正在严查AI生成产品图，未嵌入元数据标签的图片直接拦截下架，大批卖家已中招。合规刻不容缓。

8月2日欧盟AI透明度新规生效，相关卖家需做好合规准备

违反第50条合规要求的主体，将面临高额行政处罚。

亚马逊宠物品类Q2营收增长20%，品牌加码库存管理

2026年第二季度，宠物品类品牌收入同比增长20%，同时将因商品缺货导致的收入损失同比降低63%。

AI购物时代：服饰类目卖家如何适应美国消费者新需求

eBay完成收购Depop

UPS Q2营收达228亿美元，多个业务收入提升

追缴超10亿美元！美国严查进口贸易欺诈！货主、货代也会被追责！

美国清关“灰色操作”风险骤增

《亚马逊市场报告US-电竞椅》PDF下载

本报告对亚马逊美国市场下的电竞椅(Video Game Chairs)细分市场进行简要分析，从市场趋势、产品分析建议、消费者洞察等方面，希望为亚马逊跨境行业相关者提供有价值的信息。

《TikTok Shop 印尼站发展趋势报告》PDF下载

自2021年2月TikTok Shop在印尼上线以来，TikTokShop获得了亮眼的成绩，2022年，TikTok shop在印尼的GMV达到了25亿美元，贡献了整个东南亚市场GMV的57%。据研究公司Momentum Works测算，2023年，TikTok Shop在印尼的市场份额将从4.4%跃升至13.9%。

《2025美国市场年中夏季促销基准数据》PDF下载

品牌在亚马逊上的平均每日支出环比增长,品牌推广增加4.2%; 商品推广增加7.8%。品牌纷纷加大广告投入,在新进口关税情况下维持销量。

《2026年第2季度男装品类报告》PDF下载

印尼、马来西亚、菲律宾对价格更敏感，热销价位段集中在2-7美金越南、泰国能接受的价位段相对较广，热销价位段集中在2-9美金台湾站点客单价较高:热销价位段集巴西、新加坡、台中在4-12美金

《2026年第2-3季度鞋靴品类报告》PDF下载

鞋靴品类受换季影响较大，建议在季节性产品爆发前 2-3个月开始产品的上新预热，及销售高峰期前1个月备货至本地仓。

《TikTok Shop 家居类目报告（欧美站点）》PDF下载

23年9月TikTok Shop美国站正式上线，11月又迎来黑色星期五，各品类均出现强劲增长，24年初多数品类增速回落，市场进入调整期，但在下半年，市场出现明显反弹，反映出美国市场的巨大潜力;

《2025中国AI企业出海系列研究：阿联酋篇》PDF下载

本篇《2025中国企业出海阿联酋季度研究报告-AI专题》(以下简称报告)，希望帮助缩短相关从业者对阿联酋市场的心理距离，精准有效地为出海企业提供优质信息服务，助力企业走出去行稳致远。

《2026年上半年箱包品类选品参考》PDF下载

介绍各类箱包产品的市场趋势和用户偏好。