AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123


特点1: 大模型在训练时是将内容token化的,大模型所看到和理解的世界与你不一样

在理解模型行为之前,我们需要了解它是如何“学习”的。大型语言模型的预训练本质上是让模型建立文本片段之间的关联规律。为了实现这个目标,所有训练数据(包括书籍、网页、对话记录等)都会经过特殊处理:首先将文本切割成称为token的基本单元(类似文字的“碎片”),然后将这些token转化为数字编码。这个过程就像把现实世界的语言,翻译成只有模型能理解的“密码本”。

图片

在推理模型出来之前,很多人非常喜欢用来考察大模型智商的一个问题是:Strawberry这个单词中有几个r字母?

此前像GPT-4、GPT-4o这类被认为很强大的大模型也没法把这个问题回答准确,这不是因为模型不够“聪明”,而是它在被训练时的特点导致了这一结果。

图片

而所谓的token化就是大模型为了训练会将部分单词、中文字符进行拆分分解,比如在GPT3.5和GPT4的训练中,“词”这个字就被拆成了两个token,Strawberry则被拆成三个token,分别是“Str”“aw”“berry”。这种切割方式取决于训练时采用的tokenizer算法,也可能把生僻词拆解成无意义的片段。

图片

举这个例子是想告诉你,大模型所看到的世界和你所看到的不一样。当你在数字母时看到的是连续的字符流,而模型看到的却是经过编码的token序列。所以,类似于数单词中的字母数量,或者精确要求大模型为你输出特定字数的内容都是有些强模型所难的,他的机制决定了他不擅长处理这些任务。

当然,现在推理模型理论上可以完成我例子中的任务,但是你看看他推理的过程……是不是觉得还是有些费劲,有些于心不忍。

图片

特点2:大模型知识是存在截止时间的

虽然DeepSeek R1在2025年1月才正式发布,但其基础模型的训练数据窗口期早在数月前就已关闭。这就像出版一本百科全书——从资料收集到最终付印需要完整的生产周期。具体来说存在三重时间壁垒:

(1)预训练阶段需要处理PB级原始数据;

(2)数据清洗需要经历去重、脱敏、质量验证等工序;

(3)后期还要进行监督微调、强化学习、基于人类反馈的强化学习(RLHF)等迭代优化。

图片

这种知识滞后性会带来一系列的问题和幻觉,比如DeepSeek R1目前还认为GPT-4是世界上最强的模型,GPT-4o、Claude 3.5 Sonnet等2024年后发布的模型它是不知道的;它也无法告诉你2024巴黎奥运会赛事结果,无法告诉你2025年春晚或春节档的电影表现。

这些都是模型训练的特点导致的,很多人拿类似任务去问R1,发现R1答非所问,轻易得出R1模型太差的结论。事实上这就像要求2020年出版的《辞海》必须记载2021年的新词——本质是知识载体的物理特性使然。

要突破这种知识限制,也有方法:

  1. 激活联网搜索功能:给R1提供自主搜索查找信息的权力;

  2. 补充必要知识:你可以通过上传文档、在提示词中提供充足的信息之后,再让R1去为你执行具有更近时效性的任务。

特点3:大模型缺乏自我认知/自我意识

DeepSeek R1或者任何模型其实都缺乏“我是谁”的概念,如果他自发有了,那可能说明AGI临近,我们可能反而该警惕了。

很多模型都不知道自己叫xx模型,这是很正常的现象,除非大模型厂商在部署的时候在系统提示词中做了设定,或者预训练完成后用了特定的语料进行微调。

图片

以及,因为这种自我认知的缺乏会带来两个问题: 

(1)AI有时候会给出错误的自我认知,比如deepseek以及很多别的模型都可能认为自己是ChatGPT,因为ChatGPT发布后,很多人将自己与ChatGPT的对话内容发布在了网上。所以你在问一个模型“你是谁”“who are you”的时候,模型偶尔的幻觉是很常见的现象。

(2)你没法让DeepSeek R1来告诉你它自己有什么样的特点,使用它有哪些技巧等等。这也是我依然需要依靠大量自己的脑力算力去写作这篇文章的原因。

特点4:记忆有限

多数大模型都有上下文长度的限制,deepseek R1目前提供的上下文只有64k token长度(官方API文档的说明,实际聊天对话的长度待确认),对应到中文字符大概是3万~4万字,这带来的问题是,你没法一次投喂太长的文档给他,以及你没法与他进行太多轮次的对话。

当你发送的文档长度超过3万字时,你可以理解为他是通过RAG,也就是检索增强的方式去选取你文档中的部分内容作为记忆的一部分来展开与你的对话的,而不是全部内容。而当你与他对话的轮次过多时,他很可能会遗忘你们最初聊天的内容。

这部分的限制在你开展让AI写代码的任务时会感受尤其明显。

特点5:输出长度有限

相比上下文对话的输入长度,大模型的输出长度则会更短得多,多数大模型会将输出长度控制在4k或者8k,也就是单次对话最多给你2千~4千中文字符。

所以,你没法复制一篇万字长文让DeepSeek一次性完成翻译,也不能让DeepSeek一次性帮你写一篇5000字以上的文章,这些都是模型输出长度限制导致,你需要理解这个问题的存在。

如果要解决这个问题的话,翻译类的任务你可以通过多次复制,或者自己写代码去调用API多次执行任务完成一篇长文甚至一本书的翻译。而长文写作类的任务,比较妥当的做法是先让R1梳理框架列出提纲目录,再根据目录一次次分别生成不同阶段的内容。



最新报告作者标签
Allegro推出卖家AI运营助手
波兰电商平台Allegro面向推出全新AI助手,该助手基于卖家账户的实时数据运行,可帮助卖家分析账户表现、优化销售策略,并解答与平台规则相关的问题。
《2026年印度网购趋势报告》
贝恩公司发布了《2026年印度网上购物趋势报告》。报告从宏观消费环境、电商市场规模、用户变化等方面进行系统分析,围绕2026年印度电商市场的发展现状与未来趋势进行分析和讨论。
受中东冲突影响,巴拿马运河拥堵加剧、通行费高达400万美元
受中东局势影响,霍尔木兹海峡关闭导致货物航行路线调整,巴拿马运河拥堵加剧,等待时间和通行拍卖价格均在4月显著上升。
Stripe发布288项更新,布局AI代理支付体系
Stripe推出288项新产品与功能,围绕AI支付、企业服务、防欺诈以及AI代理购物等多个方向。这一系列更新被认为是Stripe迄今最大规模的产品发布。
One Pay与Tempo合作,推进稳定币支付体系升级
沃尔玛持股的金融科技公司OnePay与Tempo达成合作,双方将围绕稳定币支付与账户资金流转展开下一代支付体系建设。
TRO资讯|塑身内衣第18次发起维权,速查!
美国伊利诺伊州北区联邦法院已立案全新跨境专利侵权批量诉讼,案号 1:26-cv-04877。原告为香港塑身品类维权大户 HEXIN HOLDING LIMITED,手握数十项塑身产品美国专利与版权,已同步提交卖家最怕的 TRO 账户冻结禁令,随时可能下发。该原告 2024 年至今已发起18次维权,累计起诉数千跨境卖家,累计冻结金额已上万美金,合作的 YK Law LLP 律所深谙 TRO 全流程,不少卖家未收到起诉就已被冻结货款。
60秒合规自测,避开95%的侵权坑
大家是否认为侵权离自己很远?很多跨境卖家是在商品爆单后,才第一次收到起诉通知。问题不在“有没有做错”,而在于
全年营收87亿元,致欧科技发布2025年财报
2025年致欧全年营收87.01亿元,同比增长7.1%。
《中国软件企业在欧洲市场的数据主权与安全合规指南》PDF下载
本白皮书将精准聚焦中国软件企业的出海痛点:从SaaS服务的多租户数据隔离,到DevOps流程中的跨境数据风险,再到软件供应链的安全责任
《日本机会品类调查》PDF下载
本报告中的收纳类别范围是指收纳箱/盒、衣柜/衣橱、衣帽架、彩色收纳盒/书架、开放柜/置物架、钢架和洗衣收纳产品,主要用于日本消费者的客厅、卧室、壁柜和浴室。
《12月刊高潜力品类行业洞察报告》PDF下载
12月,正值圣诞节及年终购物季,消费者对大家电和相机等大件及礼品类需求显著提升,对美容个护、宠物等刚需品类需求稳健。
《2026中国具身智能企业出海全景报告》PDF下载
具身智能就是有物理载体的智能体,可利用感知、决策和交互能力执行现实世界任务并主动学习进化。简单来说,具身智能就是具有实物“身体”的人工智能(AI),即具身智能=会思考的大脑+能感知和行动的物理身体。
AMZ123《全球电商市场报告——澳大利亚篇》
在全球电商讨论中,澳大利亚市场虽然不常被提及,但凭借其稳定的增长势头,逐渐展现出独特的价值。预计2025年澳大利亚电商规模将达到393.6亿美元,2030年将突破465.1亿美元,展现出可预期的稳步增长。
AMZ123《全球电商市场报告——日本篇》
本报告从市场环境、用户画像与营销策略等多个维度,聚焦这一市场进行系统性解读,为跨境卖家精准切入日本市场,把握增量机遇提供深度参考。
《中国医疗器械全球化新征程》PDF下载
在带量采购常态化、支付方式改革深化及行业竞争加剧的背景下,中国医疗器械产业正处于由“内循环”迈向“全球化”的关键拐点。国内市场的利润挤压与结构性竞争,正在推动企业加速国际化布局。与此同时,政策鼓励科技创新与出海发展,叠加创新药出海的示范效应,为医疗器械企业打开了通往海外的新增长空间。
《智能插座美国市场年度研报》PDF下载
中国卖家供给主导,但品牌突破面临挑战。中国卖家在商品数量上已占据半壁江山,且在整体销售额增长中展现出韧性,是市场供给的绝对主力。新品牌中超半数来自中国,显示其持续的创新活力。然而,新品牌整体销售额贡献微弱,中国力量“大而不强”,多数品牌仍集中于竞争激烈的中端红海市场,向高端突破或建立品牌溢价的能力有待验证。
跨境平台资讯
AMZ123旗下跨境电商平台新闻栏目,专注全球跨境电商平台热点事件,为广大卖家提供跨境电商平台最新动态、最热新闻。
跨境科普达人
科普各种跨境小知识,科普那些你不知道的事...
亚马逊资讯
AMZ123旗下亚马逊资讯发布平台,专注亚马逊全球热点事件,为广大卖家提供亚马逊最新动态、最热新闻。
AMZ123卖家导航
这个人很懒,还没有自我介绍
AMZ123选品观察员
选品推荐及选品技巧分享。
AMZ123会员
「AMZ123会员」为出海者推出的一站式私享服务
跨境电商干货集结
跨境电商干货集结,是结合亚马逊跨境电商卖家交流群内大家在交流过程中最常遇到的问题,进行收集整理,汇总解答,将会持续更新大家当前最常遇见的问题。欢迎大家加入跨境电商干货集结卖家交流群一起探讨。
欧洲电商资讯
AMZ123旗下欧洲跨境电商新闻栏目,专注欧洲跨境电商热点资讯,为广大卖家提供欧洲跨境电商最新动态、最热新闻。
目录
大纲
大纲
咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部