DSNB · 引语

理解 DeepSeek 立场的 8 句话

这家公司的姿态可以压缩在几句话里——几乎都来自梁文锋，加上一句让其他话有上下文的行业回应。下面每条都钉到了它真实被说出的场合、为什么落地、以及对应到时间线哪一段。我们不复述，只引用。如果你记得的某条引语没在此处，是因为我们还没能追溯到可被核验的出处。

“既有能力的自然延伸。”
幻方量化内部信 · AGI 研究实验室成立公告
2023 年 4 月 14 日
上下文
管理千亿资金的对冲基金幻方量化，对外正式将触角伸向通用人工智能时在内部信里的表述。措辞的平淡本身就是重点——没有目标宣言、没有融资新闻、没有戏剧性。
相关事件:一纸公告，全面滑入AGI深水区出处:China Academy
“我们没有商业压力，没有 KPI。”
梁文锋 · DeepSeek 创始人
2023 年 7 月 17 日
上下文
拆分独立时的运营原则。几乎所有 AI 初创都在追逐 VC 背书和下一轮估值时，这句话背后站着八年量化积累提供的资本缓冲——是结构选择，不是傲慢。
相关事件:没有风投，没有KPI，独立开局出处:Jiexu Substack
“开源发论文并不会失去什么，对技术人来说，被人跟随本身就是成就感。”
梁文锋 · DeepSeek 创始人
2024 年 7 月
上下文
2024 年 7 月 36 氪深度访谈里的话。DeepSeek 与海外前沿实验室立场分野最清晰的一句——也是支撑「每一代旗舰模型都按开源协议发布」这一文化前提的根。
相关事件:「中国不能永远做追随者」出处:Jiexu Substack
“中国不能永远做追随者。”
梁文锋 · DeepSeek 创始人
2024 年 7 月
上下文
36 氪访谈里那一句，被 ChinaTalk 和 Jiexu 翻成英文后，作为 “Done Following” 框架在西方科技圈传开。Marc Andreessen 和后续多数英文报道引用的都是这一版译法。
相关事件:「中国不能永远做追随者」出处:China Academy
“更多投入不一定产生更多创新，否则大公司早就垄断所有创新了。”
梁文锋 · DeepSeek 创始人
2024 年 7 月
上下文
六个月后这句话变得经济意义重大——V3 用 557 万美元训出比 GPT-4o 更强的模型。这是一句事先的理论陈述，被随后的工程结果确认。
相关事件:「中国不能永远做追随者」出处:Jiexu Substack
“效率的奇迹——不是算力最多的人赢，而是把算力用到极致的人赢。”
开源社区 · 对 V3 技术报告的共识表述
2024 年 12 月
上下文
arXiv:2412.19437 把每一个工程选择都摊开——FP8 混合精度、Multi-Token Prediction、对抗数值不稳定的反复实验——之后开源社区如此形容 V3。这句话在 Nvidia 单日蒸发 6000 亿美元之前一个月，就已经把「堆算力赢」的叙事翻了过来。
相关事件:557万美元撬动GPT-4o级性能出处:arXiv:2412.19437
“我见过的最令人叹服的突破之一，作为开源，是给世界的礼物。”
Marc Andreessen · a16z 联合创始人
2025 年 1 月 27 日
上下文
2025 年 1 月 27 日发出——DeepSeek App 在美区 App Store 免费榜超越 ChatGPT 登顶，同日 Nvidia 蒸发约 6000 亿美元市值（美股单公司单日最大跌幅）。这句话被广泛转述为硅谷第一次公开向结果低头。
相关事件:App登顶美区，Nvidia单日蒸发$600亿出处:Fortune
“这是我们走向 Agent 时代的第一步。”
梁文锋 · DeepSeek 创始人
2025 年 8 月 21 日
上下文
2025 年 8 月 21 日 V3.1 发布时的表述——单一模型同时支持 thinking 和 non-thinking 两种模式，原生集成工具调用。架构意义：推理与行动之间的切换成本被压进了模型本身，无需在多个端点间路由。
相关事件:Hybrid Thinking：向Agent时代踏出第一步出处:DeepSeek (HuggingFace)