這篇帶大家快速認識 DeepSeek(深度求索)。2025 年初,它的 App 突然衝上美國 App Store 免費榜第一、超越 ChatGPT,整個矽谷開始重新計算「訓練一個前沿模型到底要花多少錢」,但這家公司到底是誰開的、靠什麼活著,多數人講不太清楚。
DeepSeek 2023 年在杭州成立,背後是一家量化基金幻方科技(High-Flyer),創辦人梁文鋒同時是兩邊的老闆。它最為人知的招牌,是用更少的算力做到對標前沿的效果,再把模型權重以 MIT 等開源授權公開釋出。
它和多數對手最大的差別,在於「便宜又開放」。當 OpenAI、Anthropic 走閉源、高價路線時,DeepSeek 把模型權重公開、API 價格壓到同級最低,「最便宜的可用前沿模型」這個定位,本身就成了護城河。
一句話記住它:用量化基金的錢和工程效率,把前沿 AI 做成開源又便宜的那家中國公司。
它也有幾個還沒有定論的問號:最受關注的外部變數是高階晶片的取得,梁文鋒本人就曾表示,真正的限制不在資金,而在先進晶片的禁運;此外,首輪融資估值仍在洽談、財務沒有審計揭露,海外也有資料與出口管制方面的爭議。看 DeepSeek 時,這些脈絡值得一起放進來。
核心數據快照
先把關鍵數字放一起。DeepSeek 未上市、沒有公開完整財報,下面不少數字是公司對外口徑或媒體報導,這裡盡量分清楚哪些是官方確認、哪些是外界推估。
| 項目 | 資料 |
|---|---|
| 成立年份 | 2023 年 |
| 總部 | 中國杭州 |
| 創辦人 / CEO | 梁文鋒(Liang Wenfeng) |
| 背後 / 母公司 | 源自量化基金幻方科技(High-Flyer),同一創辦人;為早期算力與資金來源 |
| 公司性質 | 未上市;由量化基金旗下 AGI 研究組獨立而來的 AI 研究+商業 API 平台 |
| 主力產品 | 推理模型(R 系列)、通用模型(V 系列);免費 App/Web、開放權重、低價 API |
| 最新估值 | 報導稱首輪融資估值約 200-500 億美元(尚未確認成交,多家媒體口徑不一) |
| 開源授權 | R1、V3 系列多採 MIT 開源;V4 系列官方稱開源(完整授權條款待確認) |
| 主要算力 | Nvidia H800(早期訓練主力)、H20;同時推進華為昇騰、AMD 等替代路徑 |
| 正面對手 | 全球:OpenAI、Anthropic、Google、Meta;中國:通義千問、豆包、Kimi、GLM 等 |
兩個讀數字的提醒,看任何中國 AI 新創都用得上。 ① DeepSeek 公布過「理論利潤率」這類數字(例如把全天用量都按定價計費推算),那是理論估算、不是財報實際毛利,看到要先問「這是假設還是入帳」;② 私人公司沒有審計財報,估值與營收多是報導或推估,抓「量級和趨勢」比抓精確值實在。
七個面向快速導覽
認識一家 AI 公司,可以從七個面向切入。後面小企鵝會把重點面向再拆成單篇。
① 技術與產品路線:產品分兩條線,推理模型(2025 年初一戰成名的 R 系列)與通用模型(V 系列),近期往更長的上下文與 agent 工具使用發展。它真正的招牌是工程效率,大量採用 MoE(混合專家)稀疏架構,讓模型每次只啟用一小部分參數,加上一系列訓練最佳化,能用相對少的算力做到對標前沿。模型權重多以 MIT 等開源授權公開(最新一代官方稱開源,完整條款待確認)。
② 客戶與市場定位:一端是免費 App 打全球消費者心智(2025 年初登上美國 App Store 免費榜第一),一端是超低價 API 與開放權重吃開發者與企業。它的競爭定位很清楚,「最便宜的可用前沿模型」。正面對手在全球是 OpenAI、Anthropic、Google、Meta,在中國則是通義千問、豆包、Kimi、GLM 等一票本土模型。
③ 生態系與合作策略:DeepSeek 不靠通路堆疊,靠「開放權重+推理框架全面適配」讓生態自己長,模型上架 HuggingFace、GitHub 等平台,主流推理框架與 AMD、華為昇騰等硬體都有人做適配。它早期的資金與算力幾乎只有一個來源:母公司幻方,用量化交易的收益換成 GPU 叢集再投入研究。
④ 估值與財務模型:截至 2026 年 5 月,它正洽談首輪外部融資,媒體報導的估值區間約落在 200 億到 500 億美元、但尚未確認成交,且不同媒體口徑差異不小。創辦人梁文鋒在公司握有主導地位。另一個常被引用的數字是「545% 理論利潤率」,它把全天用量都按定價計費推算,屬理論值、而非實際營收或毛利;公司未上市、沒有審計財報,實際財務狀況仍待揭露。
⑤ 商業化風險與監管:在中國境內,DeepSeek 已完成生成式 AI 服務的備案,是少數可直接查核的合規節點。海外則有爭議:義大利資料保護機關曾在 2025 年初阻擋它存取義國用戶資料,韓國個資機關也提出資料跨境的疑慮(依媒體報導)。長期維持的大幅促銷定價,也讓人關注它的推理成本與毛利能不能撐住。
⑥ 地緣政治與供應鏈:高階晶片的取得,是 DeepSeek 最受關注的外部變數。早期訓練主力是 Nvidia 在出口管制後推出的降規版 H800,如今正推進華為昇騰、AMD 等國產與替代路徑(技術上已有適配,商業規模仍待觀察)。供應鏈上也有一則具爭議的指控:曾有單一匿名美國官員指 DeepSeek 涉及軍方並規避出口管制,但 Nvidia 否認、稱其使用合法取得的 H800,相關報導也未能獨立核實,屬未經獨立查證、且被供應商否認的單源說法,兩面並陳。整條硬體鏈怎麼運作,可以看 AI 硬體供應鏈一條龍。
⑦ 領導層與治理:創辦人梁文鋒同時主導量化基金幻方與 DeepSeek,決策高度集中是這家公司的特色,也是風險。公司由幻方的 AGI 研究組衍生而來,尚未見獨立董事會等治理結構的公開確認。人才動向值得長期盯,已有核心研究員離職、轉往其他中國科技公司的 AI 團隊。
重要里程碑
把 DeepSeek 走到今天的關鍵節點挑出來看:
| 時間 | 里程碑 |
|---|---|
| 2021 | 母公司幻方完成約一萬張 A100 GPU 叢集,奠定算力底氣 |
| 2023 | 梁文鋒創立 DeepSeek,自幻方的 AGI 研究組獨立 |
| 2024-04 | DeepSeek 完成中國生成式 AI 服務備案(可查核的合規節點) |
| 2024-12 | 發布 V3(低成本訓練的成名作) |
| 2025-01 | 發布推理模型 R1(採開源授權);App 登上美國 App Store 免費榜第一 |
| 2025-01 | 義大利資料保護機關阻擋其存取用戶資料(首個海外監管事件) |
| 2025 下半 | R1、V3 持續迭代,能力與 agent/工具使用強化 |
| 2026-04 | 發布 V4 系列(V4-Pro/V4-Flash,支援百萬等級長上下文) |
| 2026-05 | 首輪外部融資洽談曝光(報導估值最高約 500 億美元,未成交) |
里程碑會持續補充,數字以最新公告為準(本表最後整理:2026 年 5 月)。
延伸閱讀與接下來的單篇
接下來如果想讀更深入的,小企鵝會把重點面向拆成單篇,陸續產出:
- 出口管制下,DeepSeek 的算力怎麼補?
- DeepSeek 估值怎麼算出來的?為什麼便宜還能活
- 從備案到義大利爭議:DeepSeek 的監管全景
- 梁文鋒與幻方:量化基金怎麼長出一家全球矚目的 AI 公司
- 想學 DeepSeek 怎麼用、免費怎麼上手?教學文小企鵝另外寫(上線後補上連結)
- 比較一下打法不同的對手:OpenAI 與 Anthropic
- 想看整條硬體鏈:AI 硬體供應鏈一條龍