"阴事东方力量" DeepSeek 给硅谷带来的影响,还在束缚泛起激荡——
刚刚,DeepSeek-R1 置身大模子竞技榜前三。
以开源、低廉 20 倍的"身价"与 ChatGPT-4o(2024.11.20)比肩。
在复杂提醒词 / 格调甘休榜单上,R1 位列第一。
现时遵守来看,它在各个维度上齐保抓起先。
在推断模子编程开导才气的 WebDev 分榜上,R1 位列第二,与闭源的 Claude 3.5 Sonnet 进出不到 40 分。
网友实测体验暗示,照实如斯,R1 在 30 场 battle 中只输了 4、5 次。
另一边,硅谷对 DeepSeek 的敬爱不减。
毕竟,它但是一个"副业"。
首创东谈主梁文峰的汉文华访更是被翻译成英文,"拿着放大镜"逐字发扬阅读。
他建议的不雅点也被记挂成箴言,在互联网崇高传。
确凿的差距不是 1 年或 2 年,而在于是原创照旧效法。
图灵奖得主 LeCun 也为 DeepSeek 作念出中肯评价:
它代表了开源的力量。
这意味着,开源模子正在杰出专有模子。
值得一提的是,同为开源领域代表的 Meta 刚刚公布了 2025 年在 AI 领域的布局议论:650 亿好意思元,投算力、投东谈主才。
有爆料称,Meta 里面一经因为 DeepSeek 感到躁急。
"他们让 OpenAI 一次又一次看清我方"
是以,在硅谷视角里,他们更温和 DeepSeek 的哪些信息?
最紧要的莫过于,DeepSeek 怎样赢利。
挖到的信息有点出其不备,大略 DeepSeek 还没念念赢利的事。
控股 DeepSeek 的是幻方量化,他们有一批顶级科学家,有充裕的算力资源,DeepSeek 其实是一个"副产品"。
在 2023 年末我就别传他们在作念 DeepSeek。即使在其时的中国,还莫得东谈主把他们当回事。
其次,为何 DeepSeek 能收效。梁文峰在 2023 年 5 月 2024 年 7 月接受暗涌的两次采访,也被老外扒出来了。
他们最温和的五个方面离别是:
1、创新第一性原则:与其他奋力于快速生意化的中国 AI 公司不同,DeepSeek 专注于基础的 AGI 推敲和创新。他们认为,中国必须从人人东谈主工智能发展的"搭便车者"转换为"孝敬者"。梁文峰说,创新不透澈是生意驱动的,还需要敬爱心和创造欲。
2、改革性架构:DeepSeek V2 中领受的新式 MLA(多头潜在把稳力机制)架构,把显存占用降到了往日最常用的 MHA 架构的 5%-13%,实现了老本大幅镌汰。它的推理老本仅为 Llama 370B 的 1/7、GPT-4 Turbo 的 1/70。
这并不是为了挑起一场价钱战——他们只是在"老本上略略有点利润"来订价。这种创新架构连续欺诈于 V3 和 R1 模子中。
3、私有的公司文化和东谈主才计谋:DeepSeek 保抓着一个透澈从下到上的组织结构,为推敲东谈主员提供无线的计较资源,优先看创造情愫而不是文凭。他们的冲破性创新来自年青的原土着才——中国脉土的应届毕业生和年青时刻东谈主才,而非国际招聘。
4、奋力于开源:尽管行业启动趋向于闭源模子(OpenAI 和 Mistral),DeepSeek 仍奋力于开源,并认为开源关于建立一个雄伟的时刻生态系统至关进击。梁文峰认为,在颠覆性时刻眼前,闭源酿成的护城河是一会儿的。
他们的确凿价值在于建立一个具备创新才气的组织。
5、底层计较挑战:尽管领有弥漫的资金和时刻,DeepSeek 也濒临来自底层计较的挑战和压力。现时公司还莫得新的融资议论。梁文峰认为,濒临的主要制约身分不是资金,而是高端算力的使用权,这些芯片关于考研先进 AI 模子至关进击。
除此以外,采访中的诸多细节也被网友发扬品尝。
原文中,梁文峰被问谈:奈何看待作念量化同期作念多数基础研发,不烧钱吗?
他回复:一件慷慨东谈主心的事,大略不成单纯花钱推断。就像家里买钢琴,一来买得起,二来是因为有一群急于在上头弹吹打曲的东谈主。
国际网友感触:
这帮东谈主是一群有点理念念化的"时刻狂",他们驯顺我方能搞出通用东谈主工智能(AGI),况兼他们照实有这个资源和天资。我确切太心爱他们了!
此外也幸免不了一些对比:
梁文峰展现出一种透澈不同的心态,他们的收效当之无愧,我也很期待看到他们一次又一次让" OpenAI "认清我方。
固然放眼 AI 领域的合座发展,能够看到 DeepSeek,关于通盘东谈主而言大略齐是茂盛的。
尽管我忍不住以为他们有点灵活,毕竟在生意化上他们有点"自断后路"。但看到一个团队坚抓理念念并获取收效,照实让东谈主以为很沸腾。
跟着 R1 的惊艳亮相,DeepSeek 正在完了我方所说的一切。拓宽时刻范围、坚抓开源、专注于时刻开导……
那么,DeepSeek 是怎样走到现时的呢?
用 AI 作念量化,再回到 AI
梁文峰本硕均就读于浙江大学信息与电子工程学专科。
2008 年,梁文峰毕业,启动领导团队使用机器学习等时刻探索全自动量化交游。
其时量化在国内照旧个崭新观念,能否赢利是个未知数。2010 年沪深 300 股指期货推出,量化投资迎来春天。据公开信息知道,梁文峰团队恰是乘上这推动风,很快自营资金跳跃 5 亿元。
与此同期,深度学习波浪的齿轮启动动掸,东谈主工智能率先在硅谷爆发。
2015 年,梁文峰与学友共同创立幻方量化。只是 1 年后,他们就推出了旗下等一个 AI 模子,第一份由深度学习生成的交游仓位上线执行,使用 GPU 进行计较。
2017 年,幻方量化声称实现投资策略全面 AI 化。
2018 年,幻方量化竖立 AI 为公司的主要发展标的。
AI 加抓下,幻方量化旗下基金请问率远超同期沪深 300 指数。2019 年,资金惩处鸿沟冲破百亿元。
2019 年,梁文锋在当年的金牛奖受奖典礼上,发表主题演讲《又名步地员眼里中国量化投资的畴昔》,这是他稀有的公开演讲。
演讲全文的确充满"步地员视角":
量化公司是莫得基金司理的,基金司理即是一堆作事器。东谈主来作念投资有蓄意的期间,它是一种艺术,要凭嗅觉。步地来有蓄意的期间,它是一种科学,它有最优解。
亦然这一年,幻方量化启动大鸿沟布局 AI 算力,搭建起"萤火一号"集群。2021 年,"萤火二号"落成。这么的算力基建,成为如今 DeepSeek 快速奔走的底层撑抓。
2021 年,幻方量化成为国内首家冲破千亿鸿沟的的量化私募大厂,被称为国内量化私募"四大天王"之一。
值得一提的是,在幻方量化的官网上,AI 基础科学推敲永恒占据进击位置,包括在大模子波浪前。
幻方量化曾暗示,多年以来,该公司坚抓把营收的大部分参预东谈主工智能领域,竖立起先的 AI 硬件基础要领,进行大鸿沟的推敲,探索东谈主类未知的高明。
咱们信托简直通盘的创新齐是从斗胆尝试和点滴累积中滋长而来。
2023 年,幻方量化将下场作念大模子的独处新组织定名为深度求索,并强调将专注于作念确凿东谈主类级别的东谈主工智能。
主义不是复刻 ChatGPT,而是推敲和揭秘 AGI 的更多未知信息。
DeepSeek 的故事也就启动于这一刻。
一个 80 后步地员在搅拌中国量化市集后,完成资金累积,组建起年青昌盛的团队,似乎又回到了他蓝本的开始、回到 AI,但产生的能量正在人人掀翻骇浪。
One More Thing
值得一提的是,幻方量化还历久向慈善机构捐赠,官网透露公司职工"一只无为的小猪"个东谈主捐助 1.38 亿元,支抓 15 家慈善机构的 23 个公益阵势,在宇宙范围内匡助罅隙群体,促进社会的公谢绝发展。
爆料讯息称,这个职工即是梁文峰本东谈主。
参考贯穿:
[ 1 ] https://www.reddit.com/r/LocalLLaMA/comments/1i6dlvj/inside_deepseeks_bold_mission_ceo_liang_wenfeng/
[ 2 ] https://www.threads.net/@yannlecun/post/DFNvN3euNEV?xmt=AQGzPcW8Rr7oXT6-rHIoKzBNL5x2PNnaprvJBL6uIhgoQA
[ 3 ] https://finance.eastmoney.com/a/202501223304127161.html
[ 4 ] https://mp.weixin.qq.com/s/r9zZaEgqAa_lml_fOEZmjgshibo体育游戏app平台