用户名:
密 码:
忘记密码?
繁体中文  
 
版主:黑木崖
 · 九阳全新免清洗型豆浆机 全美最低
 
DeepSeek,黑天鹅降临硅谷 zt
送交者:  2025年01月27日22:32:38 于 [世界军事论坛] 发送悄悄话

teafox:DeepSeek,黑天鹅降临硅谷

这是一个信息爆炸的时代,也是一个信息严重污染的时代。所以,我对任何信息都不会轻信,尤其是面对重大利好,更加「存疑」。对我来说,排除信息污染的最好办法,就是交叉对比,正反面都看。

过去48小时内,我几乎都泡在X上,浏览各种关于Deep Seek的消息,在英语世界,基本上是压倒性正面评价,这时候,我就特别想看看负面的评论,找了一圈,的确有。

主要分为两类:

一类,为了反而反,尤其是一些海外的反中人士,任何关于中国的新闻,他们都会给出负面的评价,这类信息简直就是垃圾。但看看也好,至少可以知道垃圾是什么样子。

500

另一类,是业内人士的负面评价,其中第一个,也是最鹰派的声音,居然来自一个华裔业内人士——Alexandr Wang。

首先,此人的名字有点奇怪,第一次看到,我以为是CNBC拼错了,一般情况下,Alexander是英语中最常见的拼写形式,也是国际通用的版本。而Alexandr,则是某些东欧语言(如俄语、捷克语等)的拼写形式。一个美国华裔,居然用东欧的名字,有点蹊跷。但我定睛一看,确实是Alexandr。

其次,这位王先生,不仅名字奇怪,更有着与众不同的背景。他出生于1997年,是Scale AI的创始人兼CEO。24岁时,Alexandr Wang成为了世界上最年轻的「白手起家」的亿万富翁。根据福布斯的说法,截至2024年7月,他的身价为20亿美元。

他是中国移民的儿子,父母都在洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)担任物理学家,核武器就诞生在这个实验室。中国人能在这种单位工作,非常罕见。

Alexandr 从小就对数学和计算机编程充满热情。他在2013年获得了美国队的数学奥林匹克资格。在十几岁时,他就在美版知乎Quora担任软件程序员。随后,他在麻省理工学院学习计算机科学,但中途退学,创办了Scale AI,成了硅谷的AI神童。

Alexandr说:Deep Seek至少有5万张英伟达H100显卡,只不过因为制裁的原因,不方便说而已。事后,我看了好几遍CNBC电视台的采访,他的原话是as my understanding,也就是「按照我的理解」,而没有任何实锤的证据。

根据Deep Seek的说法,训练模型只用了2048张H800显卡,也就是H100的阉割版,价格也只有H100(3万美刀)的三分之一。正因为用了低配的硬件,才体现了Deep Seek的创新价值。

500

而Alexandr Wang暗示了,Deep Seek只不过也是大力出奇迹而已,根本没有什么创新。

那么5万张H100显卡意味着什么呢?

今年,马斯克用全球最大AI超算Colossus轰动了整个世界,这台超算也只配备了10万张英伟达H100显卡。

即便Alexandr Wang说的是真话,5万张英伟达H100显卡,总价就至少15亿美元。折合一百多亿人民币。一个小小的幻方公司,能拿出这么多钱吗?就算有,H100美国禁运,中国大陆根本没货,也很难买到。

再退一步讲,就算Deep Seek能拿出这么多钱,买5万张英伟达H100显卡,他的成本就和Open AI不相上下了,但Deep Seek是开源免费的,而Open AI要200美元一个月。

因为Deep Seek,我也是人生第一次,学会了用API。我用中国手机开了一个账户,就送10元人民币,我用Deep Seek API翻译文本,百万输入 tokens才2元,用了一个晚上,才花了0.11元。这已经不能算白菜价了,几乎就是免费!从售价倒推成本,Deep Seek也不可能拥有5万张H100显卡。

总之,无论从哪个角度看,Alexandr Wang的论点都站不住脚,但他的说法,依然有价值。

一方面,证明了Deep Seek的技术真的牛叉,已经牛到要用5万张H100显卡才能训练。

另一方面,说明Deep Seek的影响力太大,以至于Alexandr Wang有点慌了,口不择言。

500

那么,为啥Alexandr Wang要慌呢?

我不是什么AI专家,但根据我这几天索阅读的大量信息理解,Deep Seek可能是一只巨型的黑天鹅,她正在硅谷的上空游荡。

1/ 目前,训练顶级AI大模型的成本极其高昂。OpenAI等巨头,需要拥有数万个H100显卡的大型数据中心。每块最低3万美元,总价就要十几亿美元,而且耗电量惊人,需要一整座发电厂提供电力。他们仅在训练模型上,就要花费数亿美元。

2/ Deep Seek突然出现并说:「哈哈,如果我们花 500 万美元做这件事会怎么样?」他们不只是说说而已,而是真的做到了。Deep Seek的模型在许多任务上,甚至击败了 GPT-4 和 Claude。硅谷的人工智能世界,瞬间就懵了,AI天才Alexandr Wang语无伦次了。

3/ DeepSeek怎么做到的?他们从头开始重新思考一切。传统AI就像是把每个数字都写成 32 位小数。而DeepSeek 说:「如果我们只使用8位小数呢?」结果,它仍然足够准确!瞬间,所需内存就减少了75%。

4/ 然后是他们的「多标记」系统。普通人工智能的阅读方式就像一年级学生一样:「鹅......鹅......鹅......曲......项......向......天......歌」,逐字阅读。但DeepSeek一次读完整段话。速度快2倍,准确率高90%,当你处理数十亿个单词时,这一点很重要。

5/ 但真正聪明的是:他们建立了一个「专家系统」,而没有使用一个试图了解一切的大型人工智能(比如让一个人同时成为医生、律师、工程师、木匠),只在需要时才激活特定专家,节省了大量参数。

6/ 而传统模型呢?所有1.8万亿参数始终处于活动状态。与此同时,DeepSeek总共6710亿个参数,一次只激活370亿。这就像拥有一支庞大的团队,但只召集每个任务真正需要的专家。

7/ 结果令人震惊,训练成本:数亿美元 → 500万美元;所需GPU:100000 → 2000 ; API 成本:便宜 95%;可以在普通游戏显卡上运行,而不是数据中心硬件。

8/ 最疯狂的部分——DeepSeek是开源的(完全免费)。任何人都可以使用,代码是公开的。技术论文解释了一切,这不是魔术,只是令人难以置信的巧妙工程。现在x最流行的一个梗,Open AI → Closed AI(闭源AI),取而代之的是DeepSeek,才是真正的Open AI (开源AI)。

9/ 为什么DeepSeek很重要?因为它打破了「只有大型科技公司才能涉足人工智能」的神话。你不再需要价值数十亿美元的数据中心,几个好的游戏显卡,就可以做到这一点。

10/ 对英伟达来说,这很可怕。他们的整个商业模式都建立在利润率高达90%的昂贵显卡的基础上,比如售价高达三四万美元的H100,奇货可居,有钱都买不到。如果每个人都能突然用普通的游戏显卡做AI……那么,你就知道问题所在了。

11/ 关键在于:DeepSeek 的团队不到200人,但Meta的团队仅薪酬就超过了DeepSeek 的整个训练预算……而Meta的模型却不如DeepSeek。

12/ 这是一个经典的颠覆故事:既有者优化现有流程,而颠覆者重新思考根本方法。

13/ DeepSeek就像一次地震,余震太大:人工智能开发变得更加容易,竞争加剧,大型科技公司的「护城河」看起来更像水沟,硬件要求(和成本)大幅下降

14/ 当然,OpenAI 等巨头不会坐以待毙。但一切都要颠覆,再也不是大力出奇迹的模式了。

DeepSeek这只黑天鹅,煽动翅膀,整个硅谷都会被波及,效应可以总结为以下几点。

AI初创企业危机:Deep Seek的高性能可能导致大量购买英伟达显卡的AI初创企业破产,释放大量二手GPU。对Scale AI的CEO兼创始人Alexandr Wang来说,这是攸关生死的存亡之争,口出恶言,也可以理解。

数据中心业务受挫:大型数据中心运营商,其租用英伟达显卡的商业模式将受到冲击。

科技巨头减缓采购:科技巨头们可能因库存积压,减少对英伟达显卡的采购。

英伟达前景堪忧:上述因素叠加,可能导致英伟达的业务全面下滑。

X上,有一个金融大V说了一句:deepseek better not be the real deal...(deepseek 最好不是真的......)然后配了一张让人不寒而栗的图。

500

75年高点:图表显示,美国股市位于75年来的最高点。

Magnificent 7:这个词指的是目前美国股市中表现最好的七家科技巨头公司,它们在很大程度上推动了美国股市的上涨。

两次泡沫:分别是上世纪60年代的Nifty 50泡沫和90年代的互联网泡沫。这两次泡沫都导致了股市崩盘,这一次,deepseek来了...美股会崩吗?

500

最后,我们在看一看,Deep Seek团队刚在康奈尔发表的论文,其中每一个作者都值得我们铭记,大部分都是30岁以下的年轻人,来自国内的顶尖大学,有的还在读博士,其中,无人具有海外的学术背景。这再次表明中国在大学教育质量上已经赶上美国,并且未来几十年中国在STEM毕业生方面将占据绝对的数量优势。

正如DeepSeek创始人梁文锋所说:我们的价值在于团队,通过这个过程不断成长和积累专业知识。建立一个能够持续创新的团队,才是我们真正的护城河。


100%(1)
0%(0)
绗� 鍚� (蹇呴€夐」): 瀵� 鐮� (蹇呴€夐」): 娉ㄥ唽鏂扮敤鎴�
标 题 (必选项):
内 容 (选填项):

娈佃惤鏍煎紡
瀛椾綋
瀛楀彿
实用资讯
北美最大最全的折扣机票网站
美国名厂保健品一级代理,花旗参,维他命,鱼油,卵磷脂,30天退货保证.买百免邮.
一周点击热帖 更多>>
1 缇庡浗鏂版斂 璇磋瀛︽湳鍦堝拰澶у鏁欒偛鐨� eastwest
2 缇庡浗閫艰揩涔屽厠鍏拌皥鍒わ紝鐪熺殑鏄淇� eastwest
3 鍗板害缁忔祹鎬庝箞涓嶉棯鍏変簡 zt eastwest
4 鍓€荤粺鍏劧濞佽儊鏅含锛佽璺熷窛鏅敱 eastwest
5 鈥滃繕璁板垵蹇冣€濈殑宸ヤ笟宸ㄥご锛岃兘澶嶅叴 eastwest
6 浜哄伐鏅鸿兘绐佺牬鐨勮浆鎶樼偣鏄嚜涓绘€� z eastwest
7 F-35A鍜岃嫃-57鍦ㄧ彮鍔犵綏灏旇桨杞扮儓鐑� eastwest
8 鐪熷亣缇庡浗锛氬窛鏅湁鍏冲叧绋庣殑7绉嶄笉鍚� eastwest
9 椹柉鍏嬪彧鏄€滃個鍎♀€濓紝澶ц鍛樹富瀵� eastwest
10 涓€鐢熼兘闅捐蛋鍑猴紝鎴樹簤鍒涗激搴旀€ュ績鐞� eastwest
一周回复热帖
1 閲庣尗璁烘斂 2275锛氶┈鍙崲姣斿ゥ鍒犻櫎鈥� oldfarmer
2 宸濇櫘瑕佽窡涓浗鍐虫垬浜嗭紝涓栫晫鏀挎不杩� eastwest
3 鍔犳嬁澶у箍鎾叕鍙革細鍔犳嬁澶т笉鎯冲綋绫� bart21
4 缇庝縿鍏崇郴鎵嶅垰鍒氭湁鎵€鍥炴殩,淇勭綏鏂嵈 wada
5 缇庝縿鍒╅泤寰楄皥鍒わ紝淇勫闀挎媺澶綏澶� bart21
6 缇庝縿璋堜簡4涓灏忔椂锛屸€滆揪鎴�4鐐瑰叡 eastwest
7 鎺㈣鍏ㄧ悆鈥滃皬棰濊眮鍏嶁€濊揣鐗╂灑绾斤細 bart21
8 2018骞村垬鍏煡鏄繖涔堣鐨勩€傛槑鏄庢瘮 澶у浗鏈夊ぇ鍥�
9 Wada杩囨潵鐪嬬湅锛屽浗濡炴€庝箞鎵嶈兘闀垮嚭 bart21
10 622寮垫棩杌嶄镜鑿収鐗囧垎瑁�12浠藉畨鍏ㄦ姷 oldfarmer
历史上的今天:回复热帖
2024: 中国占美国GDP比例跌到65.4%,工农业领
2024: 王毅免簽紅包衝一波!半路遇上討厭鬼?歐
2023: 一个受阴国佬洗脑移阴的BNO,拥有文科硕
2023: 【瞿雁冰】殲-20進駐高原機場,全面壓�
2022: 一触即发的俄乌战争不打了,美国“拱火
2022: 印媒:印国产航发要等10多年 技术已落后
2021: 无套裤汉再集合 贫限想之三
2021: 中国12nm芯片将量产!美国遭新规反噬,
2020: 居家隔离还是住院治疗?这篇文章都说明
2020: 7年前的一篇奇文导致刊物停刊,编辑整顿