繁体中文  
 
版主:黑木崖
 · 九阳全新免清洗型豆浆机 全美最低
 
从玩具到工具,AI产业化之成本篇 zt
送交者:  2025年02月02日05:53:25 于 [世界军事论坛] 发送悄悄话

从玩具到工具,AI产业化之成本篇

从2022年12月的GPT到2024年4月的Llama 3,AI大语言模型的训练成本下降了一个数量级。从2024年4月的Llama 3到2024年12月的DeepSeek-V3,训练成本又下降了一个数量级。这是我们期望的技术发展路线,性能提升同时成本快速下降。

这里,我们站在DeepSeek的肩膀上,估算今天基于开源大模型的AI应用开发和部署成本。

我们选择目前业界评价最好的开源模型DeepSeek-R1-Distill-Llama-70B,即DeepSeek R1版本,700亿参数,使用Llama3进行蒸馏。训练复现成本主要包括A800 GPU,CPU,存储和网络硬件,管理调度和分布式训练的软件开发,不要求训练性能,不考虑训练数据集的成本,不含技术储备所需费用,不含微调训练所需时间和成本。推理部署成本,包括和训练类似的硬件系统,推理时计算需要的代理软件开发,一个商业搜索引擎的使用成本,假设用户对每秒两个字的推理性能满意。

估算结果是,训练复现成本1400万人民币,推理前期投资200万,上线后每千名并发用户120万。

根据上述的估算结果,时至今日,AI应用仍然需要每个活跃用户提供2000元的收入才有生存空间。

不难看出,AI训练和推理成本的高企推高了AI应用的盈利门槛,限制了技术向产业的渗透能力。

进一步分析,AI技术成本无法快速降低有两个原因,一是硬件成本没有如预期明显下降,如英伟达在2020年9月发布的A100 GPU,是过去两年用于AI技术的主流芯片,其当前的市场价仍然和四年前相差无几,这在快速发展的信息技术领域可谓是奇葩;二是高性能计算技术无论在硬件和算法上都没有明显的突破,包括英伟达在内的众多芯片公司仍然在原有的技术路线上耕耘,虽有进步但缺乏重大突破。尤其是苹果、英特尔和高通,竟然在终端设备的AI部署上几乎毫无作为。

展望未来,AI应用的开发和部署成本必然进一步下降,同时希望新一代的终端设备能够在成本和性能上完成技术突破。如果能够实现这两点,那么AI应用将会百花齐放,AI技术浪潮将真正席卷整个社会。

 附:包括DeepSeek在内,所有的开源大模型都缺乏关键的性能指标,如训练需要的硬件规格,推理需要的硬件规格,训练和推理的吞吐量,等等。这是产业不成熟的又一个标志。你花100块钱买个软件或者游戏,都会有软硬件要求的列表


0%(0)
0%(0)
标 题 (必选项):
内 容 (选填项):
实用资讯
北美最大最全的折扣机票网站
美国名厂保健品一级代理,花旗参,维他命,鱼油,卵磷脂,30天退货保证.买百免邮.
一周点击热帖 更多>>
一周回复热帖
历史上的今天:回复热帖
2024: 美帝经济如日中天,股市房市天天涨,再
2024: 中国为孟加拉建造的梦想之桥,通车现场
2023: 老米在半导体芯片方面和对华为,进一步打
2023: 中国科幻底气来自“大国重器”的实力!
2022: 大年初一输越南,国足再下去输谁?
2022: 美国《国家利益》杂志:当务之急是尽一
2021: 中国人在美大笔买房,小心被征高额遗产
2021: 组织部的凤姐 贫限想之六
2020: 会开市的,大家都盼着呢,中国资产大崩
2020: 回家! 湖南最小新型冠状病毒感染的确诊