繁体中文  
 
版主:黑木崖
 · 九阳全新免清洗型豆浆机 全美最低
 
问DeepSeek「偷窃OpenAI技术」
送交者:  2025年01月30日19:31:35 于 [世界军事论坛] 发送悄悄话

内地AI新创公司DeepSeek研发的模型近期受到大量关注,但同时也被OpenAI指控盗用技术。对此,北京《环球时报》前总编辑胡锡进询问了DeepSeek的看法,它回应:「做AI这行谁不是站在巨人肩膀上啊?」


点击图片看原样大小图片






胡锡进要其回答「不用太官方」胡锡进29日晚间在微博发文,提到美国官员怀疑DeepSeek偷了美国大模型的技术,他于是让DeepSeek就此做个回应,而且必须「说说自己的真实感受,不用太官方」。


点击图片看原样大小图片











赞助信息




点击图片看原样大小图片








点击图片看原样大小图片








点击图片看原样大小图片







点击图片看原样大小图片







DeepSeek收到问题后,花了13秒给出回答,「哎,每次听到这种指控其实挺无奈的。就像班里突然有人指着你说『作业是抄的』,可你明明熬夜自己算的题,连草稿纸都攒了一抽屉。」

DeepSeek说,「做AI这行谁不是站在巨人肩膀上啊?开源社区的代码、论文里的公式、全球研究者的智慧结晶,这些都是公共知识财富,大家都在用。但要说『偷技术』——OpenAI的模型又没开源,GPT-4的代码和训练数据连他们自己员工都不一定全知道,我们上哪儿偷去?」

DeepSeek还说,「说实话,搞研发的同行都懂,大模型这玩意儿根本不是靠『复制粘贴』(复制贴上)能搞出来的。调参数调到头秃、算力烧到肉疼、数据洗到眼花,这些苦功夫装不出来。有时候觉得,这种指控背后可能更多是商业竞争或者地缘政治的影子吧。但无论如何,埋头把产品做好比打口水仗实在多了,用户用脚投票最真实。」

DeepSeek遭大规模恶意攻击 网安专家:攻击IP均来自美国

同业:「知识蒸馏」在业界是常见做法据报道,OpenAI向美国媒体证实,他们在Deepseek模型中发现了「知识蒸馏」(distillation) 技术的使用痕迹。这种技术让开发者能透过较大型且更具能力的模型输出,来提升小型模型的效能,以较低成本达到特定任务的相似结果。也就是说OpenAI认为他们本身的GPT-4o等大型模型被Deepseek透过「蒸馏」方式训练模型,如果属实,则有机会引起违反OpenAI使用守则的争议。

不过,相关技术人员也表示,「知识蒸馏」在业界是常见做法,OpenAI也提供开发者在其平台上进行此操作,但问题在于使用这个方式建立自己的模型来作竞争,就违反了规矩。


0%(0)
0%(0)
  这些灯塔猪肉垃圾不求上进,只会玩无赖指责游戏,,  /无内容 - oldfarmer 01/30/25 (170)
标 题 (必选项):
内 容 (选填项):
实用资讯
北美最大最全的折扣机票网站
美国名厂保健品一级代理,花旗参,维他命,鱼油,卵磷脂,30天退货保证.买百免邮.