繁體中文  
 
版主:黑木崖
 · 九陽全新免清洗型豆漿機 全美最低
 
問DeepSeek「偷竊OpenAI技術」
送交者:  2025年01月30日19:31:35 於 [世界軍事論壇] 發送悄悄話

內地AI新創公司DeepSeek研發的模型近期受到大量關注,但同時也被OpenAI指控盜用技術。對此,北京《環球時報》前總編輯胡錫進詢問了DeepSeek的看法,它回應:「做AI這行誰不是站在巨人肩膀上啊?」


點擊圖片看原樣大小圖片






胡錫進要其回答「不用太官方」胡錫進29日晚間在微博發文,提到美國官員懷疑DeepSeek偷了美國大模型的技術,他於是讓DeepSeek就此做個回應,而且必須「說說自己的真實感受,不用太官方」。


點擊圖片看原樣大小圖片











贊助信息




點擊圖片看原樣大小圖片








點擊圖片看原樣大小圖片








點擊圖片看原樣大小圖片







點擊圖片看原樣大小圖片







DeepSeek收到問題後,花了13秒給出回答,「哎,每次聽到這種指控其實挺無奈的。就像班裡突然有人指着你說『作業是抄的』,可你明明熬夜自己算的題,連草稿紙都攢了一抽屜。」

DeepSeek說,「做AI這行誰不是站在巨人肩膀上啊?開源社區的代碼、論文裡的公式、全球研究者的智慧結晶,這些都是公共知識財富,大家都在用。但要說『偷技術』——OpenAI的模型又沒開源,GPT-4的代碼和訓練數據連他們自己員工都不一定全知道,我們上哪兒偷去?」

DeepSeek還說,「說實話,搞研發的同行都懂,大模型這玩意兒根本不是靠『複製粘貼』(複製貼上)能搞出來的。調參數調到頭禿、算力燒到肉疼、數據洗到眼花,這些苦功夫裝不出來。有時候覺得,這種指控背後可能更多是商業競爭或者地緣政治的影子吧。但無論如何,埋頭把產品做好比打口水仗實在多了,用戶用腳投票最真實。」

DeepSeek遭大規模惡意攻擊 網安專家:攻擊IP均來自美國

同業:「知識蒸餾」在業界是常見做法據報道,OpenAI向美國媒體證實,他們在Deepseek模型中發現了「知識蒸餾」(distillation) 技術的使用痕跡。這種技術讓開發者能透過較大型且更具能力的模型輸出,來提升小型模型的效能,以較低成本達到特定任務的相似結果。也就是說OpenAI認為他們本身的GPT-4o等大型模型被Deepseek透過「蒸餾」方式訓練模型,如果屬實,則有機會引起違反OpenAI使用守則的爭議。

不過,相關技術人員也表示,「知識蒸餾」在業界是常見做法,OpenAI也提供開發者在其平台上進行此操作,但問題在於使用這個方式建立自己的模型來作競爭,就違反了規矩。


0%(0)
0%(0)
  這些燈塔豬肉垃圾不求上進,只會玩無賴指責遊戲,,  /無內容 - oldfarmer 01/30/25 (170)
標 題 (必選項):
內 容 (選填項):
實用資訊
北美最大最全的折扣機票網站
美國名廠保健品一級代理,花旗參,維他命,魚油,卵磷脂,30天退貨保證.買百免郵.