| ÁºÎÄ·æÊðÃûDeepSeek×îÐÂÂÛÎÄ£¬Ìá³öз½·¨Í»ÆÆGPUÄÚ´æÏÞÖÆ |
| Ëͽ»Õß: 2026Äê01ÔÂ13ÈÕ21:39:28 ÓÚ [ÊÀ½çÓÎÏ·ÂÛ̳] ·¢ËÍÇÄÇÄ»° |
|
|
|
¡¾ÎÄ/¹Û²ìÕßÍø Ðܳ¬È»¡¿1ÔÂ12ÈÕÍí¼ä£¬ÖйúÈ˹¤ÖÇÄÜ£¨AI£©³õ´´¹«Ë¾DeepSeek´´Ê¼ÈËÁºÎÄ·æÓë±±¾©´óѧÑо¿ÈËÔ±¹²Í¬ÊðÃû·¢±íÁËһƪ¼¼ÊõÂÛÎÄ£¬Ìá³öÁËÒ»ÖÖеÄÄ£ÐÍѵÁ·¼¼Êõ¡£ËûÃDZíʾ£¬¸Ã¼¼Êõ¿ÉÒÔͨ¹ýÈÆ¹ýͼÐδ¦Àíµ¥Ôª£¨GPU£©ÄÚ´æÏÞÖÆ£¬ÊµÏÖ¡°²ÎÊýµÄ»ý¼«À©Õ¹¡±¡£ Ïã¸Û¡¶ÄÏ»ªÔ籨¡·1ÔÂ13ÈÕ±¨µÀÖ¸³ö£¬´Ë¾Ù͹ÏÔÁËDeepSeekÔÚËãÁ¦Ïà¶ÔÃÀ¹úÐÐÒµÁìÏÈÆóÒµ´æÔÚ²î¾àµÄÇé¿öÏ£¬³ÖÐø×¨×¢ÓÚ×î´óÏ޶ȵØÌá¸ß³É±¾Ð§ÂÊ¡£Óë´Ëͬʱ£¬Íâ½ç²Â²â¸Ã¹«Ë¾½«ÔÚ½ñÄê´º½Ú֮ǰ·¢²¼Ò»¿îÖØÒªµÄÐÂÄ£ÐÍ¡£ ±¨µÀ³Æ£¬ÕâÆª¼¼Êõº¬Á¿¼«¸ßµÄÂÛÎĽ«Êܵ½ÖйúºÍÃÀ¹úÒµÄÚÈËÊ¿µÄ¹ã·º¹Ø×¢£¬ËûÃÇÏ£Íû´ÓÖÐÁ˽âDeepSeekËùÈ¡µÃµÄ×îнøÕ¹¡£ÔÚ¹ýÈ¥Ò»ÄêÖУ¬DeepSeekÒ»Ö±ÊÇÖйúAIÁìÓò´´Ðµĵ䷶¡£
DeepSeekÓë±±¾©´óѧÑо¿ÈËÔ±ºÏ×÷·¢±íÂÛÎÄ£¬ÁºÎÄ·æÔÚÁÐ ÂÛÎĽØÍ¼ ¾Ý±¨µÀ£¬ÔÚÕâÆªÌâΪ¡¶»ùÓÚ¿ÉÀ©Õ¹²éÕÒµÄÌõ¼þ¼ÇÒ䣺´óÓïÑÔÄ£ÐÍÏ¡ÊèÐÔµÄÐÂά¶È¡·£¨Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models£©µÄ×îÐÂÂÛÎÄÖУ¬½éÉÜÁËÒ»ÖÖÃûΪ¡°Engram¡±£¨¼ÇÒäºÛ¼££©µÄ¡°Ìõ¼þ¼ÇÒ䡱£¨conditional memory£©¼¼Êõ¡£ ¸Ã¼¼ÊõÓÃÒÔ½â¾öÀ©´óAIÄ£Ð͹æÄ£Ê±µÄÒ»¸ö¹Ø¼üÆ¿¾±¡ª¡ªGPU¸ß´ø¿íÄڴ棨HBM£©ÈÝÁ¿ÓÐÏÞµÄÎÊÌâ¡£ ÏÖÓеĴóÐÍÓïÑÔÄ£ÐÍ£¨LLM£©Í¨¹ý¼ÆËãÀ´¼ìË÷»ù´¡ÐÅÏ¢£¬¶øÕâÒ»¹ý³ÌÐèÒª´óÁ¿µÄ¼ÆËãÄÜÁ¦¡£È»¶ø£¬Ñо¿ÈËÔ±±íʾ£¬ÕâÖÖ·½Ê½ÀË·ÑÁ˱¦¹óµÄ¡°ÐòÁÐÉî¶È¡±£¨sequential depth£©£¬ÕâЩ¡°ÐòÁÐÉî¶È¡±±¾¿ÉÒÔ±»·ÖÅäÓÃÓÚ¸ü¸ß²ã´ÎÍÆÀíµÄËöËé²Ù×÷¡£ ¡¶ÄÏ»ªÔ籨¡·Ö¸³ö£¬HBMÊÇÖйúÔÚAIÓ²¼þ·½ÃæÓëÃÀ¹úÖ®¼ä×î´óµÄ²î¾àÖ®Ò»¡£º«¹ú°ëµ¼ÌåÐÐÒµ·ÖÎö»ú¹¹SemiAnalysisµÄ·ÖÎöʦRay Wang±íʾ£¬¾¡¹Ü½üÄêÀ´È¡µÃÁËÎȲ½½øÕ¹£¬µ«Öйú´æ´¢Ð¾Æ¬¾ÞÍ·³¤öδ洢£¨CXMT£©ÈÔÈ»±Èº«¹úµÄÈýÐǵç×ÓºÍSKº£Á¦Ê¿ÒÔ¼°ÃÀ¹úµÄÃÀ¹â¿Æ¼¼µÈÐÐÒµÁì¾üÕßÂäºóÊýÄê¡£ ÔÚÂÛÎÄÖУ¬DeepSeekºÍ±±¾©´óѧµÄÑо¿ÈËÔ±±íʾ£¬Í¨¹ý½«¼ÆËãÓë´æ´¢¡°½âñ£¬Engram¿ÉÒÔÈÃÄ£Ð͸ü¸ßЧµØ¡°²éÕÒ¡±ÕâЩ»ù´¡ÐÅÏ¢¡£ ËûÃÇÌáµ½µÄм¼Êõ£¬»¹Äܹ»ÌáÉýÄ£ÐÍÔÚ´¦Àí³¤ÉÏÏÂÎÄ£¨¼´½Ï³¤ÊäÈ룩ʱµÄЧÂÊ£¬¶øÕâÕýÊǽ«AIÁÄÌì»úÆ÷ÈËת±äΪÏÖʵÊÀ½çÖÐÓÐÓõÄAI´úÀíËùÃæÁÙµÄ×î´óÌôÕ½Ö®Ò»¡£ Ñо¿ÈËÔ±ÔÚÒ»¸öÓµÓÐ270ÒÚ¸ö²ÎÊýµÄÄ£ÐÍÖÐÑéÖ¤ÁËÕâÒ»¼¼Êõ£¬·¢ÏÖËüʹÖ÷ÒªÐÐÒµ»ù×¼²âÊԵıíÏÖÌáÉýÁ˼¸¸ö°Ù·Öµã¡£¹Ø¼üÔÚÓÚ£¬ÕâҲΪģÐÍÖ´ÐмÆËãÐèÇó¸ü¸ßµÄ¸´ÔÓÍÆÀí±£ÁôÁ˸ü¶àÈÝÁ¿¡£ ËûÃÇдµÀ£º¡°ÎÒÃÇÈÏΪÌõ¼þ¼ÇÒ佫³ÉΪÏÂÒ»´úÏ¡ÊèÄ£ÐÍÖв»¿É»òȱµÄ½¨Ä£ÔÓï¡£¡±Ñо¿ÈËÔ±½«EngramµÄDZÔÚÓ°Ïì±È×÷ËûÃÇ×Ô¼º¿ª·¢µÄÒ»ÖÖ¡°»ìºÏר¼Ò¡±£¨MoE£©¼¼Êõ£¬¸Ã¼¼ÊõʹģÐ͹æÄ£µÄÀ©´óÎÞÐè°´±ÈÀýÔö¼Ó¼ÆËãÁ¿£¬²¢ÇҴ˺óÒѱ»ÆäËûÖйú¾ºÕù¶ÔÊÖ²ÉÓá£
DeepSeek´´Ê¼ÈËÁºÎÄ·æ ÊÓÆµ½ØÍ¼ Ŀǰ£¬ÐÐÒµÖÐ×î´óµÄÄ£ÐÍÓµÓÐÊýÍòÒÚ¸ö²ÎÊý¡£¿ªÔ´¿ª·¢Õ߯½Ì¨Hugging FaceµÄÑо¿¹¤³Ìʦ°£Àû¡¤°Í¿âÆæ£¨Elie Bakouch£©ÔÚÉ罻ýÌåÉ϶ÔÕâÆªÂÛÎÄ´ó¼Ó³ÆÔÞ£¬³ÆÆä¡°ÔÚÍÆÀíºÍѵÁ·Ê±ÓÃÓ²¼þÉÏÑéÖ¤ÁËÕâÒ»¼¼Êõ¡±¡£ ¾Ý±¨µÀ£¬ÕâÆªÂÛÎÄÁгöÁË14λ¹²Í¬×÷Õߣ¬³ýÁËÁºÎÄ·æÖ®Í⣬»¹°üÀ¨±±¾©´óѧÍõÑ¡¼ÆËã»úÑо¿ËùÖúÀí½ÌÊÚ¡¢Ç°Î¢ÈíÑÇÖÞÑо¿ÔºÊ×ϯÑо¿Ô±ÕÅ»Ô˧¡£ È¥ÄêÄê³õ£¬DeepSeek·¢²¼µÄ´óÄ£ÐÍDeepSeek-R1£¬Ê¹ÓÃÓÉӢΰ´ïH800 GPUÇý¶¯µÄÊý¾ÝÖÐÐĽøÐÐѵÁ·£¬½öÓÃÁ½¸öÔ¾ÍÍê³ÉÁËѵÁ·£¬³É±¾Îª550ÍòÃÀÔª£¬½öΪOpenAIµÈÃÀ¹ú¹«Ë¾Ëù»¨·Ñ½ð¶îµÄһС²¿·Ö¡£È´ÊµÏÖÁË×ãÒÔÆ¥µÐÃÀ¹ú¶¥¼âAIÄ£Ð͵ÄЧ¹û£¬Õðº³Òµ½çµÄͬʱÒý·¢¶à¹ú¹Ø×¢£¬ÓÈÆäÊÇÃÀ¹ú¡£ µ±µØÊ±¼ä1ÔÂ12ÈÕ£¬¾ÝÓ¢¹ú¡¶½ðÈÚʱ±¨¡·±¨µÀ£¬Î¢Èí×ܲò¼ÀµÂ¡¤Ê·ÃÜ˹£¨Brad Smith£©¾¯¸æ³Æ£¬ÔÚÕù¶áÎ÷·½ÒÔÍâÓû§µÄ¾ºÕùÖУ¬ÃÀ¹úAI¹«Ë¾Õý±»Öйú¾ºÕù¶ÔÊÖ³¬Ô½£¬ÖйúµÍ³É±¾µÄ¡°¿ªÔ´¡±Ä£ÐÍÊÇÒ»´óÓÅÊÆËùÔÚ¡£ Ëû±íʾ£¬ÖйúAI³õ´´¹«Ë¾DeepSeekµÄ¼¼ÊõÔÚ·ÇÖÞµÈÐÂÐËÊг¡¿ìËÙÆÕ¼°£¬Í¹ÏÔÁËÃÀ¹ú¹«Ë¾ÔÚÈ«ÇòÃæÁٵľºÕù¡£¡°ÎÒÃDZØÐëÈÏʶµ½£¬ÓëÒ»Äêǰ²»Í¬£¬ÏÖÔÚÖйúÓµÓÐÒ»¸ö£¬¶øÇÒÔ½À´Ô½¶àµØÓµÓв»Ö¹Ò»¸ö¾ßÓоºÕùÁ¦µÄ¿ªÔ´Ä£ÐÍ¡£¡± ±¨µÀÖ¸³ö£¬Ê·ÃÜ˹·¢±íÕâ·¬ÑÔÂÛÖ®¼Ê£¬Î¢ÈíµÄÒ»ÏîÐÂÑо¿·¢ÏÖ£¬DeepSeekÒ»Äêǰ·¢²¼µÄR1´óÐÍÓïÑÔÄ£ÐÍ£¬ÒòÆä¡°Ò×ÓÃÐԺ͵ͳɱ¾¡±£¬°ïÖú¼ÓËÙÁËAIÔÚÈ«Çò·¶Î§ÄÚµÄÆÕ¼°£¬ÓÈÆäÊÇÔÚÈ«ÇòÄÏ·½¹ú¼Ò¡£ÕâÒ²ÈÃÖйúÔÚ¡°¿ªÔ´¡±AIÄ£Ð͵ÄÈ«ÇòÊг¡·Ý¶î·½Ã泬ԽÁËÃÀ¹ú£¬ÕâЩģÐÍͨ³£¿ÉÒÔÃâ·Ñ¹©¿ª·¢ÈËԱʹÓá¢Ð޸ĺͼ¯³É¡£ ¡¶ÄÏ»ªÔ籨¡·Ö¸³ö£¬ÔÚDeepSeek·¢²¼ÆäR1Ä£ÐÍÒ»ÖÜÄêÖ®¼Ê£¬Íâ½ç¶ÔÆä¼´½«ÍƳöÒ»¿îеÄÖØÒªÄ£ÐÍµÄÆÚ´ýÕýÔÚÉýΡ£ÃÀ¹ú¹è¹ÈµÄÐÂÐ˿Ƽ¼Ã½Ìå¡°The Information¡±µ±µØÊ±¼ä1ÔÂ9ÈÕ±¨µÀ³Æ£¬DeepSeekÔ¤¼Æ½«ÔÚ½ñÄê2ÔÂÖÐÑ®ÍÆ³öÒ»¿î¾ß±¸Ç¿´ó±à³ÌÄÜÁ¦µÄÐÂV4Ä£ÐÍ¡£ |
|
|
![]() |
![]() |
| ʵÓÃ×ÊѶ | |
|
|
| Ò»Öܵã»÷ÈÈÌû | ¸ü¶à>> |
| Ò»Öܻظ´ÈÈÌû |
| ÀúÊ·ÉϵĽñÌ죺»Ø¸´ÈÈÌû |





