日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

DeepSeek的一次小更新:暴打OpenAI 追上Gemini

   時間:2025-12-03 09:43:33 來源:差評編輯:快訊 IP:北京 發表評論無障礙通道
 

壞消息,開源模型和閉源模型的差距越來越大了。

好消息,DeepSeek 又出手了。

12 月 1 日,DeepSeek 發布了兩款新模型 —— DeepSeek V3.2 和 DeepSeek-V3.2-Speciale。

前者和 GPT-5 能打的有來有回,后面的高性能版更是直接把 GPT 爆了,開始和閉源模型天花板 —— Gemini 打了個五五開。

還在IMO 2025(國際數學奧林匹克)、CMO 2025(中國數學奧林匹克)等一系列比賽中拿下金牌。

這是這家公司今年第九次發布模型,雖然大家期待的 R2 還沒有來。

所以,DeepSeek 是怎么用更小的數據,更少的顯卡,做出能和國際巨頭來抗衡的模型?

我們翻開了他們的論文,想把這件事給大家講清楚。

為了做到這個目標,DeepSeek 又整了不少新招:

先是把咱們的老朋友 DSA —— 稀疏注意力給轉正了。

這東西在之前的 V3.2-EXP 版本里出現過,當時只是測了一下 DSA 會不會影響模型的性能,現在是真的把這玩意給放到了主力模型上。

大家平時和大模型聊天的時候會發現,你在一個對話框里聊的越多,模型就越容易胡言亂語。

甚至聊的太多了,還會直接不讓你聊了。

這是因為大模型原生的注意力機制導致的問題,在這套老邏輯的影響下,每個 token 出來,都要和前面的每一個 token 互相算在一起做一次計算。

這就導致了句子增長一倍,模型的計算量就得增加到原來的四倍,如果邊長到原來的三倍,計算量就變成了原來的九倍,非常麻煩。

DeepSeek 想這樣不行啊,于是就給大模型里加了固定頁數的目錄(稀疏注意力),相當于幫模型劃重點了。

而在有了目錄之后,以后每次只需要計算這個 token 和這些目錄的關系就行了,相當于就是看書先讀目錄,看完目錄,對哪一章感興趣,再去仔細看這章的內容就好。

這樣一來,就能讓大模型讀長文的能力變的更強。

在下面這張圖里可以看到,隨著句子越來越長,傳統的 V3.1 的推理成本是越來越高。

但是用上了稀疏注意力的 3.2 則沒什么變化。。。

屬于是超級省錢冠軍了。

另一方面,DeepSeek 開始重視起了開源模型的后訓練工作。

大模型這一套從預訓練開始,到考試打分的過程,其實有點像是我們人類從小學開始,一路讀書讀到高考的過程。

前面的大規模預訓練,相當于從小學到高二,把所有課本、練習冊、卷子全過一遍,這一步大家都差不多,不管是閉源模型,還是開源模型,都在老老實實的念書。

但到了高考沖刺階段就不一樣了,在模型的后訓練階段,閉源模型一般都會請名師,猛刷題,開始搞起各種強化學習,最后讓模型來考一個不錯的成果。

但開源模型在這塊花的心思就比較少了,按照 DeepSeek 的說法,過去的開源模型在訓練后階段計算投入普遍偏低。

這就導致這些模型可能基礎能力是已經到位的了,但就是難題刷少了,結果導致考出來的成績不太好。

于是,DeepSeek 決定這次自己也要上名師輔導班,設計了一套新的強化學習協議,在預訓練結束后,花了超過總訓練算力的 10% 來給模型開小灶,把之前缺的這塊給補上。

同時還推出了個能思考超長時間的特殊版本 —— DeepSeek V3.2 Speciale。

這玩意的思路是這樣的:

過去的大模型因為上下文長度有限制,所以在訓練的時候都會做一些標注懲罰的工作,如果模型深度思考的內容太長了,那就會扣分。

而到了 DeepSeek V3.2 Speciale 這兒,所以 DeepSeek 干脆取消掉了這個扣分項,反而鼓勵模型想思考多久就思考多久,想怎么思考就怎么思考。

最終,讓這個全新的 DeepSeek V3.2 Speciale 成功的和前幾天爆火的 Gemini 3 打的有來有回。

此外DeepSeek 還很重視模型在智能體方面能力。

一方面,為了提高模型的基礎能力,DeepSeek 構建了一個虛擬環境,合成了成千上萬條數據來輔助訓練。

DeepSeek-V3.2 用 24667 個真實代碼環境任務、50275 個真實搜索任務、4417 個合成通用 agent 場景、5908 個真實的代碼解釋任務做后訓練。

另一方面,DeepSeek 還優化了模型使用各種工具的流程。

以前幾代 DeepSeek 的一個典型毛病是:會把思考和用工具給分開。

模型一旦去調用外部工具,前面那段思考基本就算寫完收工了,等工具查完結果再回來,它往往又要重新鋪一遍思路。

這就導致一種很蠢的體驗——哪怕只是去查一下“今天幾月幾號” 這種小事,模型也會從頭開始重建整套推理鏈,非常浪費時間。。。

在 V3.2 這里,DeepSeek 忍不了了,直接把這套邏輯推翻重做。

現在的規則變成:在一整串工具調用的過程中,模型的“思考過程”會一直保留下來,只有當用戶發來一條新的提問時,才會重置這一輪推理;而工具的調用記錄和結果,會像聊天記錄一樣一直留在上下文里。

通過這修改模型架構,重視后訓練,強化 Agent 能力的三板斧,DeepSeek 才終于讓自己的新模型,有了能和世界頂尖開源模型再次一戰的能力。

當然,即使做了這么多改進,DeepSeek 的表現也算不上完美。

但托尼最喜歡 DeepSeek 的一點,就是他們愿意承認自己的不足。

而且還會直接在論文里寫出來。

比如這次論文就提到了,這次的 DeepSeek V3.2 Speciale 雖然能和谷歌的 Gemini 3 Pro 來打的五五開。

但是要回答相同的問題,DeepSeek 需要花費更多的 token。

我自己也測試了一下,從“人類的最終考試” 的題庫里隨便抽了道題目,同時丟給 Gemini 3 Pro 和 DeepSeek V3.2 Speciale 這兩個模型。

題目是:

蜂鳥類在足形目中獨特地擁有雙側成對的橢圓形骨,這是一種嵌入在膨脹的十字翼腱膜的尾狀骨中,嵌入壓低多粒骨的尾狀骨。這塊籽骨支撐著多少對對腱?請用數字回答。

結果發現 Gemini 只要 4972 個 Tokens 就能把問題給答出來。

而到了 DeepSeek 這邊,則用了 8077 個 Tokens 才把問題給搞明白。

光看用量的話,DeepSeek 的的 Tokens 消耗量高了快六成,確實是有不小的差距。

但是話又說回來了。

DeepSeek 雖然消耗的 token 多,但是人家價格便宜啊。。。

還是剛才那個問題,我回頭仔細看了眼賬單。

DeepSeek 8000 多個 tokens,花了我 0.0032 美元。

但谷歌這邊,5000 個 tokens 不到,給我干掉了 0.06 刀?這塊要比 DeepSeek 高了有 20 倍了。

從這個角度上來看,怎么感覺還是 DeepSeek 更香一些。。。

最后,讓我們回到論文的開頭。

正如 DeepSeek 所言,最近半年來,開源模型和閉源模型的差距正在不斷加大。

但他們還是用自己的方式,在不斷追趕這份差距。

而 DeepSeek 的各種節省算力,節約數據的操作,其實讓我想到了上個月,一場關于 Ilya Sutskever 的訪談。

這位 OpenAI 曾經的靈魂人物認為,只靠一味的給模型堆參數,是沒有未來的。

AlexNet只用了兩塊GPU。Transformer剛出現時的實驗規模,大多在8~64塊GPU范圍內。按今天的標準看,那甚至相當于幾塊GPU的規模,ResNet也一樣。沒有哪篇論文靠龐大的集群才能完成。

比起算力的堆砌,對算法的研究也一樣重要。

這正是 DeepSeek 在做的事情。

從 V2 的 MoE,到 V3 的多頭潛在注意力(MLA),再到如今 DeepSeek Math V2 的自驗證機制,V3.2 的稀疏注意力(DSA)。

DeepSeek 展現給我們進步,從來都不是單一的,依靠堆砌參數規模所帶來的提升。

而是在想辦法,如何用有限的數據,來堆積出更多的智能。

巧婦狂作無米之炊

所以,R2 什么時候來呢?

責任編輯:落木

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
日本精品一区二区三区高清 久久
青青草国产精品97视觉盛宴| 亚洲精品菠萝久久久久久久| 国内国产精品久久| 亚洲精品一区二区三区福利| 国产精品456露脸| 中文在线一区二区| 91视视频在线直接观看在线看网页在线看 | 亚洲国产一区二区三区| 欧美中文字幕久久| 丝袜a∨在线一区二区三区不卡| 欧美日韩你懂的| 蜜桃av一区二区在线观看 | 色综合久久久久综合体| 一区二区高清在线| 日韩手机在线导航| 国产精品一线二线三线精华| 中文字幕制服丝袜一区二区三区 | 国产精品视频在线看| 91热门视频在线观看| 午夜精品久久久久久久久久| 日韩精品专区在线影院重磅| 国产寡妇亲子伦一区二区| 亚洲欧洲性图库| 欧美日韩精品系列| 国产精品综合二区| 一区二区三区久久| 精品国产髙清在线看国产毛片| 国产白丝网站精品污在线入口| 国产精品久久久久久久浪潮网站 | 欧美日韩专区在线| 国产一区二区视频在线| 亚洲最大色网站| 日韩欧美的一区| 91在线观看地址| 久久国产尿小便嘘嘘尿| 亚洲欧美综合另类在线卡通| 6080国产精品一区二区| 国产1区2区3区精品美女| 亚洲高清免费观看| 国产日韩v精品一区二区| 欧美色图免费看| 国产盗摄视频一区二区三区| 亚洲va欧美va人人爽午夜| 国产午夜久久久久| 91精选在线观看| 91丝袜呻吟高潮美腿白嫩在线观看| 麻豆久久久久久久| 亚洲国产va精品久久久不卡综合| 国产色产综合色产在线视频 | 欧美精品第1页| 99久久久久免费精品国产| 美女精品一区二区| 亚洲韩国精品一区| 国产精品视频观看| 亚洲精品一区二区三区四区高清| 在线中文字幕不卡| 不卡免费追剧大全电视剧网站| 蜜臀久久久99精品久久久久久| 日韩欧美一区二区久久婷婷| 国产自产v一区二区三区c| 日韩精品一级中文字幕精品视频免费观看 | 日韩精品一区二区三区四区| 欧美体内she精高潮| 99re66热这里只有精品3直播| 国产综合色精品一区二区三区| 首页欧美精品中文字幕| 亚洲毛片av在线| 17c精品麻豆一区二区免费| 亚洲自拍偷拍麻豆| 亚洲精品成a人| 亚洲免费av网站| ㊣最新国产の精品bt伙计久久| 国产片一区二区| 国产欧美精品一区| 国产欧美一区二区三区网站| 精品欧美黑人一区二区三区| 日韩欧美综合一区| 91精品国产色综合久久| 这里只有精品免费| 欧美精品亚洲一区二区在线播放| 欧美伊人久久大香线蕉综合69| 在线观看成人小视频| 色乱码一区二区三区88| 色狠狠综合天天综合综合| fc2成人免费人成在线观看播放| 成人va在线观看| 99久久精品一区二区| 97国产精品videossex| 色综合一个色综合| 日本韩国精品一区二区在线观看| 91福利资源站| 欧美天堂一区二区三区| 91精品国产高清一区二区三区| 91精品国产综合久久福利| 日韩欧美高清dvd碟片| 久久久亚洲欧洲日产国码αv| 久久久精品日韩欧美| 日本一区二区在线不卡| 亚洲人成电影网站色mp4| 亚洲五码中文字幕| 老司机精品视频导航| 国产.欧美.日韩| 色香色香欲天天天影视综合网| 欧美少妇性性性| 欧美一区二区三区免费观看视频| 精品sm捆绑视频| 国产精品久久毛片av大全日韩| 亚洲综合无码一区二区| 日韩有码一区二区三区| 国产乱人伦偷精品视频不卡| caoporen国产精品视频| 欧美日韩一本到| 久久毛片高清国产| 亚洲视频一区二区免费在线观看| 亚洲成人先锋电影| 国精产品一区一区三区mba桃花| 国产成人精品一区二区三区网站观看| 成人a免费在线看| 欧美日韩一级大片网址| 久久夜色精品一区| 亚洲精品美国一| 国产在线视频一区二区三区| 97久久超碰国产精品电影| 日韩午夜精品电影| 亚洲欧美国产高清| 久久国产精品第一页| 日本韩国欧美国产| 久久久噜噜噜久噜久久综合| 亚洲精品高清在线观看| 国产一区二区三区四区五区美女 | 国模套图日韩精品一区二区| 91精品福利在线| 久久久久久影视| 天天做天天摸天天爽国产一区 | 不卡一区二区三区四区| 日韩一区二区视频在线观看| 亚洲精品乱码久久久久| 国产真实乱子伦精品视频| 久久久久久久网| 日韩精品三区四区| 日本道免费精品一区二区三区| 亚洲精品一区二区三区香蕉| 午夜精品久久久久久不卡8050| 成人动漫精品一区二区| 久久人人爽人人爽| 久久精品久久久精品美女| 在线视频一区二区三| 国产精品污www在线观看| 久久99久久精品| 7777精品伊人久久久大香线蕉 | 97成人超碰视| 国产三级精品在线| 久久国产免费看| 日韩三级在线观看| 亚洲国产综合在线| 欧美综合色免费| 亚洲精品欧美激情| 91色综合久久久久婷婷| 亚洲国产激情av| 国产麻豆精品在线| 久久婷婷成人综合色| 捆绑调教美女网站视频一区| 欧美日韩国产经典色站一区二区三区| 最新国产の精品合集bt伙计| 福利电影一区二区| 欧美激情一区二区三区蜜桃视频 | 精品国产污污免费网站入口 | 天堂午夜影视日韩欧美一区二区| 色婷婷综合久色| 一区二区三区精密机械公司| 日本韩国视频一区二区| 亚洲乱码国产乱码精品精可以看| 成人av免费网站| 日韩美女视频一区二区| 91美女在线观看| 亚洲乱码国产乱码精品精的特点 | 精品999久久久| 日韩和欧美一区二区三区| 欧美性大战xxxxx久久久| 亚洲在线观看免费视频| 欧美亚一区二区| 亚洲123区在线观看| 欧美日韩一二三| 日韩av网站在线观看| 日韩一区二区在线免费观看| 激情图片小说一区| 国产亚洲欧美日韩俺去了| 成av人片一区二区| 亚洲综合视频在线| 欧美一区二区三区在线电影| 精品午夜久久福利影院| 欧美韩国日本不卡| 色呦呦日韩精品| 全国精品久久少妇| 久久久久国色av免费看影院| 99这里只有精品| 亚洲第一搞黄网站| 精品欧美一区二区三区精品久久 | 国产精品综合二区| 亚洲人精品一区|