日本一级片在线播放_97在线视频观看_天天摸天天做天天爽水多_欧美激情第六页_91原创在线视频_在线观看免费观看在线91_黑丝av在线播放_精品123区_国产一级片免费_亚洲天堂av在线免费

首頁 > 聚焦 > 正文

阿里深夜干了件大事,成本暴降90%! 熱點(diǎn)聚焦

2025-09-12 19:01:00來源:智東西

智東西

作者 | 程茜


【資料圖】

編輯 | 心緣

智東西9月12日報道,今天凌晨,阿里通義實(shí)驗(yàn)室正式發(fā)布下一代基礎(chǔ)模型架構(gòu)Qwen3-Next,并訓(xùn)練了基于該架構(gòu)的Qwen3-Next-80B-A3B-Base模型,該模型擁有800億個參數(shù)僅激活30億個參數(shù)。

Base模型在Qwen3預(yù)訓(xùn)練數(shù)據(jù)的子集15T tokens上進(jìn)行,僅需Qwen3-32B 9.3%的GPU計算資源,針對超過32k的上下文,推理吞吐量可達(dá)到Qwen3-32B的10倍以上。

同時,基于Base模型,阿里開源了Qwen3-Next-80B-A3B的指令模型(Instruct)和思維模型(Thinking),模型支持原生262144個token上下文長度,可擴(kuò)展至1010000個token。

其中,Qwen3-Next-80B-A3B-Instruct僅支持指令(非思考)模式,其輸出中不生成塊;Qwen3-Next-80B-A3B-Thinking僅支持思考模式,為了強(qiáng)制模型進(jìn)行思考,默認(rèn)聊天模板自動包含。

指令模型的性能表現(xiàn)與參數(shù)規(guī)模更大的Qwen3-235B-A22B-Instruct-2507相當(dāng),思維模型優(yōu)于谷歌閉源模型Gemini-2.5-Flash-Thinking。

▲指令模型測試基準(zhǔn)

▲思維模型測試基準(zhǔn)

在架構(gòu)升級方面,相比阿里4月底的Qwen3 MoE模型,新增了混合注意力機(jī)制、高稀疏度MoE結(jié)構(gòu)、一系列訓(xùn)練穩(wěn)定友好的優(yōu)化,以及提升推理效率的多Token預(yù)測(MTP)機(jī)制等。

新模型已在魔搭社區(qū)和HuggingFace開源,開發(fā)者們也可通過Qwen Chat免費(fèi)體驗(yàn)或阿里云百煉、NVIDIA API Catalog體驗(yàn)Qwen3-Next。

開發(fā)者在Qwen的X評論區(qū)稱贊其新增的多Token預(yù)測(MTP)機(jī)制,稱這是最令人印象深刻的部分。

阿里云百煉:https://bailian.console.aliyun.com/?tab=model#/model-market/detail/qwen3?modelGroup=qwen3

一、指令模型接近235B旗艦?zāi)P停评砟P统珿emini-2.5

Qwen3-Next模型支持原生262144個token上下文長度,可擴(kuò)展至1010000個token。

總的來看在性能方面,指令模型接近阿里參數(shù)規(guī)模235B的旗艦?zāi)P停季S模型表現(xiàn)優(yōu)于Gemini-2.5-Flash-Thinking。

其基座模型為Qwen3-Next-80B-A3B-Base,僅使用1/10的Non-Embedding激活參數(shù),在大多數(shù)基準(zhǔn)測試中,性能表現(xiàn)與Qwen3-32B-Base相近。但其總訓(xùn)練成本為Qwen3-32B-Base的10%不到,并且對于超過32K上下文的推理吞吐是Qwen3-32B的10倍以上。

得益于其新的混合模型架構(gòu),Qwen3-Next在推理效率方面,與Qwen3-32B相比,Qwen3-Next-80B-A3B在預(yù)填充(prefill)階段,在4k tokens的上下文長度下,吞吐量接近前者的7倍,當(dāng)上下文長度超過32k時,吞吐提升達(dá)到10倍以上。

在解碼(decode)階段,該模型在4k上下文下實(shí)現(xiàn)近4倍的吞吐提升,在超過32k的長上下文場景中能保持10倍以上的吞吐優(yōu)勢。

具體來看,其指令模型表現(xiàn)優(yōu)于Qwen3-30B-A3B-Instruct-2507和Qwen3-32B-Non-thinking,并取得了幾乎與參數(shù)規(guī)模更大的Qwen3-235B-A22B-Instruct-2507模型相近的結(jié)果。

只有在面向大模型的綜合性評測基準(zhǔn)、高難度數(shù)學(xué)推理基準(zhǔn)AIME25中,指令模型的表現(xiàn)略遜色于Qwen3-235B-A22B-Instruct-2507,在編程、復(fù)雜問答與長對話的評測中表現(xiàn)更好。

Qwen3-Next-80B-A3B-Instruct在RULER上所有長度的表現(xiàn)明顯優(yōu)于層數(shù)相同、注意力層數(shù)更多的Qwen3-30B-A3B-Instruct-2507,甚至在256k范圍內(nèi)都超過了層數(shù)更多的Qwen3-235B-A22B-Instruct-2507。

思維模型的表現(xiàn)優(yōu)于預(yù)訓(xùn)練成本更高的Qwen3-30B-A3B-Thinking-2507、Qwen3-32B-thinking,全面超過了谷歌的閉源模型Gemini-2.5-Flash-Thinking,并在部分指標(biāo)上接近阿里最新旗艦?zāi)P蚎wen3-235B-A22B-Thinking-2507。

二、混合注意力、MoE、穩(wěn)定優(yōu)化、多Token預(yù)測加持

研究人員在博客中提到,Qwen3-Next是針對大模型在上下文長度和總參數(shù)兩方面不斷擴(kuò)展(Scaling)的未來趨勢而設(shè)計。

Qwen3-Next采用的是Qwen3 36T預(yù)訓(xùn)練語料的一個均勻采樣子集,包含15T tokens。其訓(xùn)練所消耗的GPU Hours不到Qwen3-30A-3B的80%;與Qwen3-32B相比,僅需9.3%的GPU計算資源,即可實(shí)現(xiàn)更優(yōu)的模型性能。

這一模型結(jié)構(gòu)相較其4月底推出的Qwen3的MoE模型,新增了多種新技術(shù)并進(jìn)行了核心改進(jìn),包括混合注意力機(jī)制、高稀疏度MoE結(jié)構(gòu)、一系列訓(xùn)練穩(wěn)定友好的優(yōu)化,以及提升推理效率的多Token預(yù)測(MTP)機(jī)制等。

混合注意力機(jī)制:用Gated DeltaNet(線性注意力)和Gated Attention(門控注意力)的組合替換標(biāo)準(zhǔn)注意力,實(shí)現(xiàn)超長上下文長度的有效上下文建模。

研究人員發(fā)現(xiàn)Gated DeltaNet相比常用的滑動窗口注意力(Sliding Window Attention)和Mamba2有更強(qiáng)的上下文學(xué)習(xí)能力, 并在3:1的混合比例下,即75%層使用Gated DeltaNet,25%層保留標(biāo)準(zhǔn)注意力,能一致超過超越單一架構(gòu),實(shí)現(xiàn)性能與效率的雙重優(yōu)化。

同時在保留的標(biāo)準(zhǔn)注意力中,研究人員進(jìn)一步引入多項(xiàng)增強(qiáng)設(shè)計,包括沿用先前工作的輸出門控機(jī)制,緩解注意力中的低秩問題,將單個注意力頭維度從128擴(kuò)展至256,僅對注意力頭前25%的位置維度添加旋轉(zhuǎn)位置編碼,提高長度外推效果。

高稀疏度混合專家(MoE):在MoE層中實(shí)現(xiàn)極低的激活比率,大幅減少每個token的FLOPs,同時保留模型容量。研究人員的實(shí)驗(yàn)表明,在使用全局負(fù)載均衡后,當(dāng)激活專家固定時,持續(xù)增加專家總參數(shù)可帶來訓(xùn)練loss的穩(wěn)定下降。

此前,Qwen3系列的MoE專家激活比約為1比16,Qwen3-Next實(shí)現(xiàn)了1比50的激活比。

穩(wěn)定性優(yōu)化:包括零中心化和權(quán)重衰減layernorm等技術(shù),以及其他增強(qiáng)穩(wěn)定性以實(shí)現(xiàn)魯棒的預(yù)訓(xùn)練和后訓(xùn)練。研究人員發(fā)現(xiàn),注意力輸出門控機(jī)制能消除注意力池與極大激活等現(xiàn)象,保證模型各部分的數(shù)值穩(wěn)定。

多Token預(yù)測(MTP):提升預(yù)訓(xùn)練模型性能并加速推理,Qwen3-Next特別優(yōu)化了MTP多步推理性能,通過訓(xùn)練推理一致的多步訓(xùn)練,進(jìn)一步提高了實(shí)用場景下的Speculative Decoding接受率。

結(jié)語:3B激活參數(shù)對標(biāo)旗艦?zāi)P停“⒗飸{架構(gòu)創(chuàng)新為模型降本提速Q(mào)wen3-Next的突破點(diǎn)在于同時實(shí)現(xiàn)了大規(guī)模參數(shù)容量、低激活開銷、長上下文處理與并行推理加速。此外結(jié)合注意力機(jī)制、MoE設(shè)計等方面的多項(xiàng)架構(gòu)創(chuàng)新,阿里通義此次實(shí)現(xiàn)僅激活3B參數(shù)模型就能對標(biāo)規(guī)模更大模型的性能,使得模型在性能與效率之間找到更佳平衡點(diǎn),同時為降低模型訓(xùn)練、推理成本提供了有效路徑。 研究人員在博客提到,未來他們將持續(xù)優(yōu)化這一架構(gòu)并開發(fā)Qwen3.5。與此同時近期阿里通義已經(jīng)推出數(shù)個不同領(lǐng)域的模型,如超萬億參數(shù)的Qwen3-Max-Preview、文生圖及編輯模型Qwen-Image-edit、語音識別模型Qwen3-ASR-Flash等。隨著其多領(lǐng)域模型的持續(xù)落地與開源,阿里通義在開源社區(qū)的技術(shù)影響力正逐步增強(qiáng)。

關(guān)鍵詞: 指令 推理 參數(shù) 模型 上下文 Qwen tokens -Next 大事 阿里 注意力 Next 模型 Qw

責(zé)任編輯:孫知兵

免責(zé)聲明:本文僅代表作者個人觀點(diǎn),與太平洋財富網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容。
如有問題,請聯(lián)系我們!

精彩推薦

關(guān)于我們 - 聯(lián)系方式 - 版權(quán)聲明 - 招聘信息 - 友鏈交換 - 網(wǎng)站統(tǒng)計
 

太平洋財富主辦 版權(quán)所有:太平洋財富網(wǎng)

?中國互聯(lián)網(wǎng)違法和不良信息舉報中心中國互聯(lián)網(wǎng)違法和不良信息舉報中心

Copyright© 2012-2020 太平洋財富網(wǎng)(m.168online.cn) All rights reserved.

未經(jīng)過本站允許 請勿將本站內(nèi)容傳播或復(fù)制 業(yè)務(wù)QQ:3 31 986 683

 

黄色大片在线看| 日本大胆欧美人术艺术动态| 日韩欧美在线番号| 四虎精品影院在线观看视频| 久草福利资源在线观看| 亚洲第一中文av| 日韩在线导航| 91高清视频免费| 日韩经典中文字幕| 欧美日韩综合视频网址| 久久亚洲综合色| 日韩黄色在线观看| 日韩精品诱惑一区?区三区| 写真福利精品福利在线观看| 欧美日韩国产综合视频| 福利小视频网站| 国色天香一二三期区别大象| 91丝袜一区二区三区| 亚洲一区二区三区蜜桃| 伊人国产在线视频| 女人床在线观看| 国产综合av一区二区三区| 97在线免费观看视频| 亚洲精品视频网上网址在线观看| 日韩欧美高清视频| 中文字幕一区二区三区在线不卡 | 337p日本欧洲亚洲大胆张筱雨| 亚洲国产精品影视| 国产在线一区二区三区欧美| 欧美最猛性xxxx| 久久国产天堂福利天堂| 日韩成人av在线播放| 欧美亚洲高清一区| 午夜精品久久久久久久久久久| 欧美国产精品中文字幕| 成人毛片视频在线观看| 蜜桃视频免费观看一区| 亚洲三级观看| 欧美久久视频| 日本一区二区免费高清| 嫩草国产精品入口| 麻豆精品久久| av日韩在线免费观看| 成人小电影网站| 久久久久黄久久免费漫画| 福利在线观看| 国产网站在线播放| 欧美女子与性| 毛片网站在线| 伊人永久在线| 午夜成人影视| 深夜福利视频在线观看| 一级片免费视频| 黄色网址三级| 99久热re在线精彩视频| 国产午夜视频| 午夜在线不卡| 在线中文字幕观看| 亚洲色图另类色图| 男人天堂网在线观看| 欧美偷拍视频| 国产黄在线看| 黄色网在线免费看| www.久久久久.com| 女人黄色免费在线观看| 182在线视频观看| 川上优av中文字幕一区二区| √8天堂资源地址中文在线| 不卡的av影片| 中日韩脚交footjobhd| 男人最爱成人网| 亚洲视频资源| 97se亚洲国产一区二区三区| 98视频精品全部国产| 国产精品久久久久久久久久白浆| 久久影视三级福利片| 亚洲精品**不卡在线播he| 色愁久久久久久| 成人精品电影| 亚洲无线一线二线三线区别av| 最新国产精品| 欧美精品福利| 亚洲作爱视频| 国产一区二区三区国产| 国产老女人精品毛片久久| 国产在线日韩欧美| 白白色 亚洲乱淫| 国产电影一区二区三区| 成人福利视频网站| 亚洲人体在线| av免费在线一区| 香蕉大人久久国产成人av| 国产图片一区| 俺要去色综合狠狠| 亚洲黄色高清| 日韩成人午夜电影| 2021中文字幕一区亚洲| 亚洲欧美日韩在线播放| 91国产视频在线观看| 亚洲第一精品福利| 久久国产精品亚洲| 国产在线久久久| 色噜噜色狠狠狠狠狠综合色一| 波多野结衣av一区二区全免费观看| 欧美网站免费观看| 亚洲天堂美女视频| 欧美成人片在线观看| 中文字幕理论片| 亚洲最新永久观看在线| 青草视频.com| 高清av在线| 国产人妖一区| 欧美国产美女| 激情成人综合网| 亚洲色图制服诱惑| 日韩午夜电影在线观看| 欧美高清视频在线观看| 91青青草免费在线看| 在线视频亚洲自拍| 国产在线视频三区| 久久99久久98精品免观看软件| 中文字幕乱伦视频| 国产麻豆高清视频在线第一页| 色老板亚洲精品一区| 欧美日韩经典丝袜| 成人午夜网址| 鲁大师成人一区二区三区| 久久久久一区二区三区四区| 日本道在线观看一区二区| 中文日韩电影网站| 91九色视频在线观看| 妞干网在线观看视频| 亚洲自拍偷拍一区二区| 国产精品sm调教免费专区| 韩日中文字幕第一页| 新版中文字幕在线资源| 91精品国产经典在线观看| 999久久久免费精品国产| 国产精品99久久久久久似苏梦涵| 亚洲综合成人在线视频| 亚洲欧洲日产国产网站| 亚洲自拍偷拍色片视频| 成年人黄色片视频| 亚洲精品卡一卡二| 日本1区2区3区视频| 在线观看理论片| 六九午夜精品视频| 一本色道久久综合| 亚洲精品免费视频| 深夜福利国产精品| 欧美亚洲丝袜| 成人手机在线免费视频| 国产成人麻豆精品午夜在线 | 中文字幕亚洲精品| 成人xxxxx色| 欧美成人三级在线播放| 日本熟妇成熟毛茸茸| xxx国产hd| 岛国中文字幕在线| 99成人超碰| 亚洲精品aa| 欧美freesex交免费视频| 久久九九全国免费| 亚洲美女www午夜| 国产精品毛片va一区二区三区| 北条麻妃av高潮尖叫在线观看| 欧美人妻精品一区二区免费看| 天堂√最新版中文在线| 久久精品色图| 婷婷精品在线观看| 2023国产一二三区日本精品2022| 欧美精品一区二区高清在线观看| 亚洲最大的成人网| 女女调教被c哭捆绑喷水百合| 国产视频在线一区| 欧美成人片在线| 亚洲综合福利| 久久―日本道色综合久久| 日韩福利在线播放| 日韩aⅴ视频一区二区三区| 亚洲成人黄色av| 国内精品免费视频精选在线观看| 免费av不卡在线观看| 亚洲精品日韩久久| 欧美亚洲国产怡红院影院| 国产成一区二区| 日本高清久久久| av在线亚洲天堂| 福利在线视频导航| 欧美黄色免费| 在线影院国内精品| 成人免费黄色网| 逼特逼视频在线观看| 嫩草影院永久一二三入口| 欧美亚洲系列| 日本亚洲免费观看| 欧美成人一区二区三区| 麻豆精品传媒视频| 玖玖爱免费视频| 91黑丝在线| 亚欧日韩另类中文欧美| 国产精品国产精品国产专区不蜜 | 无码人妻一区二区三区在线| 中文字幕第8页| 国产欧美一区二区三区精品酒店| 久久 天天综合| 亚洲国产精品va在线观看黑人| 欧美日韩在线观看一区二区三区| 久久高清内射无套| xxxx69视频| 欧美猛男做受videos| 一级中文字幕一区二区| 国产成人一区二区三区小说| 色欲欲www成人网站| 九九精品视频在线观看九九| 精品69视频一区二区三区| 91蝌蚪porny| 欧美精品videossex88| 色悠悠久久综合网| 亚洲视频网站在线| 丝袜美腿一区| 99re6这里只有精品视频在线观看| 日韩小视频在线观看| 黄色片久久久久| 少妇高潮一区二区三区99小说| 91九色美女在线视频| 蜜桃av一区二区在线观看| 亚洲国产精品va在线看黑人| 人人妻人人澡人人爽欧美一区| 中国老头性行为xxxx| 麻豆传媒在线观看| 国产一区欧美二区| 久久精品电影网| 樱花草www在线| 在线看黄网址| 欧美综合自拍| 在线一区二区视频| 2025韩国大尺度电影| va视频在线观看| 欧美1级2级| 亚洲视频一区在线| 91偷拍精品一区二区三区| 久久99久久久| 欧美日韩视频在线播放| 黑人精品欧美一区二区蜜桃| 久久成人国产精品| 北京富婆泄欲对白| 黄网站色大毛片| 99精品久久| 日韩色av导航| 亚洲做受高潮无遮挡| 黑巨人与欧美精品一区| 午夜久久黄色| 亚洲人成网7777777国产| 色噜噜狠狠一区二区| 再深点灬舒服灬太大了少妇| 欧美男gay| 欧美本精品男人aⅴ天堂| 日韩av在线综合| 7799国产精品久久久久99| 欧美日韩一区二区综合| 精品美女在线观看| 182午夜在线观看| 先锋av在线资源| 亚洲美女一区| 久久天天躁狠狠躁老女人| 亚洲制服丝袜在线播放| 又黄又爽在线免费观看| 免费成人在线观看视频| 久久久久久久电影一区| 国产精品视频看看| 里番在线观看网站| 欧美经典一区二区| 开心色怡人综合网站| 国产极品999| 超碰地址久久| 日韩欧美自拍偷拍| 五月六月丁香婷婷| 一本大道香蕉久久| 狠狠色综合日日| 国产精品第2页| 欧美a∨亚洲欧美亚洲| segui88久久综合9999| 亚洲激情综合网| 色香蕉在线观看| 国产精品第八页| 亚洲三级毛片| 午夜精品久久久久久99热软件| 久草网站在线观看| 欧美sm一区| 欧美日韩一区二区三区| 天堂…中文在线最新版在线| 免费黄网在线看| 久久国产精品99国产| 青草成人免费视频| 天天综合久久综合| 日本一区二区乱| 精品国产一区二区三区久久影院 | 国产日韩亚洲精品| 少妇av在线播放| 久久久久久久久久久久久久| 欧美xxxx14xxxxx性爽| 精品午夜福利视频| 亚洲tv在线| 亚洲精品一区二区三区四区高清 | 国产成人av福利| 国产一区二区三区色淫影院| 亚洲欧美日韩免费| 91久久高清国语自产拍| 国产亚洲精品久久久| 中文乱码人妻一区二区三区视频| a√在线中文网新版址在线| 日韩美女视频一区二区| 精品免费久久久久久久| 岛国爱情动作片在线| 久久在线91| 日韩大片在线播放| 亚洲婷婷综合久久一本伊一区| 欧美黄在线观看| 羞羞视频在线免费看| av影视在线| 婷婷激情综合网| 爱情岛论坛亚洲首页入口章节| 成视频在线观看免费观看| 国产精品一区二区不卡| 国产厕所精品在线观看| 美女被男人操网站| 久久婷婷影院| 国产精品美女久久久久av福利| 中文字幕亚洲免费| 你懂的亚洲视频| 国产精品一区久久| 中文字幕在线免费视频| 国产日韩综合| 97av自拍| 91.www| 国产高清不卡二三区| 九色综合日本| 黄色网址电影| 国产亚洲欧美日韩俺去了| 青青视频免费在线观看| 一级毛片免费在线| 亚洲情趣在线观看| 欧美一级特黄aaa| 91豆花视频在线播放| 欧美电影精品一区二区| 少妇人妻丰满做爰xxx| 精品一区二区三区视频在线播放| 亚洲国产成人精品电影| 手机在线免费看毛片| 波多野结衣在线一区二区| 久久影院在线观看| 中文在线资源天堂| 综合天堂av久久久久久久| 91视频国产一区| 欧美6699| 国产传媒久久文化传媒| 亚洲区成人777777精品| 黄色漫画在线免费观看| 国产精品久久久久永久免费观看 | 色综合色综合久久综合频道88| 成人一二三四区| 国产尤物久久久| 亚洲97在线观看| 亚洲图区综合| 国产精品一区二区无线| 最新视频 - x88av| 国产永久免费高清在线观看| 欧美日韩一区二区三区| www.av天天| 草草视频在线一区二区| 国产精品第100页| 狠狠色噜噜狠狠狠8888米奇| 中文字幕不卡在线观看| gogo亚洲国模私拍人体| 国产电影一区二区三区爱妃记| 久久久99久久精品女同性| 成人免费视频国产免费麻豆| 精品一区二区三区影院在线午夜| 妞干网这里只有精品| 黄色片在线播放| 欧美性色aⅴ视频一区日韩精品| 三级黄色免费观看| 亚洲另类av| 99精彩视频| 色中色777| 亚洲福利视频一区| jizz欧美性20| 精品精品精品| 国产精品女人久久久久久| 成人精品美女隐私视频| 1024成人网| 在线观看国产免费视频| 成人在线视频免费看| 国内精品久久久久久久久| 国产你懂的在线观看| 国产三级精品三级| 久久福利小视频| 97久久亚洲| 国产精品久久久久国产a级|