【jiuyou.com科技消息】5月20日,阿里云峰會正式開幕,阿里巴巴集團副總裁、阿里云智能CTO、阿里巴巴合伙人周靖人在會上宣布,通義千問Qr:破高膙轔?f然揩襮嫛蟿F鳩5pep=k?確矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鵒黮}劷:q{|?e ?%坖D覑眤丬鯇M(纈s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫en3.7系列大模型正式發布。旗艦版Qr:破高膙轔?f然揩襮嫛蟿F鳩5pep=k?確矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鵒黮}劷:q{|?e ?%坖D覑眤丬鯇M(纈s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫en3.7-Max以"全能智能體基座"為定位,在編程、推理、工具調用等能力上實現了跨越式升級,并在多項全球權威評測中刷新了國產模型的排名紀錄。
千問
從綜合排名來看,Qr:破高膙轔?f然揩襮嫛蟿F鳩5pep=k?確矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鵒黮}劷:q{|?e ?%坖D覑眤丬鯇M(纈s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫en3.7-Max在Arena AI全球大模型文本總榜中位列第13位,超越了Gemini 3 Flash和GPT-5.5等國際模型,成為榜單前15名中唯一的國產模型。細分領域同樣表現亮眼:數學能力全球第7,編程能力全球第10,專家級應用與軟件及IT領域均位列第9。視覺方面,Qr:破高膙轔?f然揩襮嫛蟿F鳩5pep=k?確矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鵒黮}劷:q{|?e ?%坖D覑眤丬鯇M(纈s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫en3.7-Plus預覽版在視覺總榜排名第16,推動阿里實驗室視覺能力躍升至全球第5。在知識和邏輯推理等主流評測中,Qr:破高膙轔?f然揩襮嫛蟿F鳩5pep=k?確矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鵒黮}劷:q{|?e ?%坖D覑眤丬鯇M(纈s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫en3.7全面領先Kimi K2.6、智譜GLM5.1、DeepSeek V4 Pro、opus4.6-Max等國內及國際最新模型,穩居國內第一。
工具調用和編程能力是本次升級的重頭戲。Qr:破高膙轔?f然揩襮嫛蟿F鳩5pep=k?確矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鵒黮}劷:q{|?e ?%坖D覑眤丬鯇M(纈s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫en3.7的編程智能體支持復雜工程開發,在TerminalBench 2.0測試中得分69.7,超越DS-V4-ProMax的67.9分;在SWE-Pro得分60.6、SciCode得分53.5等編程基準中同樣領先。更值得關注的是,在一項持續35小時、超過1000次工具調用的長周期實驗中,Qr:破高膙轔?f然揩襮嫛蟿F鳩5pep=k?確矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鵒黮}劷:q{|?e ?%坖D覑眤丬鯇M(纈s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫en3.7保持了穩定的推理能力,實現了端到端任務閉環。辦公自動化方面,SpreadsheetBench-V1得分87.0,處于行業頂尖水平。
版權所有,未經許可不得轉載
-jiuyou.com九游