業(yè)界首個！阿里云通義千問發(fā)布開源多模態(tài)推理模型QVQ

YE 2024-12-26 10:25:08 0 0 0 生成海報

QVQ是一個會基于視覺進行深度思考推理的大模型，不但能感知更準確的視覺內(nèi)容，并據(jù)此作出更細致的分析推理，還會質(zhì)疑自身假設，仔細審視其推理過程的每一步，經(jīng)過深思熟慮后給出最后結(jié)論。

12月25日，阿里云通義千問發(fā)布業(yè)界首個開源多模態(tài)推理模型QVQ-72B-Preview。

QVQ展現(xiàn)出超預期的視覺理解和推理能力，在解決數(shù)學、物理、科學等領域的復雜推理問題上表現(xiàn)尤為突出。目前，開發(fā)者可在魔搭社區(qū)和HuggingFace平臺上直接體驗。

阿里云通義千問發(fā)布業(yè)界首個開源多模態(tài)推理模型QVQ-72B-Preview

一個月前，通義發(fā)布AI推理模型QwQ-32B-Preview，即斬獲SuperCLUE的AI推理模型榜單「全球開源冠軍」。如今，通義團隊在Qwen2-VL-72B開源模型基礎上，研發(fā)出多模態(tài)推理模型QVQ-72B-Preview，可實現(xiàn)更仔細的逐步推理，視覺推理能力也顯著進步，在解決復雜問題時表現(xiàn)驚艷。多項評測數(shù)據(jù)顯示，QVQ超越了此前的視覺理解模型「開源王者」Qwen2-VL，整體表現(xiàn)與「滿血版」OpenAI o1、Claude3.5 Sonnet等推理模型相當。

在考察模型視覺理解及推理的MMMU評測中，QVQ取得了70.3分，水平已達大學級別；在聚焦數(shù)學的視覺推理測試MathVista中，QVQ得分超過OpenAI o1，印證了其強大的圖形推理能力；在更具多樣性和學科廣度的MathVison評測中，QVQ表現(xiàn)超越Claude3.5及GPT4o，說明QVQ更擅長解決真實數(shù)學問題；在奧賽級別的OlympiadBench基準測試中，QVQ也展現(xiàn)了出色的視覺推理能力。

QVQ是一個會基于視覺進行深度思考推理的大模型。QVQ不但能感知更準確的視覺內(nèi)容，并據(jù)此作出更細致的分析推理，還會質(zhì)疑自身假設，仔細審視其推理過程的每一步，經(jīng)過深思熟慮后給出最后結(jié)論。面對數(shù)學、物理、化學等各科學領域難題，QVQ能像人甚至科學家一樣，給出思考過程和準確答案。

目前，QVQ-72B-Preview已在魔搭社區(qū)和HuggingFace等平臺上開源，開發(fā)者可上手體驗。據(jù)了解，一個月前開源的推理模型QwQ受到全球開發(fā)者熱捧，一發(fā)布就登上HuggingFace模型趨勢榜榜首。截至目前，通義千問Qwen的衍生模型數(shù)突破7.8萬個，已成為全球規(guī)模最大的AI模型群。

來源：阿里云

上一篇：四川省巴中市智算中心暨信創(chuàng)資源池建成投運

下一篇：6000機柜！中核創(chuàng)新云計算綠色智慧數(shù)據(jù)中心園區(qū)項目奠基

發(fā)表評論

業(yè)界首個！阿里云通義千問發(fā)布開源多模態(tài)推理模型QVQ

相關推薦

發(fā)表評論

熱門閱讀

最新資訊

總投資24.5億！哈爾濱空天...

總投資約10億！哈爾濱算網(wǎng)電...

總投資113億！中國建設銀行...

總投資20億！中國電信鄱陽湖...

總投資約10億！ “人工智能...

一期投資10億！時代之門（安...

約2.7億元！廣東移動202...

圖文 | 工信部啟動城域“毫...

業(yè)界首個！阿里云通義千問發(fā)布開源多模態(tài)推理模型QVQ

相關推薦

發(fā)表評論

熱門閱讀

最新資訊

業(yè)界首個！阿里云通義千問發(fā)布開源多模態(tài)推理模型QVQ