Qwen 性能猛獸，簡(jiǎn)單至上

藍(lán)海情報(bào)網(wǎng) 2025-02-27 12:28:51 378

文：王智遠(yuǎn)

我覺(jué)得：

百度、阿里、騰訊、頭條大公司推出模型中，阿里這個(gè) Chatbot頁(yè)面設(shè)計(jì)得足夠簡(jiǎn)潔，可以說(shuō)，最像 ChatGPT的。地址是：https://chat.Qwen.AI

電腦端、手機(jī)端，界面都干凈直觀，效果一致；這種設(shè)計(jì)不是路徑依賴，而是「外形依賴」；模仿 ChatGPT極簡(jiǎn)風(fēng)格，讓用戶覺(jué)得特別方便：想用就直接上手，不用折騰。

整體來(lái)看，這個(gè)平臺(tái)似乎整合了阿里所有模型的能力。

我查了一下最新數(shù)據(jù)，Qwen系列的衍生模型數(shù)量已經(jīng)突破 9 萬(wàn)個(gè)，成為全球開(kāi)源模型數(shù)量的第一名，甚至超過(guò)meta的Llama 系列。

Hugging Face 數(shù)據(jù)也顯示，基于Qwen 系列二次訓(xùn)練的衍生模型高達(dá) 5 萬(wàn)多個(gè)；這說(shuō)明 Qwen 系列在開(kāi)源市場(chǎng)上非常有影響力。

不過(guò)，既然阿里已經(jīng)有通義、夸克這些產(chǎn)品了，為什么又單獨(dú)搞了個(gè) qwen.ai ？這個(gè)地址接入的 9 個(gè)模型到底是干嘛的？

我觀察到，qwen.ai地址更像為想直接使用模型的人設(shè)計(jì)的一個(gè) Chatbot；不過(guò)，這里接入的模型基本是超大模型或高性能模型。

比如：Qwen2.5-Max ，雖然官方?jīng)]明確說(shuō)它是千億參數(shù)模型，但根據(jù)阿里的命名規(guī)則，「Max」通常代表最大參數(shù)規(guī)模，甚至可能接近千億級(jí)別。

而且，模型后面還有一行小字：最強(qiáng)大的千萬(wàn)語(yǔ)言模型。我猜，這個(gè)模型可能是阿里為未來(lái)iPhone智能助手這類場(chǎng)景準(zhǔn)備的。

既然如此，一個(gè)接近千億參數(shù)的模型到底能干嘛呢？我覺(jué)得主要有四點(diǎn)：

首先，它是一個(gè)超大規(guī)模的知識(shí)庫(kù)，世界最大的圖書(shū)館跟它比起來(lái)都顯得小。無(wú)論是醫(yī)生診斷疾病、律師解答法律問(wèn)題，還是科學(xué)家研究新藥，甚至想從一堆文檔里快速找到關(guān)鍵信息，它都能分分鐘給出答案，只有你想不到，沒(méi)有它做不到。

其二，它能幫完成特別復(fù)雜的任務(wù)。

想讓它同時(shí)處理文字、圖片、視頻，生成一些高質(zhì)量的東西，完全沒(méi)問(wèn)題。你也可以給它一些燒腦的問(wèn)題，類似于，預(yù)測(cè)天氣、設(shè)計(jì)新分子結(jié)構(gòu)，它也能幾秒鐘內(nèi)給出答案；我測(cè)試過(guò)幾次，確實(shí)很強(qiáng)大。

第三，它可以扮演各種角色。

什么角色呢？情感導(dǎo)師、畫(huà)畫(huà)、編程？不止如此。昨天，我對(duì)它說(shuō)：你是一名頂級(jí)心理學(xué)研究者，請(qǐng)從專業(yè)角度分析某個(gè)問(wèn)題。它的回答往往讓我眼前一亮，超越了我的認(rèn)知邊界。

再有一點(diǎn)就與科技有關(guān)了。這個(gè)模型能幫你加速科學(xué)發(fā)現(xiàn)。預(yù)測(cè)蛋白質(zhì)折疊、跨領(lǐng)域知識(shí)融合等，它的回答都非常專業(yè)。

所以，一個(gè)千億參數(shù)的模型，不只是「聰明」那么簡(jiǎn)單，更像一個(gè)無(wú)所不能的超級(jí)工具。

我問(wèn)了下它，你的最新知識(shí)庫(kù)時(shí)間是什么時(shí)候，它說(shuō)：2024年12月；這意味著，兩個(gè)月前的知識(shí)都已經(jīng)存儲(chǔ)在它的大腦中。

除Qwen2.5-Max，這里還有Qwen2.5-Plus（擅長(zhǎng)處理復(fù)雜任務(wù)）、Qwen2.5-VL-75B-Instruct （最大視覺(jué)模型）、Qwen2.5-Coder-32B-Instruct （專精編程）等。

我發(fā)現(xiàn)，模型還可以組合使用，比如用 Qwen2.5-Plus 的同時(shí)調(diào)用一個(gè)編程模型。

另外，昨天凌晨 5 點(diǎn)，阿里發(fā)布深度思考 (QwQ) 模型，官方介紹說(shuō)它擅長(zhǎng)數(shù)學(xué)理解、編程和AI 智能體等任務(wù)，如果把它的能力和其他模型結(jié)合起來(lái)，簡(jiǎn)直就是性能小怪獸。

我還注意到，這次新增聯(lián)網(wǎng)搜索功能（之前沒(méi)有），但文生圖、文生視頻功能暫時(shí)還未開(kāi)放；也有用戶反饋說(shuō)推理模型偶爾會(huì)出錯(cuò)，畢竟這是 Preview（預(yù)覽版），還需要時(shí)間進(jìn)一步完善。

盡管如此，即使是千億參數(shù)的大模型，在處理內(nèi)容時(shí)仍然存在幻覺(jué)問(wèn)題。

昨天寫(xiě)一篇文章，誤把 DeepSeek 創(chuàng)始人梁文鋒寫(xiě)成桑文鋒（神策數(shù)據(jù)的創(chuàng)始人）。把 4000 字的內(nèi)容交給模型檢查，結(jié)果它沒(méi)發(fā)現(xiàn)這個(gè)錯(cuò)誤。這種問(wèn)題提醒我們，大模型并非萬(wàn)能。

可能是因?yàn)閮?nèi)容太長(zhǎng)，或者對(duì)話次數(shù)多了，模型就容易「迷糊」了吧。

用 qwen.ai 還有一個(gè)小技巧：如果用蘋(píng)果電腦，覺(jué)得窗口太大影響操作，可以點(diǎn)擊 Safari 瀏覽器右上角，共享按鈕，將頁(yè)面添加到程序塢，然后縮小窗口。這樣桌面就成了一個(gè)高效的工作臺(tái)。

目前它也有一個(gè)痛點(diǎn)：不支持語(yǔ)音輸入。

不過(guò)，這對(duì)我來(lái)說(shuō)不是大問(wèn)題，因?yàn)橐话銜?huì)用豆包的語(yǔ)音功能解決。通過(guò)快捷鍵呼出語(yǔ)音輸入，對(duì)著電腦說(shuō)完后直接轉(zhuǎn)成文字，粘貼過(guò)去就行，非常方便。

快去試試。

看完覺(jué)得寫(xiě)得好的，不防打賞一元，以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。

標(biāo)簽：模型阿里參數(shù) 隨筆