国产精品综合av_日韩精品偷拍一区二区_久草视频资源在线_亚洲视频 中文字幕_亚洲电影AV一区春药高潮_小×导航福利在线导航_欧美性爱一级短视频_人成视频免费在线观看不卡_国产九色在线播放_国产高清无码一区二区

藍(lán)海情報(bào)網(wǎng)

Qwen 性能猛獸,簡(jiǎn)單至上

藍(lán)海情報(bào)網(wǎng) 378

Qwen 性能猛獸,簡(jiǎn)單至上

文:王智遠(yuǎn)

我覺(jué)得:

百度、阿里、騰訊、頭條大公司推出模型中,阿里這個(gè) Chatbot頁(yè)面設(shè)計(jì)得足夠簡(jiǎn)潔,可以說(shuō),最像 ChatGPT的。地址是:https://chat.Qwen.AI

電腦端、手機(jī)端,界面都干凈直觀,效果一致;這種設(shè)計(jì)不是路徑依賴,而是「外形依賴」;模仿 ChatGPT極簡(jiǎn)風(fēng)格,讓用戶覺(jué)得特別方便:想用就直接上手,不用折騰。

整體來(lái)看,這個(gè)平臺(tái)似乎整合了阿里所有模型的能力。

我查了一下最新數(shù)據(jù),Qwen系列的衍生模型數(shù)量已經(jīng)突破 9 萬(wàn)個(gè),成為全球開(kāi)源模型數(shù)量的第一名,甚至超過(guò)meta的Llama 系列。

Hugging Face 數(shù)據(jù)也顯示,基于Qwen 系列二次訓(xùn)練的衍生模型高達(dá) 5 萬(wàn)多個(gè);這說(shuō)明 Qwen 系列在開(kāi)源市場(chǎng)上非常有影響力。

不過(guò),既然阿里已經(jīng)有通義、夸克這些產(chǎn)品了,為什么又單獨(dú)搞了個(gè) qwen.ai ?這個(gè)地址接入的 9 個(gè)模型到底是干嘛的?

我觀察到,qwen.ai地址更像為想直接使用模型的人設(shè)計(jì)的一個(gè) Chatbot;不過(guò),這里接入的模型基本是超大模型或高性能模型。

比如:Qwen2.5-Max ,雖然官方?jīng)]明確說(shuō)它是千億參數(shù)模型,但根據(jù)阿里的命名規(guī)則,「Max」通常代表最大參數(shù)規(guī)模,甚至可能接近千億級(jí)別。

而且,模型后面還有一行小字:最強(qiáng)大的千萬(wàn)語(yǔ)言模型。我猜,這個(gè)模型可能是阿里為未來(lái)iPhone智能助手這類場(chǎng)景準(zhǔn)備的。

既然如此,一個(gè)接近千億參數(shù)的模型到底能干嘛呢?我覺(jué)得主要有四點(diǎn):

首先,它是一個(gè)超大規(guī)模的知識(shí)庫(kù),世界最大的圖書(shū)館跟它比起來(lái)都顯得小。無(wú)論是醫(yī)生診斷疾病、律師解答法律問(wèn)題,還是科學(xué)家研究新藥,甚至想從一堆文檔里快速找到關(guān)鍵信息,它都能分分鐘給出答案,只有你想不到,沒(méi)有它做不到。

其二,它能幫完成特別復(fù)雜的任務(wù)。

想讓它同時(shí)處理文字、圖片、視頻,生成一些高質(zhì)量的東西,完全沒(méi)問(wèn)題。你也可以給它一些燒腦的問(wèn)題,類似于,預(yù)測(cè)天氣、設(shè)計(jì)新分子結(jié)構(gòu),它也能幾秒鐘內(nèi)給出答案;我測(cè)試過(guò)幾次,確實(shí)很強(qiáng)大。

第三,它可以扮演各種角色。

什么角色呢?情感導(dǎo)師、畫(huà)畫(huà)、編程?不止如此。昨天,我對(duì)它說(shuō):你是一名頂級(jí)心理學(xué)研究者,請(qǐng)從專業(yè)角度分析某個(gè)問(wèn)題。它的回答往往讓我眼前一亮,超越了我的認(rèn)知邊界。

再有一點(diǎn)就與科技有關(guān)了。這個(gè)模型能幫你加速科學(xué)發(fā)現(xiàn)。預(yù)測(cè)蛋白質(zhì)折疊、跨領(lǐng)域知識(shí)融合等,它的回答都非常專業(yè)。

所以,一個(gè)千億參數(shù)的模型,不只是「聰明」那么簡(jiǎn)單,更像一個(gè)無(wú)所不能的超級(jí)工具。

我問(wèn)了下它,你的最新知識(shí)庫(kù)時(shí)間是什么時(shí)候,它說(shuō):2024年12月;這意味著,兩個(gè)月前的知識(shí)都已經(jīng)存儲(chǔ)在它的大腦中。

除Qwen2.5-Max,這里還有Qwen2.5-Plus(擅長(zhǎng)處理復(fù)雜任務(wù))、Qwen2.5-VL-75B-Instruct (最大視覺(jué)模型)、Qwen2.5-Coder-32B-Instruct (專精編程)等。

我發(fā)現(xiàn),模型還可以組合使用,比如用 Qwen2.5-Plus 的同時(shí)調(diào)用一個(gè)編程模型。

另外,昨天凌晨 5 點(diǎn),阿里發(fā)布深度思考 (QwQ) 模型,官方介紹說(shuō)它擅長(zhǎng)數(shù)學(xué)理解、編程和AI 智能體等任務(wù),如果把它的能力和其他模型結(jié)合起來(lái),簡(jiǎn)直就是性能小怪獸。

我還注意到,這次新增聯(lián)網(wǎng)搜索功能(之前沒(méi)有),但文生圖、文生視頻功能暫時(shí)還未開(kāi)放;也有用戶反饋說(shuō)推理模型偶爾會(huì)出錯(cuò),畢竟這是 Preview(預(yù)覽版),還需要時(shí)間進(jìn)一步完善。

盡管如此,即使是千億參數(shù)的大模型,在處理內(nèi)容時(shí)仍然存在幻覺(jué)問(wèn)題。

昨天寫(xiě)一篇文章,誤把 DeepSeek 創(chuàng)始人梁文鋒寫(xiě)成桑文鋒 (神策數(shù)據(jù)的創(chuàng)始人)。把 4000 字的內(nèi)容交給模型檢查,結(jié)果它沒(méi)發(fā)現(xiàn)這個(gè)錯(cuò)誤。這種問(wèn)題提醒我們,大模型并非萬(wàn)能。

可能是因?yàn)閮?nèi)容太長(zhǎng),或者對(duì)話次數(shù)多了,模型就容易「迷糊」了吧。

用 qwen.ai 還有一個(gè)小技巧:如果用蘋(píng)果電腦,覺(jué)得窗口太大影響操作,可以點(diǎn)擊 Safari 瀏覽器右上角,共享按鈕,將頁(yè)面添加到程序塢,然后縮小窗口。這樣桌面就成了一個(gè)高效的工作臺(tái)。

目前它也有一個(gè)痛點(diǎn):不支持語(yǔ)音輸入。

不過(guò),這對(duì)我來(lái)說(shuō)不是大問(wèn)題,因?yàn)橐话銜?huì)用豆包的語(yǔ)音功能解決。通過(guò)快捷鍵呼出語(yǔ)音輸入,對(duì)著電腦說(shuō)完后直接轉(zhuǎn)成文字,粘貼過(guò)去就行,非常方便。

快去試試。

看完覺(jué)得寫(xiě)得好的,不防打賞一元,以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。

標(biāo)簽:

ad2

推薦內(nèi)容