來源:互聯(lián)網(wǎng)怪盜團(tuán)
當(dāng)ChatGPT于2022年10月30日橫空出世之時,我跟周圍的很多朋友一樣,幾乎立即成為了它的用戶。我很快認(rèn)識到了AI大模型在生產(chǎn)力方面的巨大潛力,尤其是在翻譯、回復(fù)郵件、撰寫周報、總結(jié)會議紀(jì)要等任務(wù)上。此后大約一年半的時間里,我試用過市面上大部分流行的大模型聊天機(jī)器人,以及基于大模型的生產(chǎn)力工具,其中有些給我留下了深刻印象;但我一直是淺嘗輒止,站在旁觀者的角度進(jìn)行研究和評判,從來沒有在真正的工作任務(wù)上依賴過它們。
為什么?因為AI生產(chǎn)力工具還存在許多缺點。它們普遍無法處理復(fù)雜的、結(jié)構(gòu)化的信息(例如各種文件);它們經(jīng)常產(chǎn)生所謂模型幻覺(即瞎編的夸夸其談);它們無法根據(jù)最新的外部信息調(diào)節(jié)其回答;而且它們的用戶界面往往不夠友好??偠灾鼈兡苡?,但實用價值和可靠性有待提高。就像一支球隊中的青訓(xùn)天才球員,偶爾能靈光一現(xiàn)、讓人眼睛一亮,卻無法成為值得長期依賴的主力球員。相信很多經(jīng)常接觸AI大模型的人,會跟我得出類似的結(jié)論。
然而,現(xiàn)在一切都不同了。今年6月以來,AI大模型開始對我的日常工作發(fā)揮舉足輕重的作用;我已經(jīng)在GPT-4o上面花費了上百小時,在騰訊元寶上面花費了幾十小時,它們分別是我處理英文和中文信息的最重要的生產(chǎn)力工具。我毫不猶豫地開始為GPT-4o付費;可惜元寶還沒有付費選項,不然我肯定會欣然接受。為什么?這是由一系列技術(shù)和產(chǎn)品革新決定的:
現(xiàn)在的大模型普遍具備了多模態(tài)功能,在輸入端和輸出端能同時處理文字、圖片和音頻信息;視頻功能暫時還沒有被整合進(jìn)主流多模態(tài)大模型,但應(yīng)該只是時間問題。
超長文本處理,以及對多種主流文件格式的解析,已經(jīng)成為主流AI產(chǎn)品的標(biāo)配。直接把一個大文件或者網(wǎng)頁鏈接扔給大模型解析的感覺非常好!
對外部信息的搜索和梳理功能也日益強(qiáng)大。上面提到的GPT-4o和元寶都可以隨時發(fā)動AI搜索,整合多個渠道的外部信息,并且列出可追溯的信息來源。
對我而言,從現(xiàn)在開始,AI生產(chǎn)力工具才算越過了從能用到好用的那根金線。這就好像當(dāng)年的法國小將亨利去掉了小將前綴,小小羅在曼聯(lián)晉升為C羅——從靈光一現(xiàn)的神童變成了值得依賴的主力。就在昨天晚上,我與GPT-4o進(jìn)行了兩個多小時的對話,梳理了全球三大云計算平臺(AWS、Azure、GCP)的基礎(chǔ)知識;今天下午,則讓元寶幫忙總結(jié)了幾份很長的券商研究報告,從中找出了幾個值得閱讀的新穎觀點。我有一種越來越強(qiáng)烈的感覺:這就是未來的工作方式,也是AI生產(chǎn)力工具的正確打開方式。它們會幫助我們節(jié)約無數(shù)的時間,徹底改造大部分傳統(tǒng)業(yè)務(wù)流程,把我們的工作效率帶到前所未有的高度。
舉一個剛剛發(fā)生的案例:我詢問騰訊元寶,如何看待未來幾個季度騰訊游戲業(yè)務(wù)的走向。AI深度搜索功能自動啟動(此功能7月1日剛剛上線),在半分鐘內(nèi)搜索了40個信息源,引用了其中4篇作為參考(且附上了鏈接),向我提供了如下結(jié)論:
在DNF手游的推動下,騰訊游戲二季度收入將實現(xiàn)兩位數(shù)的增長;三季度產(chǎn)品排期尚不確定,但是海外市場將驅(qū)動游戲業(yè)務(wù)整體繼續(xù)增長。除了游戲業(yè)務(wù)之外,還應(yīng)該關(guān)注視頻號電商帶貨以及微信搜一搜場景的商業(yè)化,以及對AI算力的持續(xù)投資,乃至AI+游戲等下一代產(chǎn)品。
上圖為元寶APP的一般AI搜索結(jié)果,下圖為深度搜索結(jié)果
(在補(bǔ)充騰訊一季報文件之后,元寶又恰如其分地指出了Supercell和Riot Games對騰訊游戲海外業(yè)務(wù)的重要意義,包括前者的《荒野亂斗》和后者的《無畏契約》,等等。)
對于一個已經(jīng)非常熟悉騰訊及其游戲業(yè)務(wù)的分析師而言,上述分析略嫌粗淺;可是對于一個沒有相關(guān)知識儲備的普通人而言,上述信息已經(jīng)非常有用了。幾乎所有的事實列舉都是正確的,論點和論據(jù)之間的結(jié)構(gòu)關(guān)系明確,語言組織的方式也頗具可讀性。我不禁想起了七年多之前,我剛開始研究包括騰訊在內(nèi)的中國互聯(lián)網(wǎng)行業(yè)時,找資料、整理資料、確定資料可靠性,都是老大難問題;如果當(dāng)時就有生成式AI該多好?。?/p>
值得特別指出的是,與其他具備搜索功能的AI工具相比,元寶有一個巨大優(yōu)勢:對騰訊生態(tài)的信息覆蓋非常完善。眾所周知,微信公眾號一直是中文高質(zhì)量專業(yè)文字信息的主要發(fā)源地,就拿我熟悉的互聯(lián)網(wǎng)、AI行業(yè)來說,幾乎所有的優(yōu)質(zhì)原創(chuàng)文章都來自公眾號;對于上面那個騰訊游戲的話題,元寶援引的4條鏈接,就有兩條來自業(yè)內(nèi)頗具影響力的公眾號。除此之外,根據(jù)我的觀察,元寶似乎對財經(jīng)專業(yè)信息的覆蓋尤其健全,這可能是源自騰訊自選股、騰訊新聞等平臺的財經(jīng)內(nèi)容。我相信,除了財經(jīng)之外,應(yīng)該還有不少其他專業(yè)垂類受益于這種高質(zhì)量的信息覆蓋,這對于生產(chǎn)力應(yīng)用的意義怎么估計都不過分!
AI搜索非常重要,但它不能單獨解決一切問題。長文本理解和文件解析也非常重要,例如在上面的案例中,我手工上傳的騰訊財報PDF文件就發(fā)揮了補(bǔ)充作用;其實我還可以上傳自己制作的Excel表格文件,讓元寶進(jìn)行更深入的數(shù)據(jù)分析。讓我高興的是,元寶把搜索和長文本/文件解析兩項功能,比較良好的融合了起來。當(dāng)然,必須承認(rèn),與GPT-4o這種全球領(lǐng)先者相比,元寶還是有差距的,在不同信息來源的無縫融合方面還需要提高。不過我相信,這種差距不是出于大模型底層的缺陷,它可以通過良好的產(chǎn)品迭代得到解決。
今年3月的《哈佛商業(yè)評論》刊登了一篇題為《人們究竟如何使用生成式AI》(How People Are Really Using GenAI)的文章,其中提到了幾個有趣的發(fā)現(xiàn):在全球的十多億腦力勞動者當(dāng)中,只有大約15%在使用生成式AI工具。剩下的85%為什么不使用呢?有些是認(rèn)為它們沒有用,有些是因為它們經(jīng)常給出錯誤答案,還有些單純是因為用戶界面不夠友好。時至今日,大模型自身的技術(shù)能力其實已經(jīng)超過了許多重復(fù)性勞動的要求,所以很顯然,問題出在產(chǎn)品端。其實,今年5月13日發(fā)布的GPT-4o就是一個典型的產(chǎn)品創(chuàng)新——它的底層完全是基于已有的GPT-4和DALL.E大模型,只是把多模態(tài)、搜索和文本解析功能做得更好了而已。
因此,我能夠理解,為何騰訊對于混元大模型(元寶就是建立在混元基礎(chǔ)之上)的定位是實用級大模型。以前的大模型產(chǎn)品更像是給極客使用的,很有趣、很值得研究,可是易用性與普適性不足;元寶這樣的產(chǎn)品則是面向每個普通人的。按照我的一位從事AI產(chǎn)品研發(fā)的朋友的話說:元寶的進(jìn)步相當(dāng)快,我指的不是模型側(cè)的進(jìn)步,而是應(yīng)用層面的‘雕花’。從單純的技術(shù)角度看,‘雕花’好像沒什么大不了的,但那是用戶真正關(guān)心的。騰訊最擅長的不就是把用戶體驗做好嗎?我很期待再過幾個月的元寶會是什么樣子。
對于這位朋友的觀點,我還想補(bǔ)充一句:我們都說騰訊擅長產(chǎn)品,這個擅長不僅僅在于重視用戶體驗,也在于把各項功能有機(jī)地捏合為一款產(chǎn)品的能力。例如,在國內(nèi)主流AI產(chǎn)品當(dāng)中,秘塔很擅長搜索,Kimi Chat很擅長長文本分析,這些都得到了用戶的公認(rèn);而騰訊元寶則是兼具了這兩項能力,形成了一條更順暢的工作流,實現(xiàn)了秘塔+Kimi的效果。這背后折射的,是騰訊從QQ到微信、從PC端到移動端一以貫之的產(chǎn)品方法論,以及高度重視實用性的產(chǎn)品經(jīng)理文化。未來的元寶會不會像微信一樣,建立龐大的應(yīng)用生態(tài)、添加越來越多的功能,乃至演化為一個完全融入工作和生活的AI全能助理?會不會與企業(yè)微信、騰訊會議、騰訊文檔等現(xiàn)有的生產(chǎn)力應(yīng)用更深入地融合起來?一切皆有可能,但是最終決定一切的,肯定是用戶的實際需求。
上面說的是比較長期的愿景。在短期,我認(rèn)為AI生產(chǎn)力工具的殺手級功能已經(jīng)出現(xiàn)了,那就是深度搜索、文件解析和多輪對話(記憶)功能的有機(jī)結(jié)合。這三項功能足以有效地總結(jié)外部信息、用戶提供的內(nèi)部信息以及模型自我生成的信息,對它們進(jìn)行高效處理,同時最大限度地排除低質(zhì)量信息和模型幻覺。對于大部分組織和個人而言,這已經(jīng)非常實用了!《哈佛商業(yè)評論》提到的85%的腦力勞動者為什么還不使用生成式AI的主要原因,由此得到了圓滿的解決。
生成式AI對人類工作流程的改變,才剛剛開始。今后還有更多、更復(fù)雜的問題需要解決,但是我們已經(jīng)走在正確的道路上了。我迫不及待想看到各類AI生產(chǎn)力工具百花齊放、爭奇斗妍的那一天——應(yīng)該很快就會到來。那些最先適應(yīng)這個時代的組織和個人,無疑將受益匪淺。
看完覺得寫得好的,不防打賞一元,以支持藍(lán)海情報網(wǎng)揭秘更多好的項目。