文:王智遠(yuǎn) | ID:Z201440
早上朋友發(fā)信息給我:
智遠(yuǎn),你可以呀,現(xiàn)在厲害了,不僅寫作,還成了當(dāng)代藝術(shù)家,還去悉尼、新加坡辦畫展,業(yè)務(wù)夠多,忙得過來嗎?
我頓時(shí)不知道怎么回應(yīng),驚訝又好奇的回了句:納尼?
緊接著,朋友發(fā)來一張截圖說:你看。我一看,天吶,AI搜索把我的資料和另一位同名人的資料,混在一起了,太壞了。認(rèn)識我的還行,不認(rèn)識的明顯會被誤導(dǎo)。
這兩年,不少大模型公司布局AI搜索,很多人也感受到技術(shù)帶來的快捷,不過,使用過程中,根本沒意識到信息是否準(zhǔn)確。
所以,怕你被AI誤導(dǎo)。
我抽出時(shí)間,做了一個(gè)簡單科普,比如:AI搜索的決策模型什么樣?為啥機(jī)器味嚴(yán)重?AI搜索和內(nèi)容平臺的關(guān)系是什么?未來搜索會發(fā)生什么革命性變化等等。
畢竟了解底層知識,能夠幫你,更好的用AI搜索。
01
有個(gè)詞叫缸中之腦(Brain in a Vat)。什么意思呢?
想象一個(gè)血腥的畫面:
你(或者別人)被一位瘋狂的科學(xué)家,進(jìn)行一次可怕的實(shí)驗(yàn)。他把大腦從身體上取下來,放進(jìn)一個(gè)裝有維持大腦存活的營養(yǎng)液的玻璃鋼中。
然后,大腦神經(jīng)末梢,鏈接到一臺超級計(jì)算機(jī),計(jì)算機(jī)按照設(shè)定程序,向你的大腦發(fā)送各種信息,讓你以為以前很正常。
那么,對取出來的大腦來說,世界是不是依然和原來的一樣?你看到的人、物體、天空,感受,還有記憶,是不是都還在?
這個(gè)實(shí)驗(yàn),常用來說明懷疑論、唯我論和主觀唯心主義的觀點(diǎn),簡單講:即我所體驗(yàn)的、看到的、到底是真的假的呢?
怕你共情不多,我再舉個(gè)例子:
好不容易休息半天,躺在沙發(fā)上,看著外面陰雨天,突然想到昨天剛上映的恐怖片,還沒看。于是,打開影片,剛看一半,心跳加速,你決定不看了。
為什么?因?yàn)樘植懒?。恐怖畫面的信息,一次次傳遞到缸中之腦,讓你覺得太真實(shí),似乎恐怖畫面馬上要出現(xiàn)在自己身上。
但你知道嗎?這些都是大腦模仿出來的,看似真實(shí),未必真實(shí),我們的感知,不僅由大腦產(chǎn)生,身體,也會影響它。
比如:
521到了,即便沒有見面,你總送心愛的人一些溫暖的東西,一杯奶茶、一束鮮花,她收到禮物那一刻,在遠(yuǎn)方也能感受到你對她的好看。
這就是具身認(rèn)知,是思考,感覺、行為三者共振的結(jié)果,認(rèn)識到它,你能感受到,外面我們接收到的任何信息,故事是一個(gè)個(gè)畫面,所描繪的場景只要大腦熟悉,它都會共鳴。
而AI搜索,是什么呢?本質(zhì)像一個(gè)缸中之腦。
運(yùn)行在一個(gè)強(qiáng)大的模型上,模型像它的基礎(chǔ),幫它站穩(wěn)腳跟,外面信息是它的食物,通過你的搜索,不斷訓(xùn)練自己推理能力。
不論什么AI搜索軟件,當(dāng)你問題時(shí),它都會遵循一個(gè)六步走的公式:
理解問題
檢索信息
整合答案
生成回答
結(jié)果驗(yàn)證
幻想一下,現(xiàn)在來到未來時(shí)代,站在圖書館里,面前有一個(gè)人工智能,現(xiàn)在要找一本《窮查理寶典》,你會怎么做?
你可以手動輸入,或者對著它說:幫我找一本叫《窮查理寶典》。此時(shí),AI會利用語言技術(shù),快速分析你的意圖,提煉出最重要的部分,比如:書名、作者、人名。
然后,它會把你的問題和圖書館里的文檔、圖片快速匹配,從中找出重要的段落和句子。接著,它會做降噪處理,去掉干擾的內(nèi)容,比如廣告、重復(fù)的段落,確保剩下的都是有用的信息。
最后,AI會把所有找到的信息整合起來,生成一個(gè)答案,這就是AI搜索的過程。不難理解吧。
我突然想到一個(gè)畫面:
小時(shí)候,老師經(jīng)常說:哎,你們是我?guī)н^最差的一屆,要是無法理解,就把這段內(nèi)容死機(jī)硬背下來。,可你有沒有想過,考試對死記硬背來說,意圖是什么?
從人工智能角度看,答案只有一個(gè)詞:檢索。
也就是說:你背誦的所有資料,最后一刻,學(xué)校用一張?jiān)嚲韥頇z索大腦有沒有記住,當(dāng)成績達(dá)標(biāo)時(shí),證明你通過了。
02
明白AI搜索的六步公式,能得到什么啟發(fā)呢?有兩點(diǎn):
一,知道AI的回答為什么很干巴,二,知道它為何缺乏情感和個(gè)性。
AI搜索生成邏輯有一些限制,為避免產(chǎn)生錯(cuò)誤信息和不準(zhǔn)確的信息,AI會傾向于保守地給你高頻、標(biāo)準(zhǔn)化的表達(dá)。這種傾向自然會使回答顯得更加刻板。
比如:
你問AI如何做好品牌營銷?它一定會告訴你,首先要了解目標(biāo)市場,然后創(chuàng)建一個(gè)獨(dú)特的品牌定位,接著進(jìn)行市場推廣,最后通過反饋不斷優(yōu)化品牌策略。
另外,作為缸中之腦,AI只有一個(gè)搜索框,無法感受你的語氣,看不到其他信息,所以也無法理解你的情感。
這樣一來,AI生成的答案就缺乏人類的情感色彩和個(gè)性,看起來很機(jī)械,或者像是官方的回答。
值得一提的是:人們常說,一個(gè)人學(xué)習(xí)什么知識,他的見識就有多高。AI也是一樣的。你給它喂草料,它自然吐不出鉆石來。
所以,大公司為了防止AI搜索出來的內(nèi)容很水,就會限制訓(xùn)練內(nèi)容,會給AI喂新聞報(bào)道、學(xué)術(shù)論文和正式文本。這些文本風(fēng)格比較客觀,所以,AI學(xué)完后,回答也會是類似的風(fēng)格。
現(xiàn)在AI搜索雖然看似有推理能力,但我測試了很多,發(fā)現(xiàn)整體推理還是比較弱。
一個(gè)主要原因,人類說話時(shí),本身推理性就不強(qiáng)。所以,AI學(xué)習(xí)的內(nèi)容也會相對較弱。在文字相關(guān)的搜索上,這種情況很常見,理科的內(nèi)容相對更嚴(yán)謹(jǐn)一些。
顯然,缸中之腦就是缸中之腦。看似聰明,但離不開三點(diǎn):一,大模型作為基礎(chǔ),二,固定的模型,三,知識庫。
因此,重要的結(jié)論是:用AI搜索時(shí),你不給它一個(gè)很健全的 prompt,它的解析能力會變得很弱,得到的答案自然很難讓人滿意。
03
你有沒有想過,AI搜索平臺和內(nèi)容生態(tài)到底什么關(guān)系?
我覺得,從過去的傳統(tǒng)搜索,到現(xiàn)在AI搜索,用一句話來形容轉(zhuǎn)變的過程便是:從獨(dú)立到融合,再到獨(dú)立。
為什么呢?
沒有大模型之前,谷歌在1998年開始做大規(guī)模搜索,后來進(jìn)軍中國,由于數(shù)據(jù)方面的問題,谷歌被限制,隨后,百度在2000年快速崛起,靠爬蟲抓取大量網(wǎng)頁,然后分發(fā)和售賣廣告起家。
這兩家公司商業(yè)模式基本相似。
谷歌做了一個(gè)叫Knowledge Graph的知識庫,還有Google Answers,百度則推出了百度知道和百度百科。
后來,國內(nèi)360、搜狗也跟著做類似的產(chǎn)品。網(wǎng)頁時(shí)代落幕,張一鳴用一個(gè)算法推薦,讓今日頭條拔地而起。頭條采用推薦機(jī)制的同時(shí),也嘗試建立內(nèi)容生態(tài)。
比如:
孵化垂類創(chuàng)作者,推出各種與內(nèi)容相關(guān)的產(chǎn)品,但直到現(xiàn)在,我都覺得它還沒成功,今日頭條增長停滯后,頭條搜索也沒法跟著增長。
后來短視頻涌現(xiàn),抖音起來,它建立一個(gè)良好的內(nèi)容生態(tài)和增長模式,所以,抖音搜索成功了。
不管怎么樣,它們的核心目的只有一個(gè),把內(nèi)容控制在自己手里,通過掌握內(nèi)容,建立壁壘,因?yàn)閮?nèi)容生態(tài)對搜索平臺有很大的依賴性。
內(nèi)容提供者,要依靠搜索引擎,來讓內(nèi)容被更多人看到,而搜索引擎,則要高質(zhì)量的內(nèi)容來吸引用戶,并提供有用的搜索結(jié)果。
有了大模型之后呢?
微軟推出新版必應(yīng),緊接著谷歌、百度、360和昆侖萬維等企業(yè)也開始布局AI搜索。
李彥宏一直強(qiáng)調(diào),把生成式AI技術(shù)和搜索深度整合在一起。周鴻祎也說,做搜索引擎的企業(yè),最有機(jī)會研究像ChatGPT這樣的產(chǎn)品,還有昆侖萬維、秘塔AI也在加緊跟上。
不管怎么說,它們有相似之處:整合全網(wǎng)信息,讓用戶用自然語言表達(dá)需求,并提供經(jīng)過組織和提煉的答案,這樣可以減少冗余信息的時(shí)間消耗,確保答案的可追溯性、可信賴性。
不過,盡管這些搜索引擎,憑借原有的知名度、用戶基礎(chǔ)在市場上占據(jù)主導(dǎo)地位,由于移動互聯(lián)網(wǎng)時(shí)代APP的信息孤島現(xiàn)象,它們并沒有完全掌控所有信息,反而,垂直搜索引擎正在逐漸崛起。
比如:
小紅書推出自己的搜索,今日頭條推出豆包,淘寶推出原生AI應(yīng)用——淘寶問問,它嵌入淘寶搜索框,服務(wù)于月活躍用戶近9億、每日產(chǎn)生數(shù)百億次搜索的龐大流量。
現(xiàn)在,抖音搜索量在移動端已經(jīng)超過百度,小紅書通過用戶的真實(shí)分享和有用的筆記,建立了強(qiáng)大的社區(qū)氛圍,這都是各自的優(yōu)勢。
因此,我看到兩種趨勢正在出現(xiàn):一是通用搜索的AI升級,二是垂類搜索的崛起。
垂類搜索數(shù)據(jù),主要來自自己的平臺,類似于站內(nèi)搜索,信息更服務(wù)于細(xì)分場景。當(dāng)信息量足夠多時(shí),就會自然涌現(xiàn)。
長遠(yuǎn)來看,擁有優(yōu)質(zhì)內(nèi)容的社區(qū),做的搜索會更有優(yōu)勢,因?yàn)楹脙?nèi)容平臺能夠吸引和留住用戶,進(jìn)而提升搜索功能的價(jià)值和使用頻率。
明白這些也就理解了,我為什么說,搜索會經(jīng)歷從獨(dú)立到融合,再到獨(dú)立的過程。畢竟,獨(dú)立,是全新的獨(dú)立,是細(xì)分的獨(dú)立。
實(shí)在不信的話了,你想想360AI、秘塔AI,天工AI到底有什么區(qū)別?把它們和淘寶問問、抖音搜索一比更明確呢?因此,未來優(yōu)質(zhì)內(nèi)容社區(qū)的搜索功能將會勝出。
04
到這里,我們可以思考下:AI搜索的本質(zhì)是什么?
我認(rèn)為,AI搜索真正的關(guān)鍵在于AI技術(shù)本身,而不是傳統(tǒng)的搜索方式。這就像AI+和+AI的區(qū)別。
AI+,更像把AI技術(shù)加到已有的系統(tǒng)或產(chǎn)品上。比如,在傳統(tǒng)搜索引擎上加入AI功能,這種方式主要在現(xiàn)有技術(shù)基礎(chǔ)上,增強(qiáng)功能。
+AI,不一樣。
要求從一開始就以AI為核心,建立一個(gè)系統(tǒng)或產(chǎn)品。比如,設(shè)計(jì)一個(gè)完全依賴AI進(jìn)行的搜索引擎,它所有功能都圍繞AI技術(shù)展開,更像是從頭開始,完全依賴AI技術(shù)運(yùn)作。
很顯然,AI+是改進(jìn)現(xiàn)有系統(tǒng),而+AI是從零開始,完全依靠AI技術(shù)。AI搜索真正力量在于后者,也就是+AI。
對于一般簡單問答,AI搜索只彌補(bǔ)傳統(tǒng)搜索的不足。但要真正創(chuàng)新和突破,要尋找新的應(yīng)用場景和特定領(lǐng)域,比如學(xué)術(shù)、醫(yī)療、法律等。這些領(lǐng)域中,AI驅(qū)動的搜索才能真正發(fā)揮戰(zhàn)略意義。
AI原生(AI Native)很重要,因?yàn)榻?jīng)過多年的發(fā)展,傳統(tǒng)方法已經(jīng)挖掘了所有可能性,AI原生的定義是,只有在引入AI能力的情況下,產(chǎn)品才能實(shí)現(xiàn)。
這種情況下,AI是最大的變量,但AI比例并不重要。
關(guān)鍵在于產(chǎn)品需要找到交叉點(diǎn):哪些場景是只有AI才能實(shí)現(xiàn)?同時(shí)又滿足大規(guī)模用戶需求。這種探索越多越快,競爭優(yōu)勢就越大。這也是對各家產(chǎn)品經(jīng)理的巨大考驗(yàn)。
那么,問題來了:
有人會覺得,傳統(tǒng)搜索市場還有價(jià)值嗎?肯定的。
傳統(tǒng)搜索的強(qiáng)項(xiàng)在于尋址和尋找資訊。從商業(yè)角度看,PC端搜索市場增量有限,移動端又被抖音、小紅書等平臺分流,不過,百度財(cái)報(bào)中,搜索引擎依然是基本盤的重要組成部分。
還有人認(rèn)為,谷歌和百度壟斷這么多年,其他玩家還有機(jī)會嗎?來看一組美國statcounter機(jī)構(gòu)的數(shù)據(jù):
截至2024年5月6日,美國搜索市場中,谷歌份額下降到了77.52%,其他市場被Bing和Yahoo蠶食,但谷歌基本盤還算穩(wěn)。國內(nèi)截至4月,電腦端必應(yīng)的份額是37.24%,百度是22.53%,但百度的主導(dǎo)地位已經(jīng)不在了。
雖然數(shù)據(jù)會存在偏差,但能看出搜索市場的變化和機(jī)會,AI搜索更應(yīng)該理解用戶意圖,完成復(fù)雜的任務(wù)。
比如:
用戶搜索不僅僅是尋找信息,還包括找地址,或查找短內(nèi)容的源頭;再比如,通過AI找到過去5年城市人口的發(fā)展趨勢,甚至,搜索新能源汽車的滲透率趨勢和原因。
還有找電影、追溯圖片等等......,所以,需求背后,是AI搜索目前還沒有攻克的場景。
總結(jié)而言
AI+,還是+AI,要看企業(yè)選擇。
不論哪條路,我都認(rèn)為,垂直領(lǐng)域的數(shù)據(jù),將成為重要開采對象,不然怎么向數(shù)據(jù)要增量?那么問題來了:什么樣的垂直數(shù)據(jù)還未被開采呢?嗯,值得思考的問題。
看完覺得寫得好的,不防打賞一元,以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。