科技圈內(nèi)正流行起了使喚 AI 買咖啡。
今年 9 月初,支付寶在Inclusion·外灘大會宣布AI生活管家支小寶上線時,就用支小寶點了一杯星巴克咖啡;10 月 28 日,2024 CNCC 大會上,智譜科技也用其最新的智能體應(yīng)用 AutoGLM 演示點了一杯咖啡。
不只軟件廠商,越來越多的手機廠商演示 AI 功能時,也開始喜歡從點一杯咖啡切入。
10月上旬,vivo 推出的手機智能體——PhoneGPT,也可以聽取用戶指令執(zhí)行買咖啡的操作;10 月下旬,榮耀 CEO 趙明在發(fā)布會現(xiàn)場也在使用智能助手 YOYO 一句話點咖啡。
從最開始僅支持對話輸出內(nèi)容的生成式 AI(Generative AI),到能幫人執(zhí)行具體事務(wù)的代理式 AI(AI Agent),各家企業(yè)的產(chǎn)品演示方式具體落地到了點一杯咖啡這樣的小事上。
AI 的想象當(dāng)然并不止于此,除了點咖啡,大廠們無疑期望著讓 AI 能跑腿干更多的活,一句話就能自動幫你點外賣、訂酒店、買東西。只是相較于 Agent 這樣廣義而模糊的詞匯而言,辦事型AI 顯然有著更低的理解和認同門檻。
隨著辦事型 AI 越來越琳瑯滿目之余,業(yè)內(nèi)也在開始思考:軟硬件都有各自不可替代的優(yōu)勢,各方如何打通生態(tài)的壁壘,真正為用戶提供有用且便捷的服務(wù)。
01、辦事 AI ,能干比會說更實在
過去一兩年,主要占據(jù)行業(yè)視野的是生成式 AI ,但現(xiàn)在單純的生成式 AI 已無法充分滿足C端用戶對AI落地的需求。
此前《新立場》的文章中就提到,生成式 AI 和代理式 AI 是人工智能領(lǐng)域中兩個不同的方向,前者主要通過學(xué)習(xí)數(shù)據(jù),生成輸出新內(nèi)容(文本、圖像、音頻等),最常見的應(yīng)用就是聊天機器人;后者不僅能聊天,還更側(cè)重于模擬智能行為,與環(huán)境進行交互,并根據(jù)收集的數(shù)據(jù)作出決策并執(zhí)行任務(wù)。
代理式 AI 可以視為生成式 AI 的遞進。顯而易見,由于 OpenAI 的 ChatGPT 爆火,為AI點明了一個發(fā)展方向,所以過去一兩年國內(nèi)對于 AI To C 的探索,大多是圍繞生成式 AI 來的。而在技術(shù)逐漸落地并面向廣大 C 端用戶時,光是會聽會說的生成式 AI 已然不夠,AI 需要幫人干更多的事情。
于是,各大廠商開始逐步關(guān)注代理式 AI 。
這不僅是因為行業(yè)感知到了用戶需求的進化。生成式 AI 的壁壘在于模型的效果和數(shù)據(jù)的質(zhì)量,而代理式 AI 的壁壘則在于生態(tài)的豐富性和聯(lián)通性。經(jīng)歷了剛開始的百模大戰(zhàn),到現(xiàn)在的相對冷靜期,廠商們逐漸清楚,在具體的AI應(yīng)用落地側(cè),單純的卷生成式 AI已經(jīng)不夠了,AI怎么真正服務(wù)生活變得更加重要,上一個移動互聯(lián)網(wǎng)時代在各行各業(yè)積累的生態(tài),對于 AI 來說,是一片幾乎未曾開發(fā)的沃土。
近期,似乎越來越多的廠商也意識到了,發(fā)展代理式 AI 從一件具體小事切入的重要性。
就以 9 月支小寶的那場發(fā)布會為例,發(fā)布會結(jié)束后,讓 AI 買咖啡在科技圈媒體圈都成為熱議話題。此后的榮耀發(fā)布會,甚至出現(xiàn)了榮耀CEO趙明用 AI下單 2000 杯咖啡的演示。
畢竟買咖啡這樣的行為,可以同時滿足用戶和廠商現(xiàn)階段的核心需求:在用戶看來,一句話一杯咖啡的成本就可以體現(xiàn) AI 的辦事效率是否有所進步;而在廠商看來,用 AI 買咖啡的行為,囊括了代理式 AI 所有的關(guān)鍵流程。
借由讓 AI 買咖啡,一句話讓AI辦事有了更形象且落地的案例,也有了未來更多的想象。
02、能力測評,技術(shù)生態(tài)各有所長
當(dāng)我們想要找一個詞匯形容這類代理式 AI 時,也會自然而然發(fā)現(xiàn),辦事 AI 比 agent 本身更具體,也更有本土特色。
目前辦事AI可以根據(jù)廠商性質(zhì)分為三大類,平臺、硬件、大模型類。以用戶買咖啡這一場景為例,對比三個類型的辦事 AI 具體異同點如下圖。
互聯(lián)網(wǎng)平臺類如支付寶推出的支小寶,當(dāng)用戶下達指令,支小寶會調(diào)取出相應(yīng)的服務(wù),如買咖啡、訂機票、打車等,在App內(nèi)能完成從點單到支付的全流程。從目前測試結(jié)果來看,調(diào)取的服務(wù)和支持的城市仍在逐步開放中。
支小寶的優(yōu)勢是生態(tài)的豐富性。今年 4 月,支付寶開始灰度測試一款全新的智能助理,首頁下拉就能體驗,這就是現(xiàn)在的支小寶前身。直到 9 月,支小寶作為一款生活服務(wù)類的獨立 App 正式推出,基于支付寶豐富的服務(wù)生態(tài),用戶只需要簡單說句話,便可喚起海量的極致服務(wù)。
可以說,作為一款國民級應(yīng)用,支付寶 400 多萬的小程序,以及超 8000 項的數(shù)字生活服務(wù),無疑是支小寶可以持續(xù)深耕的沃土。而支小寶未來的優(yōu)勢,則在于其可以橫跨不同的硬件平臺,讓盡可能多的人用上AI服務(wù)。
硬件類如榮耀YOYO,當(dāng)用戶使用手機助手語音下達指令后,AI助手會模擬用戶屏幕交互行為,自動點擊屏幕來調(diào)取應(yīng)用,找到應(yīng)用中的商戶并自動下單,最后需要用戶確認支付。
不同于支小寶這樣的獨立 app,榮耀YOYO等此類手機的AI助手 ,可以從手機系統(tǒng)層面去調(diào)用手機內(nèi)的其他 app 或服務(wù),可以視為此前手機語音助手的升級版。當(dāng)然,這類硬件廠商 AI 產(chǎn)品的優(yōu)勢就是占據(jù)用戶入口,以及硬件對于 app 的調(diào)用權(quán)限。
但劣勢在于持續(xù)優(yōu)化迭代的門檻高,廠商可能要為此投入高性能芯片,研發(fā)配套的操作系統(tǒng)等,同時還要考慮用戶更換新手機的情況。因此手機廠商需要不斷地在產(chǎn)品、成本與性能之間尋求平衡,進一步探索AI Agent的應(yīng)用潛力。
比如十月在榮耀 Magic7發(fā)布會之前,榮耀就已提前發(fā)布AI操作系統(tǒng) MagicOS 9.0,并在發(fā)布會上跟升級成智能體的 YOYO 一起亮相。
更不用說蘋果為了給 AI 鋪路,除了發(fā)布適配 AI 的新手機、新系統(tǒng),近期還推出了搭載全新 M4 芯片的 Mac 系列產(chǎn)品,被外界視為進一步向 AI PC 邁進。
由于付出的成本更大,現(xiàn)在硬件類的辦事 AI,每一步走得更加謹慎。
而對于既不占據(jù)用戶入口,又沒有生活服務(wù)生態(tài)的大模型廠商來說,做辦事 AI 仍具有一定的優(yōu)勢,就是既可以像硬件廠商一般模擬用戶對屏幕的交互行為,但又不受硬件廠商的品牌限制,探索成為一個上下游都開放的平臺。
如智譜科技的 AutoGLM ,用戶下達指令后,應(yīng)用也會模擬用戶屏幕交互行為來調(diào)取其他應(yīng)用,中間需要用戶干預(yù)進行關(guān)鍵操作,最后需要用戶確認支付。從定位來看,大模型類廠商的辦事 AI 介于硬件類和平臺類之間。
03、互聯(lián)互通,入口要廣應(yīng)用要多
如果要對各類辦事 AI 的未來做一個預(yù)測,可以從一些已經(jīng)相對成熟的產(chǎn)品來對比。
比如智能家居或車機的語音控制系統(tǒng),類似生活場景的智能 AI 產(chǎn)品邏輯已經(jīng)很接近我們現(xiàn)在所說的辦事 AI,但仍有局限性。其本質(zhì)上還是在家或車這個封閉環(huán)境中執(zhí)行任務(wù)的,提供服務(wù)相對有限,對AI下指令也相對更簡單。
但是讓AI買咖啡這類事情,顯然發(fā)生在更開放的生活場景中,AI要面對的是更復(fù)雜而多元的真實世界。AI 的一端是用戶個性化的生活,另一端是千行百業(yè)的商家或服務(wù)。
此時硬件廠和平臺廠做辦事 AI ,都會依托自身掌握的其中一端主動權(quán)來發(fā)散。手機、智能穿戴設(shè)備、全屋智能家電、智能汽車等硬件,都是用戶觸達 AI更直接的入口,這是硬件廠的源頭優(yōu)勢。
而像支小寶這樣的AI軟件產(chǎn)品,背靠的支付寶不僅僅是支付平臺,更是國內(nèi)最大的數(shù)字生活服務(wù)平臺,能用AI來調(diào)動更廣大的商家機構(gòu),為用戶提供更便捷絲滑的辦事服務(wù)。這些復(fù)雜的地面基建工作正是平臺在服務(wù)生態(tài)上的優(yōu)勢,畢竟在過去的移動支付時代,支付寶就是這么做的:下場鋪二維碼、建小程序,目前支付寶已擁有400萬個小程序、連接超8000萬商家。
到了 AI 時代,支小寶正用AI 的邏輯重構(gòu)平臺生態(tài)。此前支付寶推出智能體開發(fā)平臺百寶箱,正是讓商家機構(gòu)可以 0 代碼快速創(chuàng)建專屬智能體,并一鍵發(fā)布到支付寶小程序、支付寶App、支小寶App。
目前我們打開支小寶就可以看到,許多第三方服務(wù)商家已經(jīng)有了自己的智能體,比如與黃山景區(qū)推出的黃小松智能體、與杭州文旅推出的杭小憶智能體等。可以預(yù)見未來,其他行業(yè)也會經(jīng)歷從移動互聯(lián)網(wǎng)服務(wù)到智能體服務(wù)的升級蛻變,而這個過程或許比小程序時代來得更快更猛。
然而,正如移動互聯(lián)網(wǎng)的繁榮需要手機廠商與互聯(lián)網(wǎng)平臺的開放協(xié)作,進入AI時代,讓AI真正長出手和腳,融入生活,幫你辦事,也需要多方合力推動。
畢竟,無論是硬件商還是軟件商,各自AI產(chǎn)品執(zhí)行任務(wù)的能力都還需要加強,目前它們都還難以達到一次性拆解復(fù)雜指令并完整執(zhí)行任務(wù)的效果。
比如當(dāng)硬件在調(diào)用軟件時,在多個關(guān)鍵步驟仍然需要用戶介入,智譜的AutoGLM 就跳不過廣告彈窗 ; 而支小寶這樣的軟件調(diào)用支付寶內(nèi)的服務(wù)時,跟商家的協(xié)同也還需進一步建設(shè)。比如當(dāng)用戶需要訂餐但選擇困難,商家是否能根據(jù)用戶的喜好作出智能推薦。
因此,盡管不同類型廠商的辦事 AI 業(yè)務(wù)有所重合,但還遠遠不到爭奪AI入口的階段,在開放場景下的辦事 AI ,無論是軟件和硬件廠都需要對方的能力,來完成辦事流程的閉環(huán)。
硬件廠商需要互聯(lián)網(wǎng)平臺的生態(tài)資源,才能真正深入數(shù)千萬商家機構(gòu),深入生活的肌理,擴大服務(wù)的供給?;ヂ?lián)網(wǎng)平臺的AI產(chǎn)品,也需要與硬件結(jié)合,比如車機、手表、眼鏡等,才能煥新服務(wù)的形式。
此前 ,字節(jié)跳動的豆包就推出了 AI 智能體耳機Ola Friend ,戴上耳機就能查信息、問攻略、學(xué)英語等;Rokid也傳出要跟支小寶合作,佩戴AR眼鏡就能讓AI幫忙點咖啡、打車,實現(xiàn)各種一句話辦事??梢钥闯?,現(xiàn)在各類廠商都在積極探索軟硬件結(jié)合,為辦事AI的落地尋找最優(yōu)的路徑。
如果我們參考移動互聯(lián)網(wǎng)此前十多年的發(fā)展,也會發(fā)現(xiàn)在各大平臺互聯(lián)互通程度不斷的提升下,今天的生活辦事更加便利。而AI要真的為人辦事,繞不開的也是互聯(lián)互通,這很大程度上決定著下一個階段AI ToC的落地速度。
這條路很長,但我們至少知道方向在哪里。硬件廠商的原生智能體與互聯(lián)網(wǎng)平臺的智能體之間如何組合協(xié)同,應(yīng)該遵循什么樣的標(biāo)準(zhǔn),如何進一步塑造上下游生態(tài)模式,都是業(yè)內(nèi)需要思考的問題。
*題圖及文中配圖來源于網(wǎng)絡(luò)。
看完覺得寫得好的,不防打賞一元,以支持藍海情報網(wǎng)揭秘更多好的項目。