文丨范東成
2023年的重磅關(guān)鍵詞大模型,2024年熱度未減。
近日,微軟發(fā)布AI閱讀學(xué)習(xí)工具Reading Coach,為學(xué)習(xí)者提供個(gè)性化、定制化的閱讀練習(xí)。Reading Coach包含語音音節(jié)分解、圖片詞典等工具,部分功能由Azure OpenAI提供支持,擁有微軟賬戶的用戶可以免費(fèi)使用。
微軟的動(dòng)作僅是百模大戰(zhàn)棋局下的一角。
據(jù)《北京市人工智能行業(yè)大模型創(chuàng)新應(yīng)用白皮書(2023年)》,從全球范圍看,世界各地均積極推動(dòng)大模型研發(fā)和應(yīng)用,其中美國和中國發(fā)布的通用大模型總數(shù)占全球發(fā)布量的80%;截至2023年10月,國內(nèi)10億參數(shù)規(guī)模以上的大模型廠商及高校院所共計(jì)254家。
相較于技術(shù)突破與廠商競(jìng)爭(zhēng),如今大家的目光更聚焦于落地。微軟發(fā)布Rreading Coach的同時(shí),還有Adobe在視頻剪輯軟件Adobe Premiere Pro中新加入AI驅(qū)動(dòng)音頻編輯功能,以及TikTok開始內(nèi)測(cè)基于大模型Bloom的AI生成歌曲功能。
AI重構(gòu)一切并非夸張之語,搜索引擎的變化亦是明證。1月19日,夸克APP宣布基于自研大模型能力推出全新搜索問答產(chǎn)品元知, 用戶可以在搜索結(jié)果中查看到AIGC總結(jié)提煉出的回答內(nèi)容,再度刷新了搜索的體驗(yàn)和效率。
仍在狂奔的大模型潛能與落地間仍留有巨大縫隙尚待填充。這正指向AI應(yīng)用商業(yè)化的無限可能性,To C則是其中關(guān)鍵一環(huán)。
01大模型應(yīng)用漸次落地大模型走進(jìn)聚光燈下已1年有余。
自2022年11月引發(fā)全球?qū)Υ竽P偷年P(guān)注后,ChatGPT勢(shì)頭迅猛,分別于2023年3月、9月和11月推出了GPT-4、GPT-4V及GPT-4 Turbo。2024年1月,OpenAI又正式上線了GPT Store,允許用戶創(chuàng)建并發(fā)布自己的個(gè)性化GPT應(yīng)用。此外還有meta發(fā)布的開源大模型LLaMA及LLaMA 2,谷歌發(fā)布的Gemini等,均有不小的市場(chǎng)影響力。
國內(nèi)大模型領(lǐng)域肇始于2023年3月百度發(fā)布的文心一言,其后阿里發(fā)布通義千問、騰訊發(fā)布混元大模型、華為發(fā)布盤古大模型,科大訊飛、百川智能、智普AI等也加入混戰(zhàn)。
在2023年8月《生成式人工智能服務(wù)管理暫行辦法》實(shí)施后,各大廠商的大模型產(chǎn)品陸續(xù)通過備案并上線向公眾提供服務(wù)。這意味著大模型能獲得大量真實(shí)數(shù)據(jù)反饋,加快迭代速度。
以百度為例,官方數(shù)據(jù)顯示,截至2023年12月,文心一言用戶規(guī)模已超過1億,基于文心大模型的AI應(yīng)用已超過4000個(gè),應(yīng)用覆蓋效率辦公、AI繪畫、代碼助手、劇本大綱生成器、同聲翻譯等領(lǐng)域。
與文心一言同一批通過備案的科大訊飛星火大模型也在飛速發(fā)展。2023年9月,星火大模型向公眾開放。1個(gè)月后,科大訊飛便發(fā)布了星火大模型的3.0版本。據(jù)官宣,2024年1月30日星火大模型將發(fā)布新的3.5版本。
反饋能夠助推大模型的落地進(jìn)程,比如阿里、華為都曾推出各類行業(yè)大模型。To C的浪潮來得更早。2023年2月,微軟就將ChatGPT背后的技術(shù)嵌入搜索引擎必應(yīng),3個(gè)月后又將必應(yīng)作為ChatGPT的默認(rèn)搜索引擎。微軟還發(fā)布了搭載GPT-4大模型能力的AI助手Copilot,并將之嵌入Word等全家桶軟件中。
可以說,AI與搜索結(jié)合是內(nèi)容形態(tài)的趨勢(shì)之一。大模型的能力正好可以應(yīng)對(duì)互聯(lián)網(wǎng)的海量數(shù)據(jù),搜索則能夠滿足用戶剛需,兩者結(jié)合可以帶來全新的交互體驗(yàn)。
夸克元知即是典型案例——AI幫助用戶綜合了全網(wǎng)的優(yōu)質(zhì)內(nèi)容,用戶可以在搜索結(jié)果中看到AIGC(生成式人工智能)總結(jié)出的相關(guān)內(nèi)容,能夠便捷高效地獲取信息。
比如當(dāng)用戶搜索拍身份證可以留長發(fā)嗎,元知會(huì)依據(jù)政策規(guī)范、本地生活等可靠信息來源,精準(zhǔn)回答可以留長發(fā),并給出需要將頭發(fā)整理好,露出雙耳,不要遮擋眼睛等其他關(guān)鍵信息。
由此,數(shù)據(jù)反饋、功能加強(qiáng)與體驗(yàn)提升在AI與搜索的結(jié)合中形成了正向循環(huán),其用戶價(jià)值和商業(yè)前景自然水漲船高。
02AI產(chǎn)品瞄準(zhǔn)供需匹配AI市場(chǎng)規(guī)模增長趨勢(shì)極為顯著。
咨詢公司弗若斯特沙利文《AI大模型市場(chǎng)研究報(bào)告(2023)》顯示,2022年中國人工智能行業(yè)市場(chǎng)規(guī)模為3716億元,2023年為5323億元,2024年將達(dá)7516億元。報(bào)告表明,大模型實(shí)現(xiàn)了對(duì)傳統(tǒng)AI技術(shù)的突破,未來發(fā)展將趨于通用化和專用化并行。
事實(shí)上,通用化更針對(duì)普通用戶,本質(zhì)上是大模型能力的場(chǎng)景化。
此前走紅的產(chǎn)品Heygen即是如此。2023年10月,大量名人說外語的視頻曝光量激增,視頻中郭德綱、趙本山等人用一口流利的英文說起了段子。這些視頻就來自Heygen——用戶登錄后,上傳一段包含人聲的視頻,Heygen會(huì)翻譯視頻中的聲音內(nèi)容,并生成視頻中說話者講述翻譯后語言的視頻。翻譯后的視頻仍會(huì)保持原視頻的嗓音,口型與翻譯后的語言相匹配。
據(jù)??素?cái)經(jīng)了解,HeyGen的服務(wù)接入了多個(gè)大模型的功能,包括ElevenLabs的語音克隆功能、Wav2Lip的口型同步功能以及ChatGPT-4的語音翻譯功能。除了惡搞這些名人視頻外,HeyGen還被應(yīng)用于個(gè)人創(chuàng)作者或短劇的視頻語言轉(zhuǎn)換等。這種集成供給切中了真實(shí)的用戶需求。
國內(nèi)大模型To C應(yīng)用也正在走通用化、產(chǎn)品化的道路,特別是圍繞工作、學(xué)習(xí)這些關(guān)鍵場(chǎng)景。譬如主打智能辦公的釘釘魔法棒、專精網(wǎng)文創(chuàng)作的閱文妙筆寫作、提升創(chuàng)作效率的WPS AI等。
作為阿里的創(chuàng)新業(yè)務(wù)之一,夸克在大模型的基礎(chǔ)上升級(jí)了智能搜索、健康、學(xué)習(xí)、網(wǎng)盤、掃描等多項(xiàng)內(nèi)容產(chǎn)品和智能工具,將它們與用戶需求緊密結(jié)合,能夠落到實(shí)實(shí)在在的使用場(chǎng)景中。
比如夸克AI講題助手能為用戶進(jìn)行英語和部分?jǐn)?shù)學(xué)題目的講解。基于大語言模型和視覺技術(shù),AI能夠給用戶提供考點(diǎn)分析詳解步驟答案總結(jié)等詳細(xì)內(nèi)容,幫助用戶了解考點(diǎn)和知識(shí)點(diǎn),理清解題思路。
對(duì)于更為專業(yè)的健康領(lǐng)域,夸克也優(yōu)化了搜索體驗(yàn),通過AIGC首答、夸克健康百科、智能篩查和夸克健康助手等產(chǎn)品來更好地提供服務(wù)。用戶可以通過勾選補(bǔ)充癥狀信息以尋找與自身情況匹配的健康搜索結(jié)果,還能篩選出常見病癥問題實(shí)現(xiàn)精準(zhǔn)查找。
更重要的是,夸克找到了AI產(chǎn)品的真實(shí)落地場(chǎng)景,用戶可以親自感受到AI帶來的效率提升。綜觀整個(gè)國內(nèi)市場(chǎng),能覆蓋學(xué)習(xí)、工作、生活三大核心場(chǎng)景,且用戶數(shù)量過千萬的APP鳳毛麟角,夸克在AI上的能力和速度,頗讓普通用戶受益。
03駛向廣闊藍(lán)海顯而易見,大模型正在改變?nèi)藗兊纳罘绞健?/p>
調(diào)研機(jī)構(gòu)IDC發(fā)布的《2024 AIGC應(yīng)用層十大趨勢(shì)白皮書》指出,AIGC正在工具化,未來的發(fā)展側(cè)重于場(chǎng)景落地和應(yīng)用層面創(chuàng)新;個(gè)人與企業(yè)步入AI助理時(shí)代,人機(jī)協(xié)同將成為新常態(tài)。
以AI圖片生成工具M(jìn)idjourney為例,當(dāng)Midjourney于2023年12月更新至V6版本后,許多用戶都驚呼其生成的圖片過于逼真,有用戶甚至感慨插畫師、攝影師要失業(yè)了。據(jù)海克財(cái)經(jīng)了解,Midjourney可以根據(jù)用戶輸入的具體參數(shù)來滿足要求,包括相機(jī)型號(hào)、鏡頭景別、景深、畫家風(fēng)格等,有的圖片的確足以以假亂真。
微軟Copilot也在擴(kuò)充功能,推出了與Suno AI合作的AI歌曲生成工具。用戶只需要輸入簡短文字描述,Copilot就可以自動(dòng)生成包含器樂、歌詞和演唱的歌曲片段。
同樣基于多模態(tài)能力,夸克的相關(guān)產(chǎn)品著重貼合用戶的具體工作或?qū)W習(xí)場(chǎng)景。比如夸克聽記功能,能夠?qū)崿F(xiàn)高效的音視頻內(nèi)容整理??淇寺犛浛梢跃珳?zhǔn)區(qū)分講話人并進(jìn)行錄音對(duì)應(yīng)轉(zhuǎn)寫,支持中、英、粵等主流語言和方言,語音筆記可以在夸克多端中同步保存。
夸克掃描王還具備了一定的思考能力。當(dāng)遇到被掃描文件有內(nèi)容模糊或陰影遮擋的情況,掃描王會(huì)從從數(shù)據(jù)庫里抽取關(guān)鍵信息,自動(dòng)判定正確文字并且提升清晰度。比如金融術(shù)語PPI指數(shù),意為生產(chǎn)者物價(jià)指數(shù),不少掃描軟件會(huì)自動(dòng)識(shí)別成ppl。而夸克掃描王能夠通過大模型,根據(jù)相關(guān)專業(yè)名詞進(jìn)行精準(zhǔn)識(shí)別。
此外,夸克網(wǎng)盤還推出了AI自然語言搜索功能,輸入簡單描述詞就能快速找到照片、圖片、文檔等資料??梢哉f,夸克通過內(nèi)容產(chǎn)品+智能工具的服務(wù)矩陣直擊用戶痛點(diǎn),以智能助手的形態(tài)為用戶提供獨(dú)到的AI信息服務(wù)體驗(yàn),更好地滿足了用戶對(duì)內(nèi)容的多元需求。
據(jù)清華大學(xué)新聞與傳播學(xué)院新媒體研究中心發(fā)布的《大語言模型綜合性能評(píng)估報(bào)告》,夸克大模型在應(yīng)試和寫作能力,以及醫(yī)療健康領(lǐng)域內(nèi)容可靠性上,均展現(xiàn)出突出優(yōu)勢(shì)。
撬動(dòng)內(nèi)容生產(chǎn)和個(gè)人生活的AIGC已為人們提供了全新視角,頭部玩家則隨之布局,重構(gòu)生態(tài)。應(yīng)用已然百花齊放,而大模型的潛能和價(jià)值正持續(xù)釋放。
看完覺得寫得好的,不防打賞一元,以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。