大模型產(chǎn)品，疾步如飛

藍(lán)海情報(bào)網(wǎng) 2024-04-28 20:51:11 335

大模型產(chǎn)品，疾步如飛

文丨范東成

2023年的重磅關(guān)鍵詞大模型，2024年熱度未減。

近日，微軟發(fā)布AI閱讀學(xué)習(xí)工具Reading Coach，為學(xué)習(xí)者提供個(gè)性化、定制化的閱讀練習(xí)。Reading Coach包含語音音節(jié)分解、圖片詞典等工具，部分功能由Azure OpenAI提供支持，擁有微軟賬戶的用戶可以免費(fèi)使用。

微軟的動(dòng)作僅是百模大戰(zhàn)棋局下的一角。

據(jù)《北京市人工智能行業(yè)大模型創(chuàng)新應(yīng)用白皮書（2023年）》，從全球范圍看，世界各地均積極推動(dòng)大模型研發(fā)和應(yīng)用，其中美國和中國發(fā)布的通用大模型總數(shù)占全球發(fā)布量的80%；截至2023年10月，國內(nèi)10億參數(shù)規(guī)模以上的大模型廠商及高校院所共計(jì)254家。

相較于技術(shù)突破與廠商競(jìng)爭(zhēng)，如今大家的目光更聚焦于落地。微軟發(fā)布Rreading Coach的同時(shí)，還有Adobe在視頻剪輯軟件Adobe Premiere Pro中新加入AI驅(qū)動(dòng)音頻編輯功能，以及TikTok開始內(nèi)測(cè)基于大模型Bloom的AI生成歌曲功能。

AI重構(gòu)一切并非夸張之語，搜索引擎的變化亦是明證。1月19日，夸克APP宣布基于自研大模型能力推出全新搜索問答產(chǎn)品元知，用戶可以在搜索結(jié)果中查看到AIGC總結(jié)提煉出的回答內(nèi)容，再度刷新了搜索的體驗(yàn)和效率。

仍在狂奔的大模型潛能與落地間仍留有巨大縫隙尚待填充。這正指向AI應(yīng)用商業(yè)化的無限可能性，To C則是其中關(guān)鍵一環(huán)。

01大模型應(yīng)用漸次落地

大模型走進(jìn)聚光燈下已1年有余。

自2022年11月引發(fā)全球?qū)Υ竽Ｐ偷年P(guān)注后，ChatGPT勢(shì)頭迅猛，分別于2023年3月、9月和11月推出了GPT-4、GPT-4V及GPT-4 Turbo。2024年1月，OpenAI又正式上線了GPT Store，允許用戶創(chuàng)建并發(fā)布自己的個(gè)性化GPT應(yīng)用。此外還有meta發(fā)布的開源大模型LLaMA及LLaMA 2，谷歌發(fā)布的Gemini等，均有不小的市場(chǎng)影響力。

大模型產(chǎn)品，疾步如飛

國內(nèi)大模型領(lǐng)域肇始于2023年3月百度發(fā)布的文心一言，其后阿里發(fā)布通義千問、騰訊發(fā)布混元大模型、華為發(fā)布盤古大模型，科大訊飛、百川智能、智普AI等也加入混戰(zhàn)。

在2023年8月《生成式人工智能服務(wù)管理暫行辦法》實(shí)施后，各大廠商的大模型產(chǎn)品陸續(xù)通過備案并上線向公眾提供服務(wù)。這意味著大模型能獲得大量真實(shí)數(shù)據(jù)反饋，加快迭代速度。

以百度為例，官方數(shù)據(jù)顯示，截至2023年12月，文心一言用戶規(guī)模已超過1億，基于文心大模型的AI應(yīng)用已超過4000個(gè)，應(yīng)用覆蓋效率辦公、AI繪畫、代碼助手、劇本大綱生成器、同聲翻譯等領(lǐng)域。

與文心一言同一批通過備案的科大訊飛星火大模型也在飛速發(fā)展。2023年9月，星火大模型向公眾開放。1個(gè)月后，科大訊飛便發(fā)布了星火大模型的3.0版本。據(jù)官宣，2024年1月30日星火大模型將發(fā)布新的3.5版本。

反饋能夠助推大模型的落地進(jìn)程，比如阿里、華為都曾推出各類行業(yè)大模型。To C的浪潮來得更早。2023年2月，微軟就將ChatGPT背后的技術(shù)嵌入搜索引擎必應(yīng)，3個(gè)月后又將必應(yīng)作為ChatGPT的默認(rèn)搜索引擎。微軟還發(fā)布了搭載GPT-4大模型能力的AI助手Copilot，并將之嵌入Word等全家桶軟件中。

可以說，AI與搜索結(jié)合是內(nèi)容形態(tài)的趨勢(shì)之一。大模型的能力正好可以應(yīng)對(duì)互聯(lián)網(wǎng)的海量數(shù)據(jù)，搜索則能夠滿足用戶剛需，兩者結(jié)合可以帶來全新的交互體驗(yàn)。

大模型產(chǎn)品，疾步如飛

夸克元知即是典型案例——AI幫助用戶綜合了全網(wǎng)的優(yōu)質(zhì)內(nèi)容，用戶可以在搜索結(jié)果中看到AIGC（生成式人工智能）總結(jié)出的相關(guān)內(nèi)容，能夠便捷高效地獲取信息。

比如當(dāng)用戶搜索拍身份證可以留長發(fā)嗎，元知會(huì)依據(jù)政策規(guī)范、本地生活等可靠信息來源，精準(zhǔn)回答可以留長發(fā)，并給出需要將頭發(fā)整理好，露出雙耳，不要遮擋眼睛等其他關(guān)鍵信息。

由此，數(shù)據(jù)反饋、功能加強(qiáng)與體驗(yàn)提升在AI與搜索的結(jié)合中形成了正向循環(huán)，其用戶價(jià)值和商業(yè)前景自然水漲船高。

02AI產(chǎn)品瞄準(zhǔn)供需匹配

AI市場(chǎng)規(guī)模增長趨勢(shì)極為顯著。

咨詢公司弗若斯特沙利文《AI大模型市場(chǎng)研究報(bào)告（2023）》顯示，2022年中國人工智能行業(yè)市場(chǎng)規(guī)模為3716億元，2023年為5323億元，2024年將達(dá)7516億元。報(bào)告表明，大模型實(shí)現(xiàn)了對(duì)傳統(tǒng)AI技術(shù)的突破，未來發(fā)展將趨于通用化和專用化并行。

事實(shí)上，通用化更針對(duì)普通用戶，本質(zhì)上是大模型能力的場(chǎng)景化。

此前走紅的產(chǎn)品Heygen即是如此。2023年10月，大量名人說外語的視頻曝光量激增，視頻中郭德綱、趙本山等人用一口流利的英文說起了段子。這些視頻就來自Heygen——用戶登錄后，上傳一段包含人聲的視頻，Heygen會(huì)翻譯視頻中的聲音內(nèi)容，并生成視頻中說話者講述翻譯后語言的視頻。翻譯后的視頻仍會(huì)保持原視頻的嗓音，口型與翻譯后的語言相匹配。

據(jù)?？素?cái)經(jīng)了解，HeyGen的服務(wù)接入了多個(gè)大模型的功能，包括ElevenLabs的語音克隆功能、Wav2Lip的口型同步功能以及ChatGPT-4的語音翻譯功能。除了惡搞這些名人視頻外，HeyGen還被應(yīng)用于個(gè)人創(chuàng)作者或短劇的視頻語言轉(zhuǎn)換等。這種集成供給切中了真實(shí)的用戶需求。

大模型產(chǎn)品，疾步如飛

國內(nèi)大模型To C應(yīng)用也正在走通用化、產(chǎn)品化的道路，特別是圍繞工作、學(xué)習(xí)這些關(guān)鍵場(chǎng)景。譬如主打智能辦公的釘釘魔法棒、專精網(wǎng)文創(chuàng)作的閱文妙筆寫作、提升創(chuàng)作效率的WPS AI等。

作為阿里的創(chuàng)新業(yè)務(wù)之一，夸克在大模型的基礎(chǔ)上升級(jí)了智能搜索、健康、學(xué)習(xí)、網(wǎng)盤、掃描等多項(xiàng)內(nèi)容產(chǎn)品和智能工具，將它們與用戶需求緊密結(jié)合，能夠落到實(shí)實(shí)在在的使用場(chǎng)景中。

比如夸克AI講題助手能為用戶進(jìn)行英語和部分?jǐn)?shù)學(xué)題目的講解。基于大語言模型和視覺技術(shù)，AI能夠給用戶提供考點(diǎn)分析詳解步驟答案總結(jié)等詳細(xì)內(nèi)容，幫助用戶了解考點(diǎn)和知識(shí)點(diǎn)，理清解題思路。

對(duì)于更為專業(yè)的健康領(lǐng)域，夸克也優(yōu)化了搜索體驗(yàn)，通過AIGC首答、夸克健康百科、智能篩查和夸克健康助手等產(chǎn)品來更好地提供服務(wù)。用戶可以通過勾選補(bǔ)充癥狀信息以尋找與自身情況匹配的健康搜索結(jié)果，還能篩選出常見病癥問題實(shí)現(xiàn)精準(zhǔn)查找。

更重要的是，夸克找到了AI產(chǎn)品的真實(shí)落地場(chǎng)景，用戶可以親自感受到AI帶來的效率提升。綜觀整個(gè)國內(nèi)市場(chǎng)，能覆蓋學(xué)習(xí)、工作、生活三大核心場(chǎng)景，且用戶數(shù)量過千萬的APP鳳毛麟角，夸克在AI上的能力和速度，頗讓普通用戶受益。

03駛向廣闊藍(lán)海

顯而易見，大模型正在改變?nèi)藗兊纳罘绞健?/p>

調(diào)研機(jī)構(gòu)IDC發(fā)布的《2024 AIGC應(yīng)用層十大趨勢(shì)白皮書》指出，AIGC正在工具化，未來的發(fā)展側(cè)重于場(chǎng)景落地和應(yīng)用層面創(chuàng)新；個(gè)人與企業(yè)步入AI助理時(shí)代，人機(jī)協(xié)同將成為新常態(tài)。

以AI圖片生成工具M(jìn)idjourney為例，當(dāng)Midjourney于2023年12月更新至V6版本后，許多用戶都驚呼其生成的圖片過于逼真，有用戶甚至感慨插畫師、攝影師要失業(yè)了。據(jù)海克財(cái)經(jīng)了解，Midjourney可以根據(jù)用戶輸入的具體參數(shù)來滿足要求，包括相機(jī)型號(hào)、鏡頭景別、景深、畫家風(fēng)格等，有的圖片的確足以以假亂真。

大模型產(chǎn)品，疾步如飛

微軟Copilot也在擴(kuò)充功能，推出了與Suno AI合作的AI歌曲生成工具。用戶只需要輸入簡短文字描述，Copilot就可以自動(dòng)生成包含器樂、歌詞和演唱的歌曲片段。

同樣基于多模態(tài)能力，夸克的相關(guān)產(chǎn)品著重貼合用戶的具體工作或?qū)W習(xí)場(chǎng)景。比如夸克聽記功能，能夠?qū)崿F(xiàn)高效的音視頻內(nèi)容整理?？淇寺犛浛梢跃珳?zhǔn)區(qū)分講話人并進(jìn)行錄音對(duì)應(yīng)轉(zhuǎn)寫，支持中、英、粵等主流語言和方言，語音筆記可以在夸克多端中同步保存。

夸克掃描王還具備了一定的思考能力。當(dāng)遇到被掃描文件有內(nèi)容模糊或陰影遮擋的情況，掃描王會(huì)從從數(shù)據(jù)庫里抽取關(guān)鍵信息，自動(dòng)判定正確文字并且提升清晰度。比如金融術(shù)語PPI指數(shù)，意為生產(chǎn)者物價(jià)指數(shù)，不少掃描軟件會(huì)自動(dòng)識(shí)別成ppl。而夸克掃描王能夠通過大模型，根據(jù)相關(guān)專業(yè)名詞進(jìn)行精準(zhǔn)識(shí)別。

此外，夸克網(wǎng)盤還推出了AI自然語言搜索功能，輸入簡單描述詞就能快速找到照片、圖片、文檔等資料?？梢哉f，夸克通過內(nèi)容產(chǎn)品+智能工具的服務(wù)矩陣直擊用戶痛點(diǎn)，以智能助手的形態(tài)為用戶提供獨(dú)到的AI信息服務(wù)體驗(yàn)，更好地滿足了用戶對(duì)內(nèi)容的多元需求。

據(jù)清華大學(xué)新聞與傳播學(xué)院新媒體研究中心發(fā)布的《大語言模型綜合性能評(píng)估報(bào)告》，夸克大模型在應(yīng)試和寫作能力，以及醫(yī)療健康領(lǐng)域內(nèi)容可靠性上，均展現(xiàn)出突出優(yōu)勢(shì)。

撬動(dòng)內(nèi)容生產(chǎn)和個(gè)人生活的AIGC已為人們提供了全新視角，頭部玩家則隨之布局，重構(gòu)生態(tài)。應(yīng)用已然百花齊放，而大模型的潛能和價(jià)值正持續(xù)釋放。

看完覺得寫得好的，不防打賞一元，以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。

標(biāo)簽：夸克模型用戶隨筆