來源 | 伯虎財經(jīng)(bohuFN)
作者 | 森系
我們推出回首2024系列稿件,試圖記錄、分析和總結(jié)過去一年不同行業(yè)最具代表性的公司和趨勢。本篇是該系列的第一篇稿件,行業(yè)是AI,主人公是字節(jié)跳動。
在當(dāng)下的大模型賽道中,日均使用量達5000億tokens ,是一個非常顯著的數(shù)量級,因為它代表著這個大模型的使用量進入賽道相對領(lǐng)先的位置。
在自然語言處理領(lǐng)域,一個tokens通常是指文本中的最小單位,它可以是一個單詞、一個標(biāo)點符號或者一個子詞單元。
換句話說,5000億tokens/天的使用量,意味著這個大模型每天都需要處理極其大量的數(shù)據(jù),這至少相當(dāng)于處理數(shù)百萬篇長文章或數(shù)千萬到數(shù)億條社交媒體帖子的日均量。
近期,中國大模型創(chuàng)業(yè)公司MiniMax宣稱已達到單日超3萬億tokens的處理量,此消息一出,瞬間在行業(yè)內(nèi)引發(fā)了強烈震蕩。然而,隨著大模型競賽逐漸進入下半場,tokens處理量已不再是衡量大模型價值的唯一標(biāo)準(zhǔn),行業(yè)內(nèi)對于 第一 的競爭焦點已然轉(zhuǎn)向了應(yīng)用落地
素有 卷王 之稱的字節(jié)跳動,盡管入局大模型還不足兩年,但如今已在行業(yè)內(nèi)初露鋒芒。
在今年11月的AI大模型月活躍排行榜上,豆包App以5998萬MAU的成績僅次于OpenAI的ChatGPT,穩(wěn)居全球第二,在國內(nèi)排名第一。而它的海外版Cici的MAU也有1267萬,排在第22位。
而在2024年2月,豆包的月活躍用戶量才只有173萬。
這顯示了豆包大模型正成為國內(nèi)頭部大模型中,受到廣泛歡迎且商業(yè)化前景可期的一個重量級選手。受此積極影響,在二級市場上,豆包大模型概念股備受投資者的熱烈追捧,短短一個月內(nèi)便在AI賽道中脫穎而出,成為領(lǐng)漲板。
從最初的上半場低調(diào)蓄力,到如今下半場的火力全開,直至當(dāng)下,字節(jié)跳動所構(gòu)建的龐大的大模型帝國依舊在持續(xù)擴張。那么,作為大模型戰(zhàn)場的 后來者,字節(jié)跳動究竟是如何實現(xiàn)這一逆襲的呢?
01 從遲到者到破局者2023年8月18日,字節(jié)跳動旗下AI對話產(chǎn)品Grace,更名為「豆包」。
在百模大戰(zhàn)一波又一波密集的重磅發(fā)布中,這條當(dāng)時看著毫不起眼的消息,悄然開啟了字節(jié)大模型的新篇章。
從時間線看,相較于其他大廠,字節(jié)跳動在大模型領(lǐng)域的反應(yīng)確實稍顯遲緩。字節(jié)跳動 CEO 梁汝波在 2024 年年度全員會上也反思公司的技術(shù)敏感度不及創(chuàng)業(yè)公司,稱公司直至 2023 年才開始深入探討 GPT,而業(yè)內(nèi)優(yōu)秀的大模型創(chuàng)業(yè)公司多在 2018 年至 2021 年便已創(chuàng)立。
2019年,百度依托其 人工智能研究中心 的技術(shù)沉淀,率先于國內(nèi)推出文心大模型,成為我國大模型領(lǐng)域的關(guān)鍵里程碑。此后,阿里巴巴的 達摩院 與騰訊的 騰訊研究院 成立,加速了自研大模型的進程。2021 年,阿里發(fā)布全球首個 10 萬億參數(shù)的多模態(tài)大模型;同期,騰訊也連續(xù)推出多個千億至萬億參數(shù)級別的大模型,為后續(xù)研發(fā)夯實了基礎(chǔ)。
時間來到2023年,國產(chǎn)大模型呈爆發(fā)之勢,眾多大廠及創(chuàng)新企業(yè)紛紛推出自研產(chǎn)品,如阿里通義千問1.0、騰訊混元、360 智腦、華為盤古、科大訊飛星火、商湯日日新、百川大模型以及智譜AI的GLM等。
當(dāng)行業(yè)發(fā)展?jié)u行至深水區(qū),字節(jié)才姍姍來遲。
實際上,字節(jié)跳動并非輕視 AI 技術(shù)。早在2012年,字節(jié)就自研了第一版推薦引擎,并在2016年成立了AI Lab。但隨著AI Lab核心人員的相繼離職,字節(jié)在AI領(lǐng)域的探索逐漸放緩。直到ChatGPT的橫空出世,字節(jié)才意識到在大語言模型領(lǐng)域的發(fā)展相對滯后,并促使字節(jié)跳動CEO梁汝波在2024年初的全員會上進行深刻反思。
為了趕上這場AI技術(shù)革命,字節(jié)跳動迅速調(diào)整戰(zhàn)略布局,采取一系列措施,包括大規(guī)模招募AI人才、成立專門的AI部門Flow、整合內(nèi)部資源、實施賽馬機制等,以加速豆包大模型的研發(fā)進程。
今年3月,豆包的下載量和月活躍用戶開始雙雙登頂。11月份,這種勢頭仍在延續(xù)。ChatGPT仍以超3億月活遙遙領(lǐng)先(APP+web用戶),但豆包的崛起速度遠超其競爭對手。國內(nèi)的Kimi、文小言、通義千問在用戶規(guī)模上均被豆包甩在身后,豆包甚至超過后面三者月活用戶的總和。
從C端的豆包APP用戶,到B端的千行百業(yè),豆包大模型不僅使用量大,應(yīng)用場景之豐富也可見一斑。根據(jù)火山引擎總裁譚待介紹,目前,豆包大模型日均處理文本1200億tokens,生成3000萬張圖片。
只用了一年多就取得了令所有AI應(yīng)用創(chuàng)業(yè)者眼饞的成績,雖然大模型起步晚了點,但字節(jié)還是完成了從遲到者到破局者的快速銳變。
02 增長密碼:C端卷用戶&B端卷價格&競爭對手卷算力眾所周知,從ChatGPT驚艷登場開始,AI領(lǐng)域的想象力被再度點燃,大模型迅速占據(jù)核心地位,新一輪的AI浪潮已洶涌澎湃兩年之久。在這期間,圍繞技術(shù)與產(chǎn)品的迭代速度,以及商業(yè)化落地的效率,一場 百模大戰(zhàn) 如火如荼地展開,成為各方勢力無法回避的關(guān)鍵戰(zhàn)場。
國內(nèi)互聯(lián)網(wǎng)科技公司紛紛入局,包括百度、阿里、騰訊、華為等大廠,科大訊飛、商湯科技、曠視科技等垂直于AI領(lǐng)域的廠商,以及智譜華章、百川智能、達觀數(shù)據(jù)等大模型初創(chuàng)企業(yè),還有金融、汽車、教育、智能家居、消費電子等垂直行業(yè)企業(yè)也基于垂直領(lǐng)域人工智能技術(shù)和數(shù)據(jù)積累等能力,自主研發(fā)大模型。
此外,市場上也活躍著高校和研究機構(gòu)的身影,約四分之一的大模型由這些學(xué)術(shù)機構(gòu)發(fā)布??梢?,從大廠到創(chuàng)業(yè)公司,從科技企業(yè)到高校研究機構(gòu),各方紛紛入局,使得市場競爭極為激烈。
從當(dāng)下的視角審視,歷經(jīng)激烈的百?;鞈?zhàn)之后,基礎(chǔ)大模型領(lǐng)域經(jīng)歷了一場嚴(yán)酷的篩選,近乎 十不存一。但作為大模型戰(zhàn)場的后來者,字節(jié)又是如何實現(xiàn)逆襲的?
歸根到底,C端卷用戶,B端卷價格,與競爭對手卷算力。飽和式攻擊的豆包,在哪個領(lǐng)域都上演了后來者居上的戲碼。
據(jù)統(tǒng)計,今年以來,豆包在C端投流上的費用已經(jīng)超過了10億元。這種高強度的市場投放,讓豆包在社交媒體、搜索引擎和短視頻平臺上迅速占領(lǐng)用戶的視覺入口,形成了強烈的品牌記憶點。
如果說C端市場的投放是圈用戶心智的火力戰(zhàn),那么在B端市場,豆包則打響了一場極具殺傷力的價格戰(zhàn)。
在今年5月火山引擎FORCE原動力大會上,豆包Pro 32k模型正式定價是1千Tokens 0.8厘,比行業(yè)的價格降低99.3%;豆包Pro 128k模型正式定價為是1千Tokens5厘錢,較行業(yè)價格降低了95.8%。
更形象的說法是,根據(jù)火山引擎公布的價格計算,一元錢就能買到豆包主力模型的125萬Tokens,大約是200萬個漢字,相當(dāng)于三本《三國演義》。
沒有像其他公司公布大模型時的各種測評和榜單,字節(jié)走的是實用主義的路線,希望用一個打破行業(yè)地板的價格得到用戶,尤其是企業(yè)用戶的認(rèn)可。
此外,大模型之爭是算力之爭、人才之爭。在這一背景下還得益于字節(jié)穩(wěn)定且持久的資源注入。
在資金上,字節(jié)跳動在AI上投入巨大,僅是2024年資本開支達到800億元,接近百度、阿里、騰訊三家的總和(約1000億元)。據(jù)了解,2025年,字節(jié)跳動資本開支將進一步達到1600億元,旨在打造自主可控的大規(guī)模數(shù)據(jù)中心集群,其中約900億元將用于AI算力的采購,700 億元用于IDC基建以及網(wǎng)絡(luò)設(shè)備。
在AI人才儲備上,公司創(chuàng)始人張一鳴親自掛帥,從阿里巴巴集團以及零一萬物、智譜等競爭對手公司大力招攬 AI 人才,并在內(nèi)部多次強調(diào)追求 通用人工智能 的目標(biāo)。
正因如此,字節(jié)才能在這場 AI 應(yīng)用的激烈混戰(zhàn)中突出重圍,憑借豆包大模型的穩(wěn)定性、可靠性以及強大的應(yīng)用開發(fā)能力,逐漸構(gòu)筑起自身獨有的競爭優(yōu)勢,在 AI 領(lǐng)域嶄露頭角,占據(jù)一席之地。
03 不止豆包,字節(jié)要復(fù)刻下一個「App工廠」面向AI時代,所有產(chǎn)品都值得用大模型重新升級。這是曾經(jīng)時任阿里CEO的張勇看法。如今這一論斷已得到充分印證。國內(nèi)眾多互聯(lián)網(wǎng)平臺紛紛將AI技術(shù)深度融入自身核心業(yè)務(wù),并在傳統(tǒng)賽道上加速推出全新的AI產(chǎn)品。
字節(jié)也不例外。豆包大模型,只是字節(jié)大模型應(yīng)用的一個側(cè)面。隨著大模型的逐漸成熟,抖音、火山引擎、巨量引擎等業(yè)務(wù)部門也都開始加入 AI 探索。
截止目前,字節(jié)正已經(jīng)推出了豆包大模型家族、火山方舟以及一系列前沿的AI應(yīng)用與云基礎(chǔ)設(shè)施產(chǎn)品。
基于豆包大模型,豆包大模型家族已擴展至9大產(chǎn)品線,涵蓋通用、角色扮演、語音合成、聲音復(fù)刻、文生圖、語音識別、向量化及Function call等多種模型,全方位滿足用戶與企業(yè)的多樣化需求。
火山方舟應(yīng)用場景聚焦于B端包括智能外呼、數(shù)字人、數(shù)據(jù)助理等等,可以降低企業(yè)使用大模型的成本和技術(shù)門檻,目前已經(jīng)與汽車、手機、金融、食品飲料等領(lǐng)域的龍頭企業(yè)展開了密切合作,包括吉利汽車、長城汽車、OPPO、vivo、小米、華碩、招商銀行、海底撈等。
而在豆包大模型基座賦能下,還進一步誕生了AI 智能體開發(fā)平臺扣子(中國版)和 Coze(海外版)、圖片生成產(chǎn)品星繪、類 Character.AI 的角色對話產(chǎn)品貓箱(原叫話爐)和小黃蕉、AI教育產(chǎn)品豆包愛學(xué)(原河馬愛學(xué))、出海搜題產(chǎn)品 Gauthmath 等數(shù)款 AI 軟件和互聯(lián)網(wǎng)應(yīng)用。
從大模型產(chǎn)品、基礎(chǔ)AI開發(fā)、到AI社交,再到AIGC創(chuàng)作,字節(jié)已構(gòu)建起一個全面的AI產(chǎn)品生態(tài)體系。
移動互聯(lián)網(wǎng)時代,字節(jié)就有「App工廠」之稱,所以相繼打造今日頭條和抖音兩個爆款產(chǎn)品,借此成為最賺錢的中國互聯(lián)網(wǎng)公司之一。
大模型時代,不可否認(rèn)字節(jié)還要再造一個新的增長奇跡——名為「AI工廠」,從中尋找第三個超級應(yīng)用的可能性。
當(dāng)然,AI軟件之外,字節(jié)同樣不愿放棄將大模型與硬件做結(jié)合。畢竟在萬物互聯(lián)的趨勢下,硬件是軟件落地的載體,也是用戶流量通向生態(tài)的通道,而AI硬件的發(fā)展路徑,也不過是軟件側(cè)的平移。
今年5月的火山引擎FORCE原動力大會,字節(jié)對外展示了3款外部合作方開發(fā)的AI硬件產(chǎn)品,包括機器狗、學(xué)習(xí)機,以及學(xué)習(xí)機器人。
在中秋期間,字節(jié)又推出了AI陪伴玩偶顯眼包,作為火山引擎的特別禮品,分發(fā)給客戶。
與普通玩偶不同的是,顯眼包搭載了FoloToy的大模型AI機芯Magicbox(魔匣),可以呈現(xiàn)豆包大模型和扣子的能力。用戶只需通過簡單的指令便可以與顯眼包進行互動,這個玩偶式AI也會回應(yīng)你。
盡管字節(jié)不想承認(rèn)顯眼包是一款正式的產(chǎn)品,但將AI裝進玩具里的這一次試水,無疑是一次新的頭腦風(fēng)暴。
值得注意的是,在硬件方面的探索,對于字節(jié)來說已是駕輕就熟。
從2018年收購錘子科技堅果手機團隊和部分專利使用權(quán),并發(fā)布了堅果手機、TNT顯示器以及音箱等周邊產(chǎn)品,到2020年聚焦教育硬件賽道,啟動大力教育品牌,發(fā)布了智能學(xué)習(xí)燈、教育平板、詞典筆等多款產(chǎn)品,以及2021年收購國內(nèi)VR出貨量第一的廠商PICO。
只是強敵環(huán)伺硬件市場、雙減政策的影響,字并沒能做出多少效果,目前大力教育官網(wǎng)也僅剩智能學(xué)習(xí)燈一款產(chǎn)品的身影。PICO去年多次裁員,如今僅保留少部分硬件團隊。
現(xiàn)階段,AI計算正在加速滲入各行各業(yè),一場看不見的革命也許就在不久的未來。但同時從上面不難看出,字節(jié)在AI時代的野心盡顯無疑——從豆包大模型到AI應(yīng)用流水線的打造,從軟件跨越到硬件,字節(jié)希望在AI這顆新芽里,找對增長框架,快速枝繁葉茂。
文章封面首圖及配圖,版權(quán)歸版權(quán)所有人所有。若版權(quán)者認(rèn)為其作品不宜供大家瀏覽或不應(yīng)無償使用,請及時聯(lián)系我們,本平臺將立即更正。
看完覺得寫得好的,不防打賞一元,以支持藍海情報網(wǎng)揭秘更多好的項目。