來源:光子星球
4月16日,劉強東的數(shù)字人分身采銷東哥出現(xiàn)在京東采銷直播間,讓人們再次刷新對數(shù)字人的認(rèn)知。為業(yè)務(wù)保駕護航的京東云也沒有想到,首場直播不僅爆品售罄,還吸引了一大群總裁和品牌客戶,把京東云自己也整爆單了。
爆發(fā)式的合作需求讓京東云言犀團隊從算法到推理、從商務(wù)到業(yè)務(wù),至今仍處于滿負(fù)荷運轉(zhuǎn)狀態(tài)。
在京東618這個節(jié)點下,品牌對定制化數(shù)字人的需求處于井噴狀態(tài)。一位京東云言犀數(shù)字人團隊員工表示,客戶本身要求很高,他們自己會把關(guān),為了保持溝通,我們同事會從拍攝第一天就開始提供支持,所以異地出差、駐扎到客戶公司都是家常便飯。
總裁+直播+數(shù)字人的想法不是石頭縫里蹦出來的,是有爹有媽有跡可循的,父系是總裁直播業(yè)態(tài)的遞進(jìn),母系是AI技術(shù)的迭代,這既包括大模型的引入,也包括多模態(tài)的積累。
早在2020年,梁建章、俞敏洪等企業(yè)家下場直播,拉開了老板直播的序幕。企業(yè)家下場為品牌提供了一個直接觸達(dá)用戶機會的同時,也潛藏著諸多問題:老板不可能時時有空、口播問題突出、用戶需求與品牌需求錯配等。采銷東哥相當(dāng)于提供了一個既要也要還要的可能。
數(shù)字人技術(shù)迭代同樣有跡可循。以京東為例,自身擁有龐大的客服團隊,2012年京東商城上線智能客服,2018年面向自營商家提供智能客服SaaS產(chǎn)品,為訓(xùn)練可靠的數(shù)字人積累了充分的語料與場景。
2020年,京東云發(fā)布了人機智能交互平臺 言犀。兩年后,京東云言犀數(shù)字人平臺上線。今年GPT4o發(fā)布后,多模態(tài)成為業(yè)內(nèi)新風(fēng)向時,正中京東下懷——因為在多模態(tài)領(lǐng)域他們早已籌備多年,并在扎實的電商場景中得以應(yīng)用錘煉。
去年一次溝通中,當(dāng)我們問及電商多模態(tài)應(yīng)用時,京東云言犀相關(guān)負(fù)責(zé)人曾提到內(nèi)部已對大姿態(tài)數(shù)字人有了諸多測試,將在不日上線。
事實上,采銷東哥創(chuàng)造了總裁IP+數(shù)字人+直播的新范式,其虹吸效應(yīng)仍在持續(xù),京東云言犀在618期間開創(chuàng)了總裁數(shù)字人聚合直播全新模式,實屬行業(yè)首次。最吸引品牌商家參與總裁數(shù)字人直播的其實是另外兩個原因。一個是成熟的技術(shù)與感人的價格,讓企業(yè)敢用,且用得起,歸結(jié)為一句話:技術(shù)普惠。另一個原因跟醫(yī)學(xué)實驗中的小白鼠測試差不多,一位商家告訴我們:
他們都能把自家老板拿來做DEMO,我還怕啥?
直播電商:從達(dá)播到店播
從達(dá)播到店播,再到數(shù)字人直播,直播電商正在經(jīng)歷第三次變革。這種變革不是非此即彼的替代關(guān)系,而是隨著品牌商家需求變化的平行關(guān)系。
粉絲、feed流、付費流量構(gòu)成達(dá)播三大主要流量來源。而轉(zhuǎn)化主要通過兩種方式,一種是東方甄選、李佳琦、辛巴這類達(dá)人自己操盤專場,往往大小品牌甚至白牌混場直播。對于大品牌而言,達(dá)播議價權(quán)較低。對于廣大中小商家而言,除了繳納坑位費與傭金外,必須砍自己一刀,確保機制最優(yōu)。
第二種是單一品牌主導(dǎo)的達(dá)播專場,通常會借助品牌溯源、種草短視頻、全天直播三板斧。要么以定金+傭金結(jié)算,要么以固定專場費+傭金結(jié)算。無論哪種形式,對于大小品牌而言,達(dá)播的核心邏輯與廣告投放并無二致,即花錢賺吆喝,在短時間內(nèi)借助達(dá)人流量,解決用戶認(rèn)識、認(rèn)知、認(rèn)同,實現(xiàn)轉(zhuǎn)化。
給主播培訓(xùn)太費時了負(fù)責(zé)某投影儀品牌線上渠道的章棟表示,由于投影儀迭代快、參數(shù)多,每一次直播自己都要拿著厚厚的一沓產(chǎn)品手冊飛到MCN所在的城市,花一兩周培訓(xùn)。最近,他有些崩潰,剛剛培訓(xùn)好的主播跳槽了,于是只能再飛過去培訓(xùn)。
一些品類存在達(dá)播不耐受,而平臺和商家也出現(xiàn)了達(dá)人不耐受。對平臺而言,部分頭部主播向供應(yīng)鏈延伸,在平臺中漸成尾大不掉的國中國,與平臺的矛盾不斷激化。商家苦于達(dá)播吃掉了太多毛利,一些不愿拿,或者拿不出利潤換流量的品牌商家開始嘗試店播。
某品牌表示,找頭部達(dá)人,單場規(guī)模在百萬上下,我們會根據(jù)測算結(jié)果決定這場直播是控2(百分比),還是控2.5,或者3。
這導(dǎo)致淘天與抖音品牌有一條非常明顯的利潤分隔帶——毛利30%上下的品牌,只能蝸居淘天;毛利能上到70%的品牌,大多跑到抖音讓利爆發(fā)。一位服務(wù)商向我們算了一筆賬,如果是頭部主播,品牌一般會反向測算ROI,控2%、控2.5%、控3%不等。如果是中小主播,按照純傭模式,抽傭比例在30%-70%之間,那么ROI會在3.3%-1%左右之間。
生意的本質(zhì)是復(fù)購,如果還要追求品牌沉淀,那對于所有品牌而言,都要思考一個問題:達(dá)播效果取決于達(dá)人與品牌影響力大小,當(dāng)達(dá)人影響力更大時,品牌獲利;當(dāng)品牌影響力更大時,達(dá)人獲利。
相較達(dá)播,店播的流量來源更穩(wěn)定。最主要的是品牌店用戶基數(shù),并輔之以付費投流——這也就是為何平臺們會大力發(fā)展店播。店播的確幫助一部分品牌商家擺脫了達(dá)播對利潤的侵蝕,但對于一些品類而言,店播同樣存在不耐受的情況。
我們走訪產(chǎn)業(yè)帶時發(fā)現(xiàn),仍然有海量品牌與商家要么連店播物料與人工都無法負(fù)擔(dān),要么根本不具備店播能力。
直播能力欠缺阻礙了店播下沉,這表明不是所有商家和品牌都具備直播的物質(zhì)條件與技能。除了中小商家,真人主播不是24小時牛馬,無法全天候覆蓋等一系列問題亦存在短板。
某生發(fā)劑品牌,產(chǎn)品處于市場教育期,因此迫切需要建立用戶認(rèn)知與品牌心智。
我不知道是不是因為打工人對生發(fā)劑的訴求比較高,總之我們直播間晚上的流量特別高,大量用戶會涌入直播間咨詢。負(fù)責(zé)線上渠道的員工表示,用戶進(jìn)入直播間的第一個問題往往同質(zhì)化率極高:米諾地爾酊是什么東東。
得到回答后,接下來呈現(xiàn)在彈幕中的問題則是五花八門的癥狀。問題在于,到哪里去找那么多具備產(chǎn)品和專業(yè)知識的夜場主播?他們把目光投向了數(shù)字人。
從半吊子到實力派,數(shù)字人走進(jìn)下半程
數(shù)字人是直播電商開辟的副本,技術(shù)驅(qū)動力來自AIGC。在技術(shù)和產(chǎn)品驅(qū)動下,數(shù)字人直播經(jīng)歷了兩個階段。
第一個階段,數(shù)字人的裝飾性功能遠(yuǎn)大于實用性。外形上常常出現(xiàn)表情跟不上動作,張了嘴但聲音卻滯后2-3秒才出現(xiàn)。光子星球在了解多家數(shù)字人廠商后發(fā)現(xiàn),這種割裂源于打補丁式的訓(xùn)練方法,先分開訓(xùn)練聲音、動作、表情、文本、面部捕捉、渲染合成的各個環(huán)節(jié),最后通過數(shù)字人平臺拼到一起。
盡管此前數(shù)字人只是個半吊子,但持續(xù)降低的價格還是吸引了第一批吃螃蟹的商家。
談到數(shù)字人的使用體驗,商家更多的是抱怨:9.9、199、1999各種價位的數(shù)字人挑得人眼花繚亂;數(shù)字人僵硬得像個機器人,沒有感情地重復(fù)說著車轱轆話;直播過程中突然卡頓,動輒被封號更是家常便飯,數(shù)字人廠商跑路也是屢見不鮮。
風(fēng)口之下,數(shù)字人行業(yè)出現(xiàn)了分層,上游是數(shù)字人原廠和套殼廠商,區(qū)別是前者有技術(shù)而后者沒有;中游是數(shù)字人批發(fā)商,也被稱為二道販子,收割企業(yè)大戶;下游是真正有需要的企業(yè)和商家。
供需錯配的結(jié)果就是,有技術(shù)、有產(chǎn)品的數(shù)字人原廠找不到客戶,有需求的商家用不上過硬的數(shù)字人產(chǎn)品,中間商賺得盆滿缽滿。
轉(zhuǎn)折點出現(xiàn)在今年四月份京東采銷東哥數(shù)字人直播。形象逼真之外,帶貨過程中,采銷東哥的聳肩、擺臂和手上動作連貫一致,毫無違和感。不經(jīng)意間帶出的宿遷口音和搓手的習(xí)慣,讓人懷疑到底是不是劉強東真人在帶貨。
采銷東哥的鮮活實例釋放出了新的信號,數(shù)字人來到了多模態(tài)階段,簡單來說就是從半吊子演員進(jìn)化成了演技、實力兩手抓的實力派。也從側(cè)面印證了京東云言犀數(shù)字人至少在技術(shù)、效果、商業(yè)化三個維度都做到了行業(yè)第一。
多模態(tài)從根本上解決了第一階段縫合怪的問題,從源頭上打通文本、語音、圖像、視頻的鏈條,實現(xiàn)了端到端的實時渲染和數(shù)字人生成,從結(jié)果上至少可以呈現(xiàn)出一個完整的形象。
一位京東云言犀數(shù)字人產(chǎn)品負(fù)責(zé)人提到,他們團隊內(nèi)部有一個120s挑戰(zhàn)。如果用戶在120秒內(nèi)不覺得眼前的數(shù)字人別扭,就會跨過‘恐怖谷效應(yīng)’,能耐下性子聽解說,明顯提高用戶下單的概率。在此標(biāo)準(zhǔn)下,京東云對數(shù)字人有了更高要求,不僅要追求數(shù)字人形似,還得神似。
動作方面,以往的數(shù)字人表現(xiàn)得總是小心翼翼,數(shù)字人大多端坐在桌子前,做一些小范圍的動作。臉部基本不會動,因為一旦扭頭,五官容易出現(xiàn)扭曲。京東云言犀自研的大姿態(tài)技術(shù)解決了上述問題,這也就是為何采銷東哥的直播過程中,四肢動作幅度大,且頭部、肩部和手同時擺動也不會出現(xiàn)變形。
為了復(fù)刻還原聲音,打造真實的聲音質(zhì)感,京東云言犀團隊花了大量的精力去打磨聲音技術(shù)。其做法分為兩步,先從源頭上縮短聲音復(fù)現(xiàn)的時間,光言犀語音大模型就采用了5萬小時的語音訓(xùn)練數(shù)據(jù)。對于通用的聲音模板基本夠用,如果要打造定制版的數(shù)字人,只要增加個性化的音頻素材即可。
語音技術(shù)已經(jīng)能做到6秒素材復(fù)刻某個人的聲音,上述京東云數(shù)字人產(chǎn)品負(fù)責(zé)人表示。
第二步是讓聲音供應(yīng)鏈去匹配不同品類的直播需求。比如商家賣消費品時,希望數(shù)字人聲音可以激昂一點。賣母嬰和圖書類產(chǎn)品時,則希望主播聲音可以沉穩(wěn)一點。聲音供應(yīng)鏈就像是模板庫,商家可以自由挑選數(shù)字人的形象,然后匹配適合的聲音。
老板打樣之后,京東云言犀數(shù)字人在618期間全部免費對商家開放使用。正是這樣,京東對數(shù)字人的技術(shù)普惠和普及創(chuàng)造了解決供需錯位的可能。截至目前,京東云言犀數(shù)字人已經(jīng)為5000多個品牌提供了數(shù)字人直播服務(wù),平均閑時直播轉(zhuǎn)化提升超30%,帶動超百億GMV,還通過云端開播技術(shù)進(jìn)一步將直播成本降低成本30%。
開啟數(shù)字人第二篇章,數(shù)字人在可用性方面也進(jìn)化到了next level。
最明顯的提升體現(xiàn)在數(shù)字人交互體驗,過去數(shù)字人互動是被動觸發(fā),當(dāng)出現(xiàn)模板庫的關(guān)鍵詞后,就開啟了單向的播報模式?,F(xiàn)在,大模型在學(xué)習(xí)完內(nèi)置的直播行業(yè)通用知識庫后,便可以掌握基本的智能問答能力,熟練地運用直播話術(shù)來回答用戶的問題。
京東云言犀數(shù)字人產(chǎn)品負(fù)責(zé)人提到,小白商家不需要設(shè)置直播間的互動問題,一鍵啟用后,現(xiàn)有的大模型能力可以在零配置基礎(chǔ)上解決70%的常見互動問題,商品推薦準(zhǔn)確率達(dá)90%。
不少商家反映,數(shù)字人直播中最頭疼的是寫直播腳本,200個SKU,至少得寫一天,頭發(fā)都要掉完了。受技術(shù)制約,在上個階段AIGC只能生成一些簡短的營銷話術(shù),但現(xiàn)在利用數(shù)字人可一鍵生成腳本,幾十分鐘就可以快速完成一場直播文案的撰寫和直播間的搭建。
脫離了畫皮階段,數(shù)字人與直播流程的融合從參與表演走向了指導(dǎo)決策。京東的思路是,引入數(shù)字人直播中控臺,充當(dāng)數(shù)字人的大腦,通過實時監(jiān)控直播間的彈幕、商品庫存的變化,來指導(dǎo)數(shù)字人自動實施決策,比如調(diào)整直播獎品順序與爆品講解頻率等。
技術(shù)再進(jìn)一步,參考GPT4o,依然十分具有想象力。在情感因素的加持下,數(shù)字人可以像李佳琦一樣打造IP,像真人一樣表達(dá)自我和感情,甚至和其助播交流互動,最大程度上接近真人主播的直播效果。
半年到一年內(nèi),也許就能實現(xiàn),該負(fù)責(zé)人預(yù)測道。
總裁數(shù)字人,開辟直播新路子
解決技術(shù)卡點只是前提,真正落地還是得依托于產(chǎn)品與運營。
現(xiàn)在上數(shù)字人直播不是什么難事,關(guān)鍵問題在于到底用數(shù)字人解決了什么問題?光子星球與多位業(yè)內(nèi)人士溝通發(fā)現(xiàn),商家訴求簡單概括為兩個核心命題,一個關(guān)乎ROI,數(shù)字人到底能給自己帶來什么樣的增量?另一個關(guān)乎省事兒,數(shù)字人究竟為自己省下了金錢,或是精力,還是時間?
京東云言犀數(shù)字人的思路比較清奇,方法是把成本降低到中小微品牌能用得上,具體來說有兩種。
一種是填補真人直播之外的閑時,即真人+數(shù)字人24小時店播。他們敢這么干的原因很簡單,靠著店鋪沉淀數(shù)據(jù)與京東產(chǎn)業(yè)數(shù)據(jù)。例如前文提到的生發(fā)劑品牌,店鋪沉淀數(shù)據(jù)能夠回應(yīng)同質(zhì)化的深夜入場第一問,而疊加京東的產(chǎn)業(yè)數(shù)據(jù)則可以幫助商家承接接下來的差異化問題。
比如:全禿、半禿、四分之一禿、花式禿、間歇性禿、一點點禿。再比如,用量是加大劑量還是淺嘗輒止等。
另一種是針對那些既要人格化營銷,總裁因種種原因又不能時長駐扎直播間的品牌。這次京東618超18位總裁數(shù)字人直播就為大家打了樣,總裁用自己的影響力為品牌帶來流量;通過數(shù)字人與直播玩法的結(jié)合,總裁數(shù)字人會形成品牌店播的特定心智;最終通過營銷心智的建立,更加走進(jìn)用戶,為品牌店鋪帶來可持續(xù)的運營模式。
此外,京東云言犀數(shù)字人產(chǎn)品模塊化特征,提供了產(chǎn)品+運營的可能。盡管目前數(shù)字人還無法完全在直播間里唱歌跳舞,但如果結(jié)合適當(dāng)運營,可以加工數(shù)字人直播視頻切片,輸出面部特寫、換裝,甚至展示產(chǎn)品詳情等尋求增量。
采銷東哥數(shù)字人帶貨,已經(jīng)解鎖總裁直播的模式,短期顯然已產(chǎn)生了連鎖反應(yīng)。光子星球獲悉,店鋪平均咨詢量明顯上漲外,閑時訂單同比增長30%,也隨之解鎖了數(shù)字人+真人接力直播的新方式。
總裁直播為直播電商第三個周期數(shù)字人周期提供了真正落地的可能,多模態(tài)增強了互動能力與情感化,而總裁出鏡則是借助IP化的手段,解決SaaS化產(chǎn)品所導(dǎo)致的刻板形象。京東這套IP引流、數(shù)字人直播、建立營銷心智的路徑有別于其他平臺。
無論如何,沒有人會否認(rèn),今年在缺乏頭部主播的618中,總裁數(shù)字人已經(jīng)開始接手他們留下的真空。
看完覺得寫得好的,不防打賞一元,以支持藍(lán)海情報網(wǎng)揭秘更多好的項目。