国产精品综合av_日韩精品偷拍一区二区_久草视频资源在线_亚洲视频 中文字幕_亚洲电影AV一区春药高潮_小×导航福利在线导航_欧美性爱一级短视频_人成视频免费在线观看不卡_国产九色在线播放_国产高清无码一区二区

藍(lán)海情報(bào)網(wǎng)

比Sora好用的AI視頻工具

藍(lán)海情報(bào)網(wǎng) 177

比Sora好用的AI視頻工具

昨天凌晨,Sora上線了。

很多小伙伴都是鐵桿粉,熬夜不睡,為了第一時(shí)間追這個(gè)熱點(diǎn)。我也沒例外,熬到12點(diǎn)半,但眼皮實(shí)在撐不住,就決定先去睡覺了。

早上一睜眼,趕緊打開電腦,直接去sora官網(wǎng)。映入眼簾的是24個(gè)視頻,它們排列得整整齊齊,這些視頻非常豐富。

有的展示了人物風(fēng)采,有的描繪了大海的壯麗,讓我印象最深的是一個(gè)視頻:一顆小種子在泥土中破土而出,發(fā)芽、生長的過程被拍得很細(xì)致,種子上的小毛孔都能看得很清楚,特別逼真。

迫不及待想親自體驗(yàn)一下這種震撼,但當(dāng)我嘗試用谷歌賬戶登錄時(shí),它卻提醒我,因?yàn)橛脩袅刻?,sora賬戶無法使用。

哎,這就像大夏天想喝冰鎮(zhèn)可樂,卻發(fā)現(xiàn)杯子里什么都沒有,既期待又失落。我相信身邊也有很多朋友想體驗(yàn)但沒能體驗(yàn)到。

不過,沒關(guān)系,這里有幾款A(yù)I視頻生成模型做出來的效果,并不比sora差。在我心中排在第一位的,你猜是哪款?騰訊混元文生視頻。

為什么呢?

想必上一周,你也刷到了騰訊混元文生視頻開放的信息,它在GitHub、Hugging Face和各大技術(shù)報(bào)告中都能找到。

如果想親自體驗(yàn),可以直接去官網(wǎng)試用。在官網(wǎng)上,你能看到很多逼真的人物視頻。不過,要注意,這些展示視頻可能經(jīng)過了多次調(diào)整。

目前,騰訊混元的視頻模型,雖然只能實(shí)現(xiàn)文字生成視頻的功能,但它在很多方面表現(xiàn)出色,比如畫面質(zhì)量、鏡頭切換效果、物體運(yùn)動(dòng)表現(xiàn),以及對(duì)提示詞的理解等。

你只要輸入一段文字描述,它就能生成一段5秒鐘的視頻。中文和英文的提示詞都可以使用,生成的視頻畫面非常真實(shí),看起來就像電影一樣。

剛內(nèi)測(cè)時(shí),我測(cè)試了近景、中景、廣景、特寫等類別?,F(xiàn)在這些視頻還在空間里。我給近景的提示詞是「一只貓?jiān)诓莸厣仙⒉降膱?chǎng)景」。

我選擇了寫實(shí)風(fēng)格,配上自然光效果,用專業(yè)鏡頭拍攝,追求高質(zhì)量畫面。最終的效果非常真實(shí),完全能以假亂真。

特寫方面,我在成都一個(gè)熱鬧的小吃街上,主播穿著四川特色的服裝,頭上戴著可愛的熊貓耳朵發(fā)箍。她正在品嘗麻辣串串,背景是熙熙攘攘的小吃街,還有各種誘人的美食。生成的效果也不錯(cuò),不至于讓人感到不適。

至于其他類別,你可以自己試試。我發(fā)現(xiàn),騰訊在產(chǎn)品細(xì)節(jié)方面做得很不錯(cuò),它能把風(fēng)格、標(biāo)簽、類型、氛圍和光線都展示得很清楚。

從提示詞來看,騰訊做得比其他產(chǎn)品好,其他產(chǎn)品的提示詞可能讓你寫一段話再生成,但生成的內(nèi)容往往和你想要的有差距。在這方面,騰訊的產(chǎn)品設(shè)計(jì)更人性化。

現(xiàn)在它每天以速度優(yōu)先能生成5個(gè)視頻,以質(zhì)量?jī)?yōu)先能生成2個(gè)。但我覺得,在質(zhì)量和速度上,兩者的差異并不大。

第二個(gè)產(chǎn)品是什么呢?字節(jié)的即夢(mèng)AI。

即夢(mèng)AI,真的很懂我想要什么,不用復(fù)雜的提示詞,都能搞定一切。

說到即夢(mèng),不能不提兩個(gè)軟件。一個(gè)是剪映,很多剪視頻的人都用過。它簡(jiǎn)單易用,就像剪輯界的傻瓜相機(jī)。無論是新手還是老手,大家都挺喜歡的。

我記得早些年時(shí),即夢(mèng)不叫即夢(mèng),叫「Dreamina」,那時(shí)它還是剪映里的一個(gè)功能,后來才獨(dú)立出來,并同時(shí)推出了一些新功能。

另一個(gè)要提到的是抖音。我不知道你有沒有刷到過那些把古典影視劇剪輯成搞笑段子的視頻,還有AI生成的寫真照,這些基本都來自即夢(mèng)的小工具。

至于能力上,文生視頻、文生圖自然是不可缺失一部分,拿文生圖來說,我小綠書上所有的圖片幾乎都是用它制作而成。

在視頻上,即夢(mèng)AI目前有四個(gè)模型,分別是視頻S2.0、視頻2.0PRO、視頻P2.0Pro和視頻1.2。我試過這幾個(gè)模型,它們各有特點(diǎn)。

S2.0擅長捕捉流暢感,可以把一張圖的色彩和細(xì)節(jié)平滑過渡到視頻里。2.0PRO則更擅長把圖片變成視頻,做得更精細(xì);P2.0Pro能理解復(fù)雜指令,在一句提示下實(shí)現(xiàn)多個(gè)鏡頭切換,同時(shí)保持視頻的形象、風(fēng)格和氛圍一致。

至于視頻1.2模型,主要在運(yùn)鏡和時(shí)長上下功夫。

最近,1.2模型正在測(cè)試一個(gè)新功能,叫動(dòng)效畫板,這個(gè)功能很強(qiáng)大,因?yàn)樗茏屇慵?xì)致調(diào)整視頻中物體的運(yùn)動(dòng)軌跡和最終狀態(tài),就像在視頻里給物體設(shè)定一套動(dòng)作。

具體來說,動(dòng)效畫板能做很多事情。比如:

單主體形變、多主體運(yùn)動(dòng)、主體互動(dòng)、主體與背景互動(dòng)、自定義軌跡、自動(dòng)框選主體或背景等等,一開始,我看著術(shù)語也有點(diǎn)暈,實(shí)際用起來發(fā)現(xiàn)并不復(fù)雜。

對(duì)了,如果你想用在商業(yè)上,字節(jié)旗下的「即創(chuàng)」是不錯(cuò)的選擇。它在電商領(lǐng)域特別受歡迎,功能包括智能剪輯、數(shù)字人制作視頻、AI視頻腳本、圖文工具和直播工具等等。

所以,我覺得在電商這塊,「即創(chuàng)」比「即夢(mèng)」用得更高頻,至于即夢(mèng),可能更適合娛樂場(chǎng)合,你都可以試試看。

第三個(gè)要提到的AI視頻工具是:Kimi。

要找到Kimi,得在聊天界面下面留意一下,那兒有個(gè)不太顯眼的按鈕,上面寫著:Kimi創(chuàng)作空間。點(diǎn)進(jìn)去,就能看到它的宣傳語:你喜歡的歌都有它的視頻。

我們可以把Kimi的這個(gè)功能叫做:文生音視頻。如果拿Kimi和即夢(mèng)AI比較,從整體產(chǎn)品來看,Kimi可能不如即夢(mèng)AI,它們之間的差別挺大的。

但是,Kimi也有自己優(yōu)勢(shì),它能細(xì)致到視頻的每一幀。

比如:我要做一個(gè)10秒的視頻,在Kimi后臺(tái)可以看到,這10秒的視頻可能包含10幀或者12幀,每一幀都是一張圖片。

如果對(duì)某一幀圖片不滿意,我可以調(diào)整提示詞,讓它重新生成。所以,我覺得Kimi在細(xì)節(jié)處理上做得挺好的。

第四個(gè)要說的工具是騰訊智影,它也是騰訊推出的。

我現(xiàn)在覺得,AI視頻工具大概分兩類:一類是用來玩的,比如做藝術(shù)照、藝術(shù)視頻、國風(fēng)短片、科幻視頻這些。

另一類更偏向?qū)嵱?,比如剪視頻、識(shí)別字幕、摳圖、做動(dòng)態(tài)漫畫、去掉背景,還有制作視頻解說等等。

騰訊智影更偏向?qū)嵱?,它里面的小工具用起來很方便,很多人想找AI數(shù)字人,騰訊智影是個(gè)不錯(cuò)的選擇。你只需要選個(gè)角色,輸入文字,它就能幫你生成數(shù)字人播報(bào)的視頻。

還有一點(diǎn),騰訊有個(gè)很大的優(yōu)勢(shì),就是它手里有很多視頻素材的版權(quán)。像那些流行的劇短片、短劇里的素材,都能直接在騰訊智影里找到,而且是免費(fèi)的。

這一點(diǎn)比其他平臺(tái)強(qiáng),至少不用擔(dān)心版權(quán)問題,我每次找不到素材,就會(huì)去騰訊智影里搜一搜。

最后一個(gè)要提到的是可靈。可靈是快手推出AI視頻工具,現(xiàn)在有兩個(gè)模型,一個(gè)是可靈 1.0,一個(gè)是可靈 1.5;它沒有明確區(qū)分場(chǎng)景和人物,我用的時(shí)候也搞不清哪個(gè)模型適合近景、遠(yuǎn)景或者人物。

它支持文字生成視頻和圖文轉(zhuǎn)視頻,但用下來感覺有些地方還不夠好。比如,生成的視頻看起來還有點(diǎn)AI味道,這方面的確有提升空間。

不過,如果是用來做短視頻創(chuàng)作,只要提示詞寫得好,生成的效果基本能滿足日常需求。

我也用過不少國外的工具,說實(shí)話,國外產(chǎn)品在多模態(tài)功能上確實(shí)比國內(nèi)的一些強(qiáng),但網(wǎng)絡(luò)問題太麻煩了。

我試過好幾款,每次上傳幾十兆的視頻或者十幾兆的照片,都要等很久。等它生成完視頻再下載,時(shí)間耗光不說,耐心也沒了。

后來我就想,能不能試試國內(nèi)的工具?現(xiàn)在看來,完全沒問題。國內(nèi)的AI視頻生成技術(shù)已經(jīng)很強(qiáng)了,甚至用起來比國外的還更順手。

說到這,我想起前兩天看到一篇國外的文章,講的是為什么AI做的藝術(shù)看起來那么廉價(jià)。文章提到,像DALL-E和Midjourney這樣的AI,需要用大量數(shù)據(jù)來學(xué)習(xí),但光靠提示詞是不夠的。

比如:

AI要畫「宇航員騎馬」這種圖,還是會(huì)有挺多問題,看著怪里怪氣的,不夠真實(shí)。

這些AI做出來的圖,不管是顯眼的地方還是不明顯的地方,都可能有問題。因?yàn)锳I太依賴數(shù)據(jù),它沒法準(zhǔn)確畫出人的手到底長啥樣。

心理學(xué)家和AI評(píng)論家加里馬庫斯(Gary Marcus)也說過:AI處理不了數(shù)據(jù)里沒有的東西,這部分是人類想象力的領(lǐng)域。就算是最新的AI模型,你讓它畫「宇航員騎馬」,它畫出來的圖還是會(huì)帶著一種很明顯的2020年代中期的風(fēng)格。

你玩得越多,就越明白,要從AI視頻里得到真正有趣的原創(chuàng)內(nèi)容有多難;所以,AI最擅長的,可能就是讓網(wǎng)上充滿了那種平庸、短暫的藝術(shù)作品。

藝術(shù)家戴爾沃克(Del Walker)在X平臺(tái)上寫道:用AI圖片做營銷,就等于告訴大家你沒預(yù)算,就像背了個(gè)假的香奈兒包,品牌形象一下子就low了。

所以,我覺得,文生視頻的競(jìng)爭(zhēng)力就在這些細(xì)節(jié)上。

不管是Sora還是其他工具,大家評(píng)價(jià)一個(gè)視頻有沒有藝術(shù)感,主要看細(xì)節(jié);而這些細(xì)節(jié),一部分可以交給AI處理,但另一部分還得靠人類的創(chuàng)意和后期加工。

上述提到的騰訊混元文生視頻、即夢(mèng)AI、Kimi、騰訊智影、可靈,是我用著還不錯(cuò);當(dāng)然,清影AI、viduAI、HaiperAI也算領(lǐng)頭羊,都可以試試看。

看完覺得寫得好的,不防打賞一元,以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。

標(biāo)簽:

ad2

推薦內(nèi)容