比Sora好用的AI視頻工具

藍(lán)海情報(bào)網(wǎng) 2024-12-11 18:51:45 177

比Sora好用的AI視頻工具

昨天凌晨，Sora上線了。

很多小伙伴都是鐵桿粉，熬夜不睡，為了第一時(shí)間追這個(gè)熱點(diǎn)。我也沒例外，熬到12點(diǎn)半，但眼皮實(shí)在撐不住，就決定先去睡覺了。

早上一睜眼，趕緊打開電腦，直接去sora官網(wǎng)。映入眼簾的是24個(gè)視頻，它們排列得整整齊齊，這些視頻非常豐富。

有的展示了人物風(fēng)采，有的描繪了大海的壯麗，讓我印象最深的是一個(gè)視頻：一顆小種子在泥土中破土而出，發(fā)芽、生長的過程被拍得很細(xì)致，種子上的小毛孔都能看得很清楚，特別逼真。

迫不及待想親自體驗(yàn)一下這種震撼，但當(dāng)我嘗試用谷歌賬戶登錄時(shí)，它卻提醒我，因?yàn)橛脩袅刻?，sora賬戶無法使用。

哎，這就像大夏天想喝冰鎮(zhèn)可樂，卻發(fā)現(xiàn)杯子里什么都沒有，既期待又失落。我相信身邊也有很多朋友想體驗(yàn)但沒能體驗(yàn)到。

不過，沒關(guān)系，這里有幾款A(yù)I視頻生成模型做出來的效果，并不比sora差。在我心中排在第一位的，你猜是哪款？騰訊混元文生視頻。

為什么呢？

想必上一周，你也刷到了騰訊混元文生視頻開放的信息，它在GitHub、Hugging Face和各大技術(shù)報(bào)告中都能找到。

如果想親自體驗(yàn)，可以直接去官網(wǎng)試用。在官網(wǎng)上，你能看到很多逼真的人物視頻。不過，要注意，這些展示視頻可能經(jīng)過了多次調(diào)整。

目前，騰訊混元的視頻模型，雖然只能實(shí)現(xiàn)文字生成視頻的功能，但它在很多方面表現(xiàn)出色，比如畫面質(zhì)量、鏡頭切換效果、物體運(yùn)動(dòng)表現(xiàn)，以及對(duì)提示詞的理解等。

你只要輸入一段文字描述，它就能生成一段5秒鐘的視頻。中文和英文的提示詞都可以使用，生成的視頻畫面非常真實(shí)，看起來就像電影一樣。

剛內(nèi)測(cè)時(shí)，我測(cè)試了近景、中景、廣景、特寫等類別?，F(xiàn)在這些視頻還在空間里。我給近景的提示詞是「一只貓?jiān)诓莸厣仙⒉降膱?chǎng)景」。

我選擇了寫實(shí)風(fēng)格，配上自然光效果，用專業(yè)鏡頭拍攝，追求高質(zhì)量畫面。最終的效果非常真實(shí)，完全能以假亂真。

特寫方面，我在成都一個(gè)熱鬧的小吃街上，主播穿著四川特色的服裝，頭上戴著可愛的熊貓耳朵發(fā)箍。她正在品嘗麻辣串串，背景是熙熙攘攘的小吃街，還有各種誘人的美食。生成的效果也不錯(cuò)，不至于讓人感到不適。

至于其他類別，你可以自己試試。我發(fā)現(xiàn)，騰訊在產(chǎn)品細(xì)節(jié)方面做得很不錯(cuò)，它能把風(fēng)格、標(biāo)簽、類型、氛圍和光線都展示得很清楚。

從提示詞來看，騰訊做得比其他產(chǎn)品好，其他產(chǎn)品的提示詞可能讓你寫一段話再生成，但生成的內(nèi)容往往和你想要的有差距。在這方面，騰訊的產(chǎn)品設(shè)計(jì)更人性化。

現(xiàn)在它每天以速度優(yōu)先能生成5個(gè)視頻，以質(zhì)量?jī)?yōu)先能生成2個(gè)。但我覺得，在質(zhì)量和速度上，兩者的差異并不大。

第二個(gè)產(chǎn)品是什么呢？字節(jié)的即夢(mèng)AI。

即夢(mèng)AI，真的很懂我想要什么，不用復(fù)雜的提示詞，都能搞定一切。

說到即夢(mèng)，不能不提兩個(gè)軟件。一個(gè)是剪映，很多剪視頻的人都用過。它簡(jiǎn)單易用，就像剪輯界的傻瓜相機(jī)。無論是新手還是老手，大家都挺喜歡的。

我記得早些年時(shí)，即夢(mèng)不叫即夢(mèng)，叫「Dreamina」，那時(shí)它還是剪映里的一個(gè)功能，后來才獨(dú)立出來，并同時(shí)推出了一些新功能。

另一個(gè)要提到的是抖音。我不知道你有沒有刷到過那些把古典影視劇剪輯成搞笑段子的視頻，還有AI生成的寫真照，這些基本都來自即夢(mèng)的小工具。

至于能力上，文生視頻、文生圖自然是不可缺失一部分，拿文生圖來說，我小綠書上所有的圖片幾乎都是用它制作而成。

在視頻上，即夢(mèng)AI目前有四個(gè)模型，分別是視頻S2.0、視頻2.0PRO、視頻P2.0Pro和視頻1.2。我試過這幾個(gè)模型，它們各有特點(diǎn)。

S2.0擅長捕捉流暢感，可以把一張圖的色彩和細(xì)節(jié)平滑過渡到視頻里。2.0PRO則更擅長把圖片變成視頻，做得更精細(xì)；P2.0Pro能理解復(fù)雜指令，在一句提示下實(shí)現(xiàn)多個(gè)鏡頭切換，同時(shí)保持視頻的形象、風(fēng)格和氛圍一致。

至于視頻1.2模型，主要在運(yùn)鏡和時(shí)長上下功夫。

最近，1.2模型正在測(cè)試一個(gè)新功能，叫動(dòng)效畫板，這個(gè)功能很強(qiáng)大，因?yàn)樗茏屇慵?xì)致調(diào)整視頻中物體的運(yùn)動(dòng)軌跡和最終狀態(tài)，就像在視頻里給物體設(shè)定一套動(dòng)作。

具體來說，動(dòng)效畫板能做很多事情。比如：

單主體形變、多主體運(yùn)動(dòng)、主體互動(dòng)、主體與背景互動(dòng)、自定義軌跡、自動(dòng)框選主體或背景等等，一開始，我看著術(shù)語也有點(diǎn)暈，實(shí)際用起來發(fā)現(xiàn)并不復(fù)雜。

對(duì)了，如果你想用在商業(yè)上，字節(jié)旗下的「即創(chuàng)」是不錯(cuò)的選擇。它在電商領(lǐng)域特別受歡迎，功能包括智能剪輯、數(shù)字人制作視頻、AI視頻腳本、圖文工具和直播工具等等。

所以，我覺得在電商這塊，「即創(chuàng)」比「即夢(mèng)」用得更高頻，至于即夢(mèng)，可能更適合娛樂場(chǎng)合，你都可以試試看。

第三個(gè)要提到的AI視頻工具是：Kimi。

要找到Kimi，得在聊天界面下面留意一下，那兒有個(gè)不太顯眼的按鈕，上面寫著：Kimi創(chuàng)作空間。點(diǎn)進(jìn)去，就能看到它的宣傳語：你喜歡的歌都有它的視頻。

我們可以把Kimi的這個(gè)功能叫做：文生音視頻。如果拿Kimi和即夢(mèng)AI比較，從整體產(chǎn)品來看，Kimi可能不如即夢(mèng)AI，它們之間的差別挺大的。

但是，Kimi也有自己優(yōu)勢(shì)，它能細(xì)致到視頻的每一幀。

比如：我要做一個(gè)10秒的視頻，在Kimi后臺(tái)可以看到，這10秒的視頻可能包含10幀或者12幀，每一幀都是一張圖片。

如果對(duì)某一幀圖片不滿意，我可以調(diào)整提示詞，讓它重新生成。所以，我覺得Kimi在細(xì)節(jié)處理上做得挺好的。

第四個(gè)要說的工具是騰訊智影，它也是騰訊推出的。

我現(xiàn)在覺得，AI視頻工具大概分兩類：一類是用來玩的，比如做藝術(shù)照、藝術(shù)視頻、國風(fēng)短片、科幻視頻這些。

另一類更偏向?qū)嵱?，比如剪視頻、識(shí)別字幕、摳圖、做動(dòng)態(tài)漫畫、去掉背景，還有制作視頻解說等等。

騰訊智影更偏向?qū)嵱?，它里面的小工具用起來很方便，很多人想找AI數(shù)字人，騰訊智影是個(gè)不錯(cuò)的選擇。你只需要選個(gè)角色，輸入文字，它就能幫你生成數(shù)字人播報(bào)的視頻。

還有一點(diǎn)，騰訊有個(gè)很大的優(yōu)勢(shì)，就是它手里有很多視頻素材的版權(quán)。像那些流行的劇短片、短劇里的素材，都能直接在騰訊智影里找到，而且是免費(fèi)的。

這一點(diǎn)比其他平臺(tái)強(qiáng)，至少不用擔(dān)心版權(quán)問題，我每次找不到素材，就會(huì)去騰訊智影里搜一搜。

最后一個(gè)要提到的是可靈。可靈是快手推出AI視頻工具，現(xiàn)在有兩個(gè)模型，一個(gè)是可靈 1.0，一個(gè)是可靈 1.5；它沒有明確區(qū)分場(chǎng)景和人物，我用的時(shí)候也搞不清哪個(gè)模型適合近景、遠(yuǎn)景或者人物。

它支持文字生成視頻和圖文轉(zhuǎn)視頻，但用下來感覺有些地方還不夠好。比如，生成的視頻看起來還有點(diǎn)AI味道，這方面的確有提升空間。

不過，如果是用來做短視頻創(chuàng)作，只要提示詞寫得好，生成的效果基本能滿足日常需求。

我也用過不少國外的工具，說實(shí)話，國外產(chǎn)品在多模態(tài)功能上確實(shí)比國內(nèi)的一些強(qiáng)，但網(wǎng)絡(luò)問題太麻煩了。

我試過好幾款，每次上傳幾十兆的視頻或者十幾兆的照片，都要等很久。等它生成完視頻再下載，時(shí)間耗光不說，耐心也沒了。

后來我就想，能不能試試國內(nèi)的工具？現(xiàn)在看來，完全沒問題。國內(nèi)的AI視頻生成技術(shù)已經(jīng)很強(qiáng)了，甚至用起來比國外的還更順手。

說到這，我想起前兩天看到一篇國外的文章，講的是為什么AI做的藝術(shù)看起來那么廉價(jià)。文章提到，像DALL-E和Midjourney這樣的AI，需要用大量數(shù)據(jù)來學(xué)習(xí)，但光靠提示詞是不夠的。

比如：

AI要畫「宇航員騎馬」這種圖，還是會(huì)有挺多問題，看著怪里怪氣的，不夠真實(shí)。

這些AI做出來的圖，不管是顯眼的地方還是不明顯的地方，都可能有問題。因?yàn)锳I太依賴數(shù)據(jù)，它沒法準(zhǔn)確畫出人的手到底長啥樣。

心理學(xué)家和AI評(píng)論家加里馬庫斯（Gary Marcus）也說過：AI處理不了數(shù)據(jù)里沒有的東西，這部分是人類想象力的領(lǐng)域。就算是最新的AI模型，你讓它畫「宇航員騎馬」，它畫出來的圖還是會(huì)帶著一種很明顯的2020年代中期的風(fēng)格。

你玩得越多，就越明白，要從AI視頻里得到真正有趣的原創(chuàng)內(nèi)容有多難；所以，AI最擅長的，可能就是讓網(wǎng)上充滿了那種平庸、短暫的藝術(shù)作品。

藝術(shù)家戴爾沃克（Del Walker）在X平臺(tái)上寫道：用AI圖片做營銷，就等于告訴大家你沒預(yù)算，就像背了個(gè)假的香奈兒包，品牌形象一下子就low了。

所以，我覺得，文生視頻的競(jìng)爭(zhēng)力就在這些細(xì)節(jié)上。

不管是Sora還是其他工具，大家評(píng)價(jià)一個(gè)視頻有沒有藝術(shù)感，主要看細(xì)節(jié)；而這些細(xì)節(jié)，一部分可以交給AI處理，但另一部分還得靠人類的創(chuàng)意和后期加工。

上述提到的騰訊混元文生視頻、即夢(mèng)AI、Kimi、騰訊智影、可靈，是我用著還不錯(cuò)；當(dāng)然，清影AI、viduAI、HaiperAI也算領(lǐng)頭羊，都可以試試看。

看完覺得寫得好的，不防打賞一元，以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。

標(biāo)簽：視頻騰訊生成隨筆

本文地址：http://yinbad.com.cn/suibi/38656.html

文章來源：藍(lán)海情報(bào)網(wǎng)

版權(quán)聲明：如果你想發(fā)貼或咨詢項(xiàng)目，請(qǐng)咨詢?cè)诰€客服人員！

国产精品综合av_日韩精品偷拍一区二区_久草视频资源在线_亚洲视频 中文字幕_亚洲电影AV一区春药高潮_小×导航福利在线导航_欧美性爱一级短视频_人成视频免费在线观看不卡_国产九色在线播放_国产高清无码一区二区

比Sora好用的AI視頻工具

国产精品综合av_日韩精品偷拍一区二区_久草视频资源在线_亚洲视频中文字幕_亚洲电影AV一区春药高潮_小×导航福利在线导航_欧美性爱一级短视频_人成视频免费在线观看不卡_国产九色在线播放_国产高清无码一区二区