AI風口上,國內(nèi)大模型技術突飛猛進,很多人都沉浸在用AI來輔助辦公,輔助學習等等工具化應用落地,但也有趁著風口想大賺一筆,為了估值什么都敢說的。
前幾天,Kimi對外宣稱自己的技術狂飆到能讀200萬字甚至1000萬字的長文,至于是否能真的理解和分析這么多字我在這里先打一個大大的問號,畢竟在我讓Kimi幫我計算一下從2023年12月10日到2024年6月5日一共過了多少天的時候,它說有198天,最后反復計算又是179 ,主打一個已讀亂回。
有人說了,可是他真的能給你總結(jié)出紅樓夢的相關內(nèi)容和人物情節(jié),注意這不是Kimi在讀紅樓,它本身的技術根本做不到。因為Transformer架構(gòu)下的大模型在本質(zhì)上決定了它在處理上下文時候是天然具有限制的。每一個新的token在計算的時候,需要跟之前的每一個分詞進行一次交互,就像一場聚會上,你要和每個參加活動的人都握手,人越多握手次數(shù)越多,可以說是指數(shù)級增長。
因此,上下文越長,需要交互的次數(shù)和計算的量級越大,200萬的上下文長度意味著要投入更多的算力,買更多GPU。但現(xiàn)在面對美國的制裁,全球算力都很昂貴,創(chuàng)業(yè)公司誰敢這么干?
還有個方法叫做滑動窗口技術,把200萬字的文本截成一段一段,每一段都用一些語言去總結(jié),然后再標記下一段,用更簡單的語言去總結(jié)。但這么做一定會有信息的丟失,不是完整的理解,對技術要求非常高。很早之前的ChatGPT和Copilot是這么做的,但也沒有鼓吹。
而Kimi之所以能快速給你反饋紅樓夢的一些信息,是它用了rag檢索增強模式,就是通過外部文檔的搜索和向量搜索來輔助大模型理解,把各個網(wǎng)絡渠道關于紅樓夢的解讀、評論等等信息總結(jié)收集給你而已,省時省力省錢,他沒有在讀,更何談理解分析。
當然,輿論說他割韭菜也不僅僅是因為這個,最近關于Kimi母公司月之暗面創(chuàng)始人減持套現(xiàn)的消息也一度讓圈內(nèi)炸開了鍋,AI 大模型,一個正在燒錢造夢的產(chǎn)業(yè),創(chuàng)始人在這個階段選擇套現(xiàn),難道他們的產(chǎn)品是虛假泡沫,要棄船逃生?一個初創(chuàng)公司,成立一年就套現(xiàn)了幾個億的小目標,實屬罕見。不過,公司后來否認了這一消息。
Kimi雖然在基礎模型的理解生成邏輯等硬性指標上和第一梯隊無法相比,但也借此機會火了一把,對于一家初創(chuàng)公司,靠著這把火,又可以融資到很多錢了。就在5月底,阿里巴巴投資了Kimi母公司月之暗面,一筆投資就高達8億美元,大約59億人民幣,獲取月之暗面36%的股權。對于此次阿里投資Kimi,市場紛紛懷疑阿里投資能力,畢竟投資的大潤發(fā)、蘇寧紛紛以巨虧收場······
他們(月之暗面)在國內(nèi)大模型上領先,但長遠還是要證明自己的價值,至少能追上美國開源。如果能超過開源,他這個團隊是真的有價值了。據(jù)每日經(jīng)濟新聞報道,在今年的一次媒體采訪中,金沙江創(chuàng)投主管合伙人朱嘯虎在肯定楊植麟團隊在大模型領域上的技術能力時,對其商業(yè)化能力持保留態(tài)度。
還是那句話,AI是個很硬核的行業(yè),講情懷講噱頭甚至偷換概念空喊口號的公司,最后難免泡沫的結(jié)局。
看完覺得寫得好的,不防打賞一元,以支持藍海情報網(wǎng)揭秘更多好的項目。