文:王智遠 | ID:Z201440
OpenAI發(fā)布了長達12天的Shipmas。
Shipmas,是「ship」和「Christmas」的組合。簡單講,在特殊時期,推出很多產(chǎn)品更新,既給用戶帶來驚喜,也像在慶祝節(jié)日一樣。
剛開始發(fā)布時,我還跟朋友說,國內(nèi)大模型公司在搞發(fā)布會,應(yīng)該跟Open Ai取取經(jīng)。
冬天那么冷,去現(xiàn)場聽演講,結(jié)果講的內(nèi)容也不多,大家在臺下,有的玩手機,有的只是來打個卡,說實話,花那么多錢,最后只換來幾篇報道和幾條朋友圈,對客戶和宣傳效果都很有限。
OpenAI的做法有些不同。
他們只要一個小黑屋、一張桌子、兩臺電腦和四個人,就能搞定一切。雖然更新速度有點像擠牙膏,但是這樣能讓關(guān)注他們產(chǎn)品的客戶、用戶清楚地知道他們在做什么。
有人覺得這種漸進式的發(fā)布會缺乏吸引力,但實際上,它在傳播信息同時,讓關(guān)注的人有機會更深入地了解背后的模型和技術(shù)理念。
比如說:
關(guān)于技術(shù)微調(diào)的細節(jié)。如果在大型發(fā)布會上簡單提及,可能幾句話就帶過了,大家的印象也不會很深。
但如果單獨用一天時間深入講解,就能展示更多的例子和演示,讓技術(shù)人員和用戶更直觀地理解這些技術(shù)細節(jié),從而達到更實際和深刻的認(rèn)識。
所以,這種辦法很適合經(jīng)濟實用型的公司嘗試一下。發(fā)布會已經(jīng)進行到第四天了,我連續(xù)熬了三個大夜。如果你錯過了前幾天的內(nèi)容,我來幫你補上。
活動第一天,OpenAI推出o1完整版及o1 pro模式。
什么是o1模型完整版呢?
這個版本在之前的o1預(yù)覽版上做了全面提升。它現(xiàn)在不僅能處理文本,還能處理截圖、照片、網(wǎng)頁、上傳的文件等等,功能更強大了。
而且,它還采用了新的推理方式。就像人的思維方式一樣,o1模型完整版會一步步推理,這樣在回答專業(yè)問題時就更準(zhǔn)確了。
跟預(yù)覽版比,這個版本的o1模型思考問題更簡潔,速度提高了50%,而且在回答難題時,出錯的可能性也降低了34%。
作為個人博主,這些數(shù)據(jù)我肯定沒辦法測試,但我可以跟你講講官方給的例子。
發(fā)布會上,o1模型的負責(zé)人畫了一個草圖。這個草圖是關(guān)于一個系統(tǒng),用來收集太陽能,供應(yīng)給太空數(shù)據(jù)中心。
因為太空里不能用水冷卻系統(tǒng),所以得靠一個巨大的散熱片來散熱;研究員問o1模型,如果要給數(shù)據(jù)中心提供1吉瓦的電力,需要多大地方的散熱片才能保證GPU正常工作?
o1模型準(zhǔn)確地識別了草圖,經(jīng)過分析和計算,得出結(jié)論:需要242萬平方米的散熱片來滿足散熱需求。
不說別的,至少從演示上看,的確很強大。
不過,強大歸強大,之前大家說的那個「有點貴」的版本,第一天就出現(xiàn)了,他們推出的ChatGPT Pro。
這個服務(wù),每個月要200美金,可以隨便用他們最先進的模型和工具,包括OpenAI的o1、o1-mini、GPT-4o和Advanced Voice,主要給需要解決特別復(fù)雜計算問題的人準(zhǔn)備的。
我覺得,這種服務(wù)可能更適合那些需要搞高級數(shù)據(jù)分析、處理的科研人員、工程師還有其他的一些專業(yè)人士,能幫他們提高工作效率,也能讓他們跟上人工智能的最新技術(shù)。
有專家測試說o1 pro模式在處理那些復(fù)雜的數(shù)據(jù)科學(xué)、編程和案例分析問題時,確實能給出比以前的模型更準(zhǔn)確的答案;在數(shù)學(xué)、科學(xué)和編程這些領(lǐng)域的機器學(xué)習(xí)測試?yán)?,o1 pro模式比o1和o1-preview模型表現(xiàn)更好。
但是,他們會花200美刀用這個嗎?我不知道。當(dāng)時,還開玩笑在朋友圈說,有這么多預(yù)算,還不如用集合工具Monica,一個月不到20美金,能用十幾個模型,不是更劃算嗎?
第二天open AI推出了什么呢?
一句話總結(jié)即:推出強化微調(diào)能力(Reinforcement Fine-Tuning)。什么是強化微調(diào)?簡單的說:給AI模型一個專業(yè)培訓(xùn)課程。
通過強化微調(diào),可以用很少的實際案例(比如:幾十個例子)來教這個AI模型成為一個領(lǐng)域的專家。
直播里,四個人在場,唯一的華裔女研究員Julie Wang介紹了這個能力。她說,這個能力能讓小體量的模型從高中水平跳到專家水平。
實操環(huán)節(jié),他們舉了兩個例子。
一個是和湯森路透合作的,為法律專業(yè)人士打造的AI模型。他們覺得,在很多行業(yè)里,雖然專家有很深的專業(yè)知識和豐富的經(jīng)驗,但在處理大量數(shù)據(jù)和復(fù)雜任務(wù)時,可能會因為時間和精力的限制。
比如:在法律領(lǐng)域,律師要處理好多法律條文和案例。
他們可以用專業(yè)知識分析,但如果用經(jīng)過強化微調(diào)的AI模型,可以更快地找到相關(guān)案例,進行初步的法律條文匹配,給律師提供決策參考,提高工作效率。
但這個例子是一個展示,似乎沒什么說服力。另一個例子是,生物醫(yī)學(xué)任務(wù)的實驗。
伯克利大學(xué)的罕見遺傳病研究員Justin Reese,把很多臨床病例數(shù)據(jù)通過API輸入到o1 mini模型里。
這些數(shù)據(jù)包括病人的基本信息、癥狀描述。比如:一個51歲的女性,癥狀有眼距過寬、瞼裂狹小、軟腭咽閉合不全、甲狀旁腺功能減退、全身發(fā)育遲緩和感覺神經(jīng)性聽力障礙、等等。
然后,用強化微調(diào)技術(shù)訓(xùn)練o1 mini模型做醫(yī)療診斷任務(wù)。訓(xùn)練時,模型要根據(jù)癥狀描述找出可能的基因,并排序。
評分模型會對答案打分,分?jǐn)?shù)從0到1。0表示模型輸出中沒有正確答案,1表示正確答案在輸出的第一個位置,通過性能監(jiān)控,可以看到微調(diào)過程中模型指標(biāo)的變化。
結(jié)果表明,經(jīng)過強化微調(diào)的o1 mini模型在特定任務(wù)上的表現(xiàn)超過了更強大的o1模型,在top@1、top@5和top@max這些指標(biāo)上,o1 mini模型都明顯超過了o1模型。
這個案例,在OpenAI的官網(wǎng)可以看到。不過,兩個能力都是「期貨」,明年才正式推出,主要面向企業(yè)或科研單位等潛在客戶。
千萬不要小看微調(diào)技術(shù),說實話,現(xiàn)在大型語言模型(LLM)還做不到復(fù)雜的創(chuàng)造性活動,比如:批判性思維和深度頭腦風(fēng)暴。
這既是壞事也是好事,因為這樣,我們就可以把模型用在那些瑣碎、重復(fù)、無聊而且不需要創(chuàng)造性的任務(wù)上,這樣做,它們就能慢慢提高自己的準(zhǔn)確性。
這就是,第二天的內(nèi)容,一個詞總結(jié)即:微調(diào)技術(shù)。
Open AI第三天推出了sora。鴿子一年多的期貨來了,不過,因為之前連續(xù)熬夜,我實在撐不住,12點半就睡了。第二天醒來想試試Sora,但登錄時發(fā)現(xiàn)因為用戶太多,暫時用不了。
沒關(guān)系,我看了Sora的發(fā)布會。
OpenAI團隊在會上展示了這個工具的厲害之處,還教大家怎么用;他們教我們怎么生成視頻,包括設(shè)置分鏡、輸入視頻指令、選風(fēng)格、畫面比例、時長等等。通過演示,讓所有人對Sora有了更深的認(rèn)識。
Sora的使用過程相當(dāng)靈活,你可以用分鏡功能看不同角度的畫面,然后,輸入你想要視頻怎么做。OpenAI說:指令越簡單,Sora自己發(fā)揮的越多;指令越詳細,它就越聽你的。
在直播中,Sora把兩個不連著的視頻片段合成了一段有故事感的視頻。雖然細節(jié)有點出入,但整體效果的確令人驚訝。
Sora還能讓你上傳圖片或視頻,然后生成后續(xù)視頻的文字描述。你可以隨便改指令,在時間軸上調(diào)整,決定視頻啥時候播。這個功能挺有創(chuàng)造力的。
還有一點,生成視頻后,還能用remix工具改。
這個工具看起來很絲滑,它能對視頻進行各種創(chuàng)意上的改編。怎么改呢?可以調(diào)強度,從1級到8級,想要多大變化都行。
還有預(yù)設(shè)的選項,比如:溫和、適中或者強烈。用這個工具,可以保留視頻里想要的部分,其他的,想怎么變就怎么變,比如:把猛犸象換成機器人,或者變?nèi)宋锉砬榈鹊取?/p>
我覺得,Sora不光是視頻工具,它把視頻生成和工作流程結(jié)合起來了,這對OpenAI挺重要;因為Sam Altman在直播里說,他們想讓AI理解視頻,改變我們用電腦的方式。
想要做到這點,在通往AGI的路上,得做很多優(yōu)化,而把工作流和視頻生成結(jié)合起來,是個不錯的辦法。
不過,Sora看著不錯,但是價格有點高。比如:
你要是選Plus會員,每個月得花20美元,能做最多50個視頻,視頻質(zhì)量一般,最高只能到720p,而且每個視頻最長也就5秒。
如果你想要更好的,得選Pro會員,一個月得200美元,最高清晰度能到1080p,每個視頻才能生成20秒,而且Sora尚未在歐盟、瑞士和英國上線。
這就是第三天關(guān)于Sora的內(nèi)容,感嘆又期待,你會付費嗎?
今天,OpenAI直播到了第四天,由他們的首席產(chǎn)品官Kevin Weil來主持。重點是什么呢?即:Canvas正式上線了。
之前,Canvas的一些功能已經(jīng)在ChatGPT里展示過,但那時它是單獨的一個模型?,F(xiàn)在,它和其他模型融合在一起了。
那么,Canvas這次和以前有什么不同呢?有三個:
一,現(xiàn)在可以直接從首頁的輸入框跳轉(zhuǎn)到Canvas; 二,集成了一個Web Assembly的Python模擬器,可以直接運行Python代碼,還能在線修bug; 三,Canvas功能整合進了GPTs。
為了讓大家更清楚地看到Canvas的新功能,OpenAI的工程師Lee和Alexey還做了現(xiàn)場演示。Lee教我們怎么用Canvas寫一個兒童圣誕故事。
在ChatGPT的輸入框里,點一下新加的工具按鈕,就能切換到Canvas,你可以和ChatGPT一起編輯文檔,不管是改標(biāo)題、加表情,還是調(diào)整文章的長度和閱讀難度,都變得很簡單。
這就像百度的自由畫布,用戶和ChatGPT可以一起創(chuàng)作,寫作和修改的過程都很自然。
發(fā)布會上,Alexey還展示了Canvas怎么幫我們改文章。他把一篇關(guān)于圣誕老人、暗能量和馴鹿推進力的物理論文貼到ChatGPT里,然后用Canvas打開。
ChatGPT不僅能給出專業(yè)的修改建議,還能在文章里直接加評論,這樣用戶就能很方便地查看和修改。用戶可以根據(jù)自己的思路來改文章,想復(fù)制最終版本也隨時可以。
Alexey還演示了怎么用Canvas調(diào)試Python代碼和生成圖表。Canvas里內(nèi)置了一個WebAssembly Python模擬器,可以快速加載幾乎所有Python庫,運行代碼,還能即時反饋,這對提高編程效率真的很有幫助。
另外,Canvas的功能也整合進了GPTs里。比如:
Lee就創(chuàng)建了一個叫圣誕老人助手的GPT,用來幫圣誕老人回復(fù)孩子們的信件。
只要在自定義GPT的說明里加上使用Canvas工具的指令,再勾選Canvas功能,自定義GPT就能自動在Canvas里生成信件草稿,圣誕老人可以根據(jù)實際情況修改草稿,用自己的風(fēng)格和語氣回復(fù)孩子們。
我之前一直在用Canvas,還想過,國內(nèi)廠商啥時候也能引進Canvas這樣的功能。我覺得Canvas(畫布)是讓大家一起工作更聰明的一個關(guān)鍵步驟。
因為不管是自己用,還是大家一起用,總得有個地方能三個人一起做事情,以前可能用類似于在線文檔的工具,實現(xiàn)共同編輯的動作,以后,畫布可能是首選協(xié)同之一了。
這就是今天發(fā)布會的內(nèi)容,關(guān)于Canvas。
好了,總結(jié)下四天的內(nèi)容,分別是:推出o1完整版及o1 pro、推出強化微調(diào)能力、推出新產(chǎn)品sora、以及把Canvas進行全新升級。
接下來的8天里,還有什么新產(chǎn)品呢?值得期待。
看完覺得寫得好的,不防打賞一元,以支持藍海情報網(wǎng)揭秘更多好的項目。