一口氣看完OpenAI前四天內(nèi)容

藍海情報網(wǎng) 2024-12-12 18:39:49 282

文：王智遠 | ID:Z201440

OpenAI發(fā)布了長達12天的Shipmas。

Shipmas，是「ship」和「Christmas」的組合。簡單講，在特殊時期，推出很多產(chǎn)品更新，既給用戶帶來驚喜，也像在慶祝節(jié)日一樣。

剛開始發(fā)布時，我還跟朋友說，國內(nèi)大模型公司在搞發(fā)布會，應(yīng)該跟Open Ai取取經(jīng)。

冬天那么冷，去現(xiàn)場聽演講，結(jié)果講的內(nèi)容也不多，大家在臺下，有的玩手機，有的只是來打個卡，說實話，花那么多錢，最后只換來幾篇報道和幾條朋友圈，對客戶和宣傳效果都很有限。

OpenAI的做法有些不同。

他們只要一個小黑屋、一張桌子、兩臺電腦和四個人，就能搞定一切。雖然更新速度有點像擠牙膏，但是這樣能讓關(guān)注他們產(chǎn)品的客戶、用戶清楚地知道他們在做什么。

有人覺得這種漸進式的發(fā)布會缺乏吸引力，但實際上，它在傳播信息同時，讓關(guān)注的人有機會更深入地了解背后的模型和技術(shù)理念。

比如說：

關(guān)于技術(shù)微調(diào)的細節(jié)。如果在大型發(fā)布會上簡單提及，可能幾句話就帶過了，大家的印象也不會很深。

但如果單獨用一天時間深入講解，就能展示更多的例子和演示，讓技術(shù)人員和用戶更直觀地理解這些技術(shù)細節(jié)，從而達到更實際和深刻的認(rèn)識。

所以，這種辦法很適合經(jīng)濟實用型的公司嘗試一下。發(fā)布會已經(jīng)進行到第四天了，我連續(xù)熬了三個大夜。如果你錯過了前幾天的內(nèi)容，我來幫你補上。

活動第一天，OpenAI推出o1完整版及o1 pro模式。

什么是o1模型完整版呢？

這個版本在之前的o1預(yù)覽版上做了全面提升。它現(xiàn)在不僅能處理文本，還能處理截圖、照片、網(wǎng)頁、上傳的文件等等，功能更強大了。

而且，它還采用了新的推理方式。就像人的思維方式一樣，o1模型完整版會一步步推理，這樣在回答專業(yè)問題時就更準(zhǔn)確了。

跟預(yù)覽版比，這個版本的o1模型思考問題更簡潔，速度提高了50%，而且在回答難題時，出錯的可能性也降低了34%。

作為個人博主，這些數(shù)據(jù)我肯定沒辦法測試，但我可以跟你講講官方給的例子。

發(fā)布會上，o1模型的負責(zé)人畫了一個草圖。這個草圖是關(guān)于一個系統(tǒng)，用來收集太陽能，供應(yīng)給太空數(shù)據(jù)中心。

因為太空里不能用水冷卻系統(tǒng)，所以得靠一個巨大的散熱片來散熱；研究員問o1模型，如果要給數(shù)據(jù)中心提供1吉瓦的電力，需要多大地方的散熱片才能保證GPU正常工作？

o1模型準(zhǔn)確地識別了草圖，經(jīng)過分析和計算，得出結(jié)論：需要242萬平方米的散熱片來滿足散熱需求。

一口氣看完OpenAI前四天內(nèi)容

不說別的，至少從演示上看，的確很強大。

不過，強大歸強大，之前大家說的那個「有點貴」的版本，第一天就出現(xiàn)了，他們推出的ChatGPT Pro。

這個服務(wù)，每個月要200美金，可以隨便用他們最先進的模型和工具，包括OpenAI的o1、o1-mini、GPT-4o和Advanced Voice，主要給需要解決特別復(fù)雜計算問題的人準(zhǔn)備的。

我覺得，這種服務(wù)可能更適合那些需要搞高級數(shù)據(jù)分析、處理的科研人員、工程師還有其他的一些專業(yè)人士，能幫他們提高工作效率，也能讓他們跟上人工智能的最新技術(shù)。

有專家測試說o1 pro模式在處理那些復(fù)雜的數(shù)據(jù)科學(xué)、編程和案例分析問題時，確實能給出比以前的模型更準(zhǔn)確的答案；在數(shù)學(xué)、科學(xué)和編程這些領(lǐng)域的機器學(xué)習(xí)測試?yán)?，o1 pro模式比o1和o1-preview模型表現(xiàn)更好。

但是，他們會花200美刀用這個嗎？我不知道。當(dāng)時，還開玩笑在朋友圈說，有這么多預(yù)算，還不如用集合工具Monica，一個月不到20美金，能用十幾個模型，不是更劃算嗎？

第二天open AI推出了什么呢？

一句話總結(jié)即：推出強化微調(diào)能力（Reinforcement Fine-Tuning）。什么是強化微調(diào)？簡單的說：給AI模型一個專業(yè)培訓(xùn)課程。

通過強化微調(diào)，可以用很少的實際案例（比如：幾十個例子）來教這個AI模型成為一個領(lǐng)域的專家。

直播里，四個人在場，唯一的華裔女研究員Julie Wang介紹了這個能力。她說，這個能力能讓小體量的模型從高中水平跳到專家水平。

實操環(huán)節(jié)，他們舉了兩個例子。

一個是和湯森路透合作的，為法律專業(yè)人士打造的AI模型。他們覺得，在很多行業(yè)里，雖然專家有很深的專業(yè)知識和豐富的經(jīng)驗，但在處理大量數(shù)據(jù)和復(fù)雜任務(wù)時，可能會因為時間和精力的限制。

比如：在法律領(lǐng)域，律師要處理好多法律條文和案例。

他們可以用專業(yè)知識分析，但如果用經(jīng)過強化微調(diào)的AI模型，可以更快地找到相關(guān)案例，進行初步的法律條文匹配，給律師提供決策參考，提高工作效率。

一口氣看完OpenAI前四天內(nèi)容

但這個例子是一個展示，似乎沒什么說服力。另一個例子是，生物醫(yī)學(xué)任務(wù)的實驗。

伯克利大學(xué)的罕見遺傳病研究員Justin Reese，把很多臨床病例數(shù)據(jù)通過API輸入到o1 mini模型里。

這些數(shù)據(jù)包括病人的基本信息、癥狀描述。比如：一個51歲的女性，癥狀有眼距過寬、瞼裂狹小、軟腭咽閉合不全、甲狀旁腺功能減退、全身發(fā)育遲緩和感覺神經(jīng)性聽力障礙、等等。

然后，用強化微調(diào)技術(shù)訓(xùn)練o1 mini模型做醫(yī)療診斷任務(wù)。訓(xùn)練時，模型要根據(jù)癥狀描述找出可能的基因，并排序。

評分模型會對答案打分，分?jǐn)?shù)從0到1。0表示模型輸出中沒有正確答案，1表示正確答案在輸出的第一個位置，通過性能監(jiān)控，可以看到微調(diào)過程中模型指標(biāo)的變化。

結(jié)果表明，經(jīng)過強化微調(diào)的o1 mini模型在特定任務(wù)上的表現(xiàn)超過了更強大的o1模型，在top@1、top@5和top@max這些指標(biāo)上，o1 mini模型都明顯超過了o1模型。

這個案例，在OpenAI的官網(wǎng)可以看到。不過，兩個能力都是「期貨」，明年才正式推出，主要面向企業(yè)或科研單位等潛在客戶。

千萬不要小看微調(diào)技術(shù)，說實話，現(xiàn)在大型語言模型（LLM）還做不到復(fù)雜的創(chuàng)造性活動，比如：批判性思維和深度頭腦風(fēng)暴。

這既是壞事也是好事，因為這樣，我們就可以把模型用在那些瑣碎、重復(fù)、無聊而且不需要創(chuàng)造性的任務(wù)上，這樣做，它們就能慢慢提高自己的準(zhǔn)確性。

這就是，第二天的內(nèi)容，一個詞總結(jié)即：微調(diào)技術(shù)。

Open AI第三天推出了sora。鴿子一年多的期貨來了，不過，因為之前連續(xù)熬夜，我實在撐不住，12點半就睡了。第二天醒來想試試Sora，但登錄時發(fā)現(xiàn)因為用戶太多，暫時用不了。

沒關(guān)系，我看了Sora的發(fā)布會。

OpenAI團隊在會上展示了這個工具的厲害之處，還教大家怎么用；他們教我們怎么生成視頻，包括設(shè)置分鏡、輸入視頻指令、選風(fēng)格、畫面比例、時長等等。通過演示，讓所有人對Sora有了更深的認(rèn)識。

Sora的使用過程相當(dāng)靈活，你可以用分鏡功能看不同角度的畫面，然后，輸入你想要視頻怎么做。OpenAI說：指令越簡單，Sora自己發(fā)揮的越多；指令越詳細，它就越聽你的。

一口氣看完OpenAI前四天內(nèi)容

在直播中，Sora把兩個不連著的視頻片段合成了一段有故事感的視頻。雖然細節(jié)有點出入，但整體效果的確令人驚訝。

Sora還能讓你上傳圖片或視頻，然后生成后續(xù)視頻的文字描述。你可以隨便改指令，在時間軸上調(diào)整，決定視頻啥時候播。這個功能挺有創(chuàng)造力的。

還有一點，生成視頻后，還能用remix工具改。

這個工具看起來很絲滑，它能對視頻進行各種創(chuàng)意上的改編。怎么改呢？可以調(diào)強度，從1級到8級，想要多大變化都行。

還有預(yù)設(shè)的選項，比如：溫和、適中或者強烈。用這個工具，可以保留視頻里想要的部分，其他的，想怎么變就怎么變，比如：把猛犸象換成機器人，或者變?nèi)宋锉砬榈鹊取?/p>

我覺得，Sora不光是視頻工具，它把視頻生成和工作流程結(jié)合起來了，這對OpenAI挺重要；因為Sam Altman在直播里說，他們想讓AI理解視頻，改變我們用電腦的方式。

想要做到這點，在通往AGI的路上，得做很多優(yōu)化，而把工作流和視頻生成結(jié)合起來，是個不錯的辦法。

不過，Sora看著不錯，但是價格有點高。比如：

你要是選Plus會員，每個月得花20美元，能做最多50個視頻，視頻質(zhì)量一般，最高只能到720p，而且每個視頻最長也就5秒。

如果你想要更好的，得選Pro會員，一個月得200美元，最高清晰度能到1080p，每個視頻才能生成20秒，而且Sora尚未在歐盟、瑞士和英國上線。

這就是第三天關(guān)于Sora的內(nèi)容，感嘆又期待，你會付費嗎？

今天，OpenAI直播到了第四天，由他們的首席產(chǎn)品官Kevin Weil來主持。重點是什么呢？即：Canvas正式上線了。

之前，Canvas的一些功能已經(jīng)在ChatGPT里展示過，但那時它是單獨的一個模型?，F(xiàn)在，它和其他模型融合在一起了。

那么，Canvas這次和以前有什么不同呢？有三個：

一，現(xiàn)在可以直接從首頁的輸入框跳轉(zhuǎn)到Canvas；二，集成了一個Web Assembly的Python模擬器，可以直接運行Python代碼，還能在線修bug；三，Canvas功能整合進了GPTs。

為了讓大家更清楚地看到Canvas的新功能，OpenAI的工程師Lee和Alexey還做了現(xiàn)場演示。Lee教我們怎么用Canvas寫一個兒童圣誕故事。

在ChatGPT的輸入框里，點一下新加的工具按鈕，就能切換到Canvas，你可以和ChatGPT一起編輯文檔，不管是改標(biāo)題、加表情，還是調(diào)整文章的長度和閱讀難度，都變得很簡單。

這就像百度的自由畫布，用戶和ChatGPT可以一起創(chuàng)作，寫作和修改的過程都很自然。

一口氣看完OpenAI前四天內(nèi)容

發(fā)布會上，Alexey還展示了Canvas怎么幫我們改文章。他把一篇關(guān)于圣誕老人、暗能量和馴鹿推進力的物理論文貼到ChatGPT里，然后用Canvas打開。

ChatGPT不僅能給出專業(yè)的修改建議，還能在文章里直接加評論，這樣用戶就能很方便地查看和修改。用戶可以根據(jù)自己的思路來改文章，想復(fù)制最終版本也隨時可以。

Alexey還演示了怎么用Canvas調(diào)試Python代碼和生成圖表。Canvas里內(nèi)置了一個WebAssembly Python模擬器，可以快速加載幾乎所有Python庫，運行代碼，還能即時反饋，這對提高編程效率真的很有幫助。

另外，Canvas的功能也整合進了GPTs里。比如：

Lee就創(chuàng)建了一個叫圣誕老人助手的GPT，用來幫圣誕老人回復(fù)孩子們的信件。

只要在自定義GPT的說明里加上使用Canvas工具的指令，再勾選Canvas功能，自定義GPT就能自動在Canvas里生成信件草稿，圣誕老人可以根據(jù)實際情況修改草稿，用自己的風(fēng)格和語氣回復(fù)孩子們。

我之前一直在用Canvas，還想過，國內(nèi)廠商啥時候也能引進Canvas這樣的功能。我覺得Canvas（畫布）是讓大家一起工作更聰明的一個關(guān)鍵步驟。

因為不管是自己用，還是大家一起用，總得有個地方能三個人一起做事情，以前可能用類似于在線文檔的工具，實現(xiàn)共同編輯的動作，以后，畫布可能是首選協(xié)同之一了。

這就是今天發(fā)布會的內(nèi)容，關(guān)于Canvas。

好了，總結(jié)下四天的內(nèi)容，分別是：推出o1完整版及o1 pro、推出強化微調(diào)能力、推出新產(chǎn)品sora、以及把Canvas進行全新升級。

接下來的8天里，還有什么新產(chǎn)品呢？值得期待。

看完覺得寫得好的，不防打賞一元，以支持藍海情報網(wǎng)揭秘更多好的項目。

標(biāo)簽：標(biāo)簽內(nèi)容隨筆

本文地址：http://yinbad.com.cn/suibi/38724.html

文章來源：藍海情報網(wǎng)

版權(quán)聲明：如果你想發(fā)貼或咨詢項目，請咨詢在線客服人員！

国产精品综合av_日韩精品偷拍一区二区_久草视频资源在线_亚洲视频 中文字幕_亚洲电影AV一区春药高潮_小×导航福利在线导航_欧美性爱一级短视频_人成视频免费在线观看不卡_国产九色在线播放_国产高清无码一区二区

一口氣看完OpenAI前四天內(nèi)容

国产精品综合av_日韩精品偷拍一区二区_久草视频资源在线_亚洲视频中文字幕_亚洲电影AV一区春药高潮_小×导航福利在线导航_欧美性爱一级短视频_人成视频免费在线观看不卡_国产九色在线播放_国产高清无码一区二区