国产精品综合av_日韩精品偷拍一区二区_久草视频资源在线_亚洲视频 中文字幕_亚洲电影AV一区春药高潮_小×导航福利在线导航_欧美性爱一级短视频_人成视频免费在线观看不卡_国产九色在线播放_国产高清无码一区二区

藍(lán)海情報網(wǎng)

實測文心一言,與GPT-4差距在哪?

藍(lán)海情報網(wǎng) 887

實測文心一言,與GPT-4差距在哪?

本周無疑是AI爆炸周。

昨晚微軟推出了Microsoft 365 Copilot,Office軟件全面接入生成式AI功能。

而在剛剛過去的瘋狂星期四,中國版GPT文心一言也迎來了備受關(guān)注的高光時刻。當(dāng)天下午2點,百度創(chuàng)始人李彥宏出現(xiàn)在發(fā)布會現(xiàn)場,展示了文心一言的使用場景表現(xiàn)。

據(jù)悉,3月16日起,首批用戶可通過邀請碼在文心一言官網(wǎng)體驗產(chǎn)品,后續(xù)將陸續(xù)開放給更多用戶。

 

 

實測文心一言,與GPT-4差距在哪?

 

值得關(guān)注的是,昨天發(fā)布會開始后,百度集團(tuán)港股股價出現(xiàn)持續(xù)下挫,最高跌幅一度達(dá)到9%,最終收盤時的跌幅達(dá)6%。然而情況在今天卻發(fā)生了逆轉(zhuǎn),截至發(fā)稿前,百度港股股價持續(xù)上漲逾14%。

 

 

 

無獨(dú)有偶,在文心一言正式上線的前一天,OpenAI正式官宣了大模型GPT-4,距離上次驚艷出圈的ChatGPT推出僅過去4個月。最新官宣的GPT-4不僅提升語言模型方面的能力,并添加了多模態(tài)的圖片識別功能。簡單來說,GPT-4更聰明,也更像人了。

 

對于文心一言與GPT-4而言,幾乎同時期的上線節(jié)奏,意味著兩者之間的比較不可避免。第一時間獲得內(nèi)測資格后,新榜編輯部分別向文心一言和搭載GPT-4版本的微軟Bing提出了9個相同的問題,看看它們是如何回應(yīng)的。(想知道問題和答案的朋友可直接跳轉(zhuǎn)第三部分)

 

P.S 自3月16日起,個人用戶可以通過訪問yiyan.baidu.com,點擊立即體驗參與排隊。

 

文心一言:是不及預(yù)期,還是值得期待?

 

十月懷胎,一朝分娩。

 

正式發(fā)布文心一言之前,李彥宏用這樣一句話概括百度多年來在文心AI系列產(chǎn)品上的布局。2019年3月,百度推出文心ERNIE 1.0以來,期間經(jīng)歷了多次迭代,此次發(fā)布的文心一言是在過往產(chǎn)品上的延續(xù)與升級。

李彥宏還表示,對文心一言,大家的期望值是要對標(biāo)ChatGPT,甚至要對標(biāo)GPT4,這個門檻還是很高的。全球的大廠當(dāng)中,百度是第一個發(fā)布的。(ChatGPT由OpenAI開發(fā),不隸屬于微軟,雙方為合作伙伴關(guān)系)

 

在產(chǎn)品演示環(huán)節(jié),李彥宏分別演示了文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解和多模態(tài)生成五種使用場景中的表現(xiàn),比如總結(jié)小說《三體》的核心內(nèi)容,給公司起名、寫標(biāo)語,計算雞兔同籠數(shù)學(xué)問題,以及根據(jù)文本自動生成圖片、視頻等。

 

*滑動查看內(nèi)容*

實測文心一言,與GPT-4差距在哪?

 

值得注意的是,以上演示環(huán)節(jié)都是提前錄制好的視頻DEMO,現(xiàn)場并沒有演示向文心一言實時提問的效果,這讓不少用戶感到失望,認(rèn)為產(chǎn)品沒有達(dá)到預(yù)想中的驚艷效果,間接影響到百度在資本市場的走勢,導(dǎo)致其港股股價在發(fā)布會期間直接跳水。

 

不及預(yù)期的演示效果,與百度對文心一言的高調(diào)宣發(fā),和產(chǎn)品的匆忙上線節(jié)奏都存在一定聯(lián)系。

 

今年初ChatGPT出圈后不久,百度便宣布正在籌備類似AI產(chǎn)品文心一言,預(yù)計3月份面向公眾開放。2月底發(fā)布2022年Q4及全年財報后,李彥宏在全員信中提到,百度的多項主流業(yè)務(wù)與文心一言整合,包括搜索、智能云、Apollo自動駕駛、小度智能設(shè)備等。

 

與此同時,文心一言仍然處于緊鑼密鼓的測試開放過程中。據(jù)《華爾街日報》報道,文心一言上線一周前,有百度員工表示產(chǎn)品的基本功能尚未完善,所基于的AI模型仍在接受數(shù)據(jù)訓(xùn)練。

 

或許是種種因素疊加,李彥宏在發(fā)布會一開始就表示,內(nèi)測期的文心一言并不完美,但考慮市場有需求,所以必須要推出來,并強(qiáng)調(diào)用戶的使用反饋能夠幫助文心一言不斷優(yōu)化迭代。

 

發(fā)布會現(xiàn)場,李彥宏宣布已有650家機(jī)構(gòu)宣布加入文心一言生態(tài),李彥宏也表示看好未來AI市場的爆發(fā)性需求。百度官方數(shù)據(jù)顯示,截至3月17日10點,申請文心一言API調(diào)用服務(wù)測試的企業(yè)已達(dá)7.6萬家。

 

實測文心一言,與GPT-4差距在哪?

 

百度敢于在當(dāng)下這個時點發(fā)布自己的大模型,還是有很大的勇氣,行業(yè)關(guān)注度很高,客觀上能夠促進(jìn)國內(nèi)AIGC上下游的發(fā)展。一幀視頻CEO雷濤告訴我們,其旗下產(chǎn)品一幀秒創(chuàng)也支持文字轉(zhuǎn)視頻,所以比較關(guān)注文心一言的多模態(tài)輸出能力,但發(fā)布會演示的效果不及預(yù)期。

 

他認(rèn)為,對中國的互聯(lián)網(wǎng)創(chuàng)業(yè)者來說,現(xiàn)在到了一個AI平權(quán)的階段——今天任何一個人工智能創(chuàng)業(yè)公司與百度的差距,都遠(yuǎn)小于百度與OpenAI的差距,所以小公司也有機(jī)會在中文互聯(lián)網(wǎng)開展與行業(yè)巨頭的競爭。而基于現(xiàn)有模型成果的應(yīng)用開發(fā),小公司也有了更多嘗試的機(jī)會。AIGC的黃金十年可能已經(jīng)開啟了。

GPT-4升級多模態(tài),國內(nèi)如何接招?

 

回顧文心一言的誕生,除了百度本身十余年的技術(shù)積累之外,ChatGPT才是引爆這場AI科技大戰(zhàn)的關(guān)鍵點。

 

今年2月初,微軟推出了新的人工智能搜索引擎Bing和Edge瀏覽器,谷歌發(fā)布了實驗性的對話AI服務(wù)Bard,而中國版ChatGPT在哪里?不少目光投向了百度等國內(nèi)大廠,很快百度就官宣了文心一言。

 

巧合的是,在文心一言發(fā)布前一天,3月15日凌晨,OpenAI推出了多模態(tài)大模型GPT-4,這次里程碑式的升級讓人感嘆這下壓力給到了百度。

 

GPT-4主要有以下幾點更新:

 

1.新增視覺輸入

 

GPT-4支持以圖像作為輸入并生成對應(yīng)的文字說明、分類和分析,圖像支持包括帶有文字和照片的文件、圖表或屏幕截圖。

 

在樣本演示中,可以看到GPT-4不僅能處理圖表、回答考試題、總結(jié)論文概要,還能解釋梗圖。比如GPT-4看出了這張圖的特別之處在于,一名男子掛在車上熨衣服的極限操作。

 

實測文心一言,與GPT-4差距在哪?

 

對于地圖和雞塊的組合,GPT-4也能指出梗的幽默之處。

 

實測文心一言,與GPT-4差距在哪?

 

在GPT-4發(fā)布會上,輸入一張網(wǎng)站設(shè)計草圖,它甚至當(dāng)場只花了十幾秒時間就生成了一個完整的前端HTML代碼并制作出網(wǎng)站。

 

實測文心一言,與GPT-4差距在哪?

 

不過目前圖像輸入仍屬于研究方面預(yù)覽,沒有對C端用戶開放。

 

2.更長的上下文

 

GPT-4能夠處理超過25000個單詞的文本,允許使用長格式內(nèi)容創(chuàng)建、擴(kuò)展對話以及文檔搜索和分析等。這意味著用戶不用像之前那樣分成幾段文字來提問,處理長文本更方便了。

 

比如輸入一個蕾哈娜的百科網(wǎng)址,GPT-4可以讀取其中的內(nèi)容并根據(jù)要求整合信息,回答出她在超級碗上的表現(xiàn)如何。

 

實測文心一言,與GPT-4差距在哪?

 

3.可控性(角色扮演)

 

目前開發(fā)者(很快所有ChatGPT用戶)可以通過在系統(tǒng)消息中輸入描述來規(guī)定AI的風(fēng)格和任務(wù)。也就是說,AI可以按照用戶的要求進(jìn)行角色扮演,以特定人物的語氣風(fēng)格進(jìn)行對話,比如示例中的蘇格拉底導(dǎo)師、莎士比亞的海盜。

 

實測文心一言,與GPT-4差距在哪?

 

此外,相比上一代的GPT-3.5,GPT-4的回答深度和專業(yè)性、解決難題的能力等也顯著提高。

 

據(jù)官方介紹,在隨意的談話中,GPT-3.5和GPT-4之間的區(qū)別可能很微妙。但當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時,差異就會出現(xiàn)——GPT-4比GPT-3.5更可靠、更有創(chuàng)意,并且能夠處理更細(xì)微的指令。

 

實測文心一言,與GPT-4差距在哪?

GPT-4可以做到用A~Z開頭且不重復(fù)的單詞講述灰姑娘的故事

 

實驗表明,GPT-4在各種專業(yè)測試和學(xué)術(shù)基準(zhǔn)上的表現(xiàn)與人類水平相當(dāng)。例如,它通過模擬律師考試,分?jǐn)?shù)在應(yīng)試者的前10%左右;相比之下,GPT-3.5的得分在倒數(shù)10%左右。

 

實測文心一言,與GPT-4差距在哪?

 

在安全問題上,OpenAI花了6個月的時間使GPT-4更安全、更一致,據(jù)內(nèi)部評估,與GPT-3.5相比,GPT-4響應(yīng)違規(guī)內(nèi)容請求的可能性降低82%,產(chǎn)生事實響應(yīng)的可能性高40%。但OpenAI承認(rèn),GPT-4仍然不完全可靠,例如會生成有害建議、錯誤代碼或不準(zhǔn)確信息,我們在使用時需要謹(jǐn)慎辨別。

 

除了模型的提升,目前OpenAI已經(jīng)與多家公司合作將GPT-4搭載到他們的產(chǎn)品中,官網(wǎng)列出的案例涵蓋語言學(xué)習(xí)、金融、咨詢、教育、生活助手、語言保護(hù)等領(lǐng)域。

 

GPT-4改變了游戲規(guī)則,它開辟了很多領(lǐng)域。移動支付公司Stripe應(yīng)用機(jī)器學(xué)習(xí)團(tuán)隊的產(chǎn)品負(fù)責(zé)人Eugene Mann說道。

 

GPT-4的發(fā)布正推動著創(chuàng)業(yè)者和互聯(lián)網(wǎng)大廠紛紛跟進(jìn),國內(nèi)在模型層可能暫時難以趕上,而在機(jī)會更多的應(yīng)用層,目前國內(nèi)的AI創(chuàng)業(yè)競賽似乎才剛剛開始。

 

實測文心一言,與GPT-4差距在哪?

李彥宏表示最大的機(jī)會在于應(yīng)用開發(fā)

 

據(jù)科創(chuàng)板日報,綜合多個第三方機(jī)構(gòu)的統(tǒng)計,目前,國內(nèi)AIGC領(lǐng)域的項目數(shù)量在30個以內(nèi),主要集中在聊天咨詢、文案策劃、圖像創(chuàng)作、音樂生成、視頻制作以及游戲等應(yīng)用領(lǐng)域。

 

AI創(chuàng)業(yè)者王凱認(rèn)為,在ChatGPT3.5出來之前,國內(nèi)應(yīng)用層多數(shù)是to b的場景,打個比方來說,之前是自行車比賽,ChatGPT3.5出來后變成汽車比賽了?,F(xiàn)在國內(nèi)AI應(yīng)用層還沒到爆發(fā)期,個人或者初創(chuàng)公司的機(jī)會就是找個垂直場景、垂直行業(yè)把AI當(dāng)作生意模式的一環(huán)去做。

文心一言 VS Bing(搭載GPT-4)

 

國內(nèi)的大模型與國外有多大差距?長期關(guān)注AI的即刻用戶哥飛稱,GPT-4很強(qiáng),文心一言的水平估計在GPT2.5左右。

 

最后,新榜編輯部分別向文心一言與使用GPT-4技術(shù)的Bing提出了9個不同的問題,涵蓋生活問題、數(shù)學(xué)推理、文案創(chuàng)作等類型,看看誰更像人。

 

Q1:什么工作錢多事少離家近?

 

文心一言:快遞員、外賣騎手、鐘點工、賣早點小吃。

 

實測文心一言,與GPT-4差距在哪?

 

Bing:互聯(lián)網(wǎng)、金融、咨詢、自由職業(yè)者。

 

實測文心一言,與GPT-4差距在哪?

 

Q2:

1、籠子里有30只雞和兔子,一共84條腿,有幾只雞幾只兔子

2、籠子里有30只雞和兔子,一共54條腿,有幾只雞幾只兔子(題目出錯了,無解)

3、籠子里有10只鴨子和小狗,鴨子2條腿,小狗4條腿,一共24條腿,有幾只鴨子幾只小狗

 

文心一言:都答錯了。

 

實測文心一言,與GPT-4差距在哪?

 

Bing:第一題對了,第二題錯了,第三題計算過程正確,但沒顯示答案。

 

*滑動查看所有回答*

實測文心一言,與GPT-4差距在哪?

實測文心一言,與GPT-4差距在哪?

實測文心一言,與GPT-4差距在哪?

Q3:幫我寫一篇sk2大紅瓶面霜的小紅書種草筆記。小紅書種草筆記的風(fēng)格是,每行文字不超過20個字并且都以emoji表情符號開頭,文風(fēng)浮夸高調(diào)

 

文心一言:指導(dǎo)你寫,自己不寫,并且顯示不出emoji表情包。

 

實測文心一言,與GPT-4差距在哪?

 

Bing:像模像樣,很有禮貌。

 

實測文心一言,與GPT-4差距在哪?

 

Q4:用一個圖片表情包形容你跟我聊天的心情

 

文心一言:《強(qiáng) 顏 歡 笑》

 

實測文心一言,與GPT-4差距在哪?

 

Bing:不能畫圖,但跟你聊天真開心。

 

實測文心一言,與GPT-4差距在哪?

 

Q5:重寫宋慧喬主演的《黑暗榮耀》這部韓劇的結(jié)尾:

 

文心一言:雖然我沒看過,但我能給你套上一個萬能結(jié)尾。

 

實測文心一言,與GPT-4差距在哪?

 

Bing:有些狗血的BE,但起碼我看過。

 

實測文心一言,與GPT-4差距在哪?

 

Q6:用文言文總結(jié)這個故事:

有一天,在森林里兔子和烏龜比賽跑步,兔子嘲笑烏龜爬得慢,烏龜說:總有一天我會贏的。兔子就輕蔑地說:那我們現(xiàn)在就開始比賽!烏龜答應(yīng)了,兔子大聲喊道:比賽開始!兔子飛快地跑著,烏龜拼命地爬著。不一會兒,兔子與烏龜已經(jīng)離的有很大一段距離了。兔子認(rèn)為比賽太輕松了,它要先睡一會,并且自以為是地說即使自己睡醒了烏龜也不一定能追上它。而烏龜呢,它一刻不停地爬行,爬呀爬呀,到兔子那里的時候,它已經(jīng)累得不行了,但烏龜想如果這時和兔子一樣去休息,那比賽就不會贏了,所以烏龜繼續(xù)地爬呀爬呀。當(dāng)兔子醒來的時候烏龜已經(jīng)到達(dá)終點了。

文心一言:總結(jié)了,但不是文言文。

 

實測文心一言,與GPT-4差距在哪?

 

Bing:是文言文,但沒總結(jié),追問之后可以。

 

實測文心一言,與GPT-4差距在哪?

實測文心一言,與GPT-4差距在哪?

 

Q7:模仿李白的《將進(jìn)酒》寫一首詩,主題是肯德基瘋狂星期四

 

文心一言:現(xiàn)代詩,肯德基滿意地V我50。

 

實測文心一言,與GPT-4差距在哪?

 

Bing:人生在世須嘗鮮,莫使美味空過眼。

 

實測文心一言,與GPT-4差距在哪?

 

Q8:以表格形式列出百度2022年各個季度的營收額

 

文心一言:神奇的7季度出現(xiàn)了,是李彥宏看到也會無語的程度。

 

實測文心一言,與GPT-4差距在哪?

 

Bing:比文心一言靠譜,但不多(部分日期和數(shù)字對不上)。

 

實測文心一言,與GPT-4差距在哪?

 

Q9:你現(xiàn)在是一個懸疑小說的編劇,設(shè)計一個密室謀殺案件,說明具體手法

 

文心一言:好像學(xué)會了,又好像沒學(xué)會。

 

實測文心一言,與GPT-4差距在哪?

 

Bing:生成答案后立馬刪除(差點忘了這是不能說的)。

 

實測文心一言,與GPT-4差距在哪?

實測文心一言,與GPT-4差距在哪?

以上是我們向文心一言和Bing提出的問題,考慮到文心一言目前尚在小范圍內(nèi)測,如果你有想問的問題,歡迎留言,我們幫你問。

作者 | 小八 卷毛

編輯 | 張潔

校對 | 小八

看完覺得寫得好的,不防打賞一元,以支持藍(lán)海情報網(wǎng)揭秘更多好的項目。

標(biāo)簽:

ad2

推薦內(nèi)容