国产精品综合av_日韩精品偷拍一区二区_久草视频资源在线_亚洲视频 中文字幕_亚洲电影AV一区春药高潮_小×导航福利在线导航_欧美性爱一级短视频_人成视频免费在线观看不卡_国产九色在线播放_国产高清无码一区二区

藍(lán)海情報(bào)網(wǎng)

我們常用的驗(yàn)證碼也AI了

藍(lán)海情報(bào)網(wǎng) 299

我們常用的驗(yàn)證碼也AI了

當(dāng)我們打開騰訊的登錄頁面,可以發(fā)現(xiàn)曾經(jīng)熟悉的登錄驗(yàn)證碼變了樣。

網(wǎng)頁端登錄QQ,驗(yàn)證碼階段不再是輸入正確的數(shù)字、英文單詞或者移動(dòng)滑條,而是需要手動(dòng)選出一張或者兩張符合文字描述的、由AIGC生成的圖片。

我們常用的驗(yàn)證碼也AI了

AIGC,即人工智能生成內(nèi)容,是AI技術(shù)的一個(gè)具體應(yīng)用方向。它利用AI技術(shù)來生成各種形式的內(nèi)容,如文本、圖像、音頻、視頻等。AIGC通過訓(xùn)練模型,讓機(jī)器學(xué)習(xí)并理解大量數(shù)據(jù),然后基于這些數(shù)據(jù)生成新的、具有創(chuàng)造性的內(nèi)容。

對用戶來說哪種形式的驗(yàn)證都是流程的一環(huán)而已,填寫正確數(shù)字和選擇符合描述的圖片區(qū)別不大,甚至這種由AI生成的圖片還更直觀一些,有時(shí)隨機(jī)生成的數(shù)字、字母,刷新三四次都依然看不清寫的是什么。

但對網(wǎng)絡(luò)安全來說,AI的加入有著重大意義。單單是驗(yàn)證碼系統(tǒng),就曾因?yàn)锳I發(fā)展的需要大幅度改變形態(tài),現(xiàn)在又和AIGC緊密結(jié)合到一起,進(jìn)入了新階段。

驗(yàn)證碼的前世今生

驗(yàn)證碼英文叫做 CAPTCHA ,是 Completely Automated Public Turing test to tell Computers and Humans Apart 的縮寫,翻譯過來是 全自動(dòng)區(qū)分計(jì)算機(jī)和人類的圖靈測試 。

從名稱可以看出,驗(yàn)證碼本質(zhì)就是一種圖靈測試,主要為了區(qū)分在電腦前的是人還是機(jī)器人(程序)。

21世紀(jì)初互聯(lián)網(wǎng)興起,大家發(fā)現(xiàn)除了能在網(wǎng)上看到各種新奇的消息外,還回收到非常多來者不善的垃圾信息,當(dāng)時(shí)最出名的就是垃圾郵件。有居心不良者通過程序,利用當(dāng)時(shí)郵件注冊要求不高(無需驗(yàn)證實(shí)名、電話號碼等)的漏洞,7x24小時(shí)無休止地注冊大量賬號、不斷發(fā)送垃圾郵件,為當(dāng)時(shí)的上網(wǎng)沖浪選手帶來了極大困擾。

卡內(nèi)基梅隆大學(xué)教授路易斯·馮·安(Luisvon Ahn)察覺到程序很難像人一樣識別歪歪扭扭的英文單詞、數(shù)字,如果為注冊郵箱、發(fā)送郵件設(shè)置門檻,要求必須根據(jù)歪曲的字符或數(shù)字來輸入正確的答案才能進(jìn)行下一步操作,就可以防止程序大量注冊郵箱賬號發(fā)送垃圾郵件。

于是,路易斯成立了CAPTCHA公司,推出了最早的驗(yàn)證碼系統(tǒng)。

我們常用的驗(yàn)證碼也AI了

但真人填寫驗(yàn)證碼時(shí)辨別歪歪扭扭的英文字母也很費(fèi)時(shí)間,有人抱怨每天都會(huì)浪費(fèi)大量時(shí)間在填寫驗(yàn)證碼上,就像我們小學(xué)老師愛說的:

每個(gè)人浪費(fèi)1秒,一百萬人就是一百萬秒。

此時(shí)路易斯想出了另一個(gè)天才主意,將真人填寫驗(yàn)證碼的時(shí)間廢物利用。當(dāng)時(shí)正值書籍、報(bào)刊需要大量掃描電子化的時(shí)代,但報(bào)刊所使用的英文藝術(shù)字,對電腦程序、掃描儀來說簡直是鬼畫符,根本看不懂。路易斯·馮·安就將驗(yàn)證碼系統(tǒng)上毫無意義的英文字母,換成了海量從書籍報(bào)刊上掃描的、難以識別的英文單詞,讓用戶幫忙識別。

我們常用的驗(yàn)證碼也AI了

就這樣,reCAPTCHA誕生了。

這是一個(gè)功德無量的決定。2007年推出之初,reCAPTCHA每天都能錄入3000萬個(gè)字符;2008年,這個(gè)數(shù)字飆升到了6000萬個(gè)。在媒體量子位的報(bào)道中,現(xiàn)在全世界每天都有2億個(gè)字符通過 reCAPTCHA錄入,相當(dāng)于人類15萬小時(shí)的工作量。

路易斯在接受媒體TheHustle采訪時(shí)這樣評價(jià) reCAPTCHA:我創(chuàng)造了一個(gè)系統(tǒng),以十秒為單位,數(shù)百萬小時(shí)為增量,來利用世界上最寶貴的資源:人的大腦。

迄今為止, reCAPTCHA已經(jīng)錄入了從1851年至今的所有《紐約時(shí)報(bào)》,共計(jì)1300萬篇文章。除《紐約時(shí)報(bào)》外,reCAPTCHA還數(shù)字化了超過2500萬本書,而全球的圖書數(shù)量約為1.3億本。

驗(yàn)證碼和AI的不解之緣

reCAPTCHA的成功啟發(fā)了谷歌,萌生了利用驗(yàn)證碼去完成另一個(gè)大項(xiàng)目的念頭。2009年,Google以大約2780萬美元的價(jià)格收購了reCAPTCHA,2012年開始,谷歌陸續(xù)將自家街景中拍到的門牌、路牌、紅綠燈、自行車、公共汽車等加入到驗(yàn)證碼中讓用戶根據(jù)指令選擇正確的答案,讓用戶對程序難以識別的圖像進(jìn)行標(biāo)注,提高AI的識別能力。

我們常用的驗(yàn)證碼也AI了

在第一輪驗(yàn)證中,驗(yàn)證碼系統(tǒng)已經(jīng)知道正確答案,如果用戶能做對,系統(tǒng)會(huì)將該名用戶判定為真人;之后驗(yàn)證碼系統(tǒng)會(huì)放出第二、第三組圖片,里面可能會(huì)包含一些AI還沒有識別出來、需要標(biāo)注的圖。如果10個(gè)真人用戶都在同一個(gè)問題中選擇了相同的答案,那么系統(tǒng)就會(huì)將這張圖片標(biāo)注為正確答案。

在每天調(diào)用千萬次、過億用戶的訓(xùn)練下,谷歌AI的識別率顯著提高,運(yùn)用了谷歌 AI 技術(shù)的無人駕駛汽車 Waymo,已經(jīng)在自動(dòng)駕駛領(lǐng)域處于遙遙領(lǐng)先的地位,被稱作是世界上最可能最先到 L5 級別( 完全自動(dòng)駕駛 )的公司。

谷歌更是毫不忌諱地在reCAPTCHA官網(wǎng)上寫明了,他們在利用驗(yàn)證碼系統(tǒng)集用戶之力標(biāo)注數(shù)據(jù)、訓(xùn)練AI。

我們常用的驗(yàn)證碼也AI了

圖源:reCAPTCHA官網(wǎng)

目前reCAPTCHA已經(jīng)將大部分網(wǎng)站的驗(yàn)證碼升級為體驗(yàn)更好的無感驗(yàn)證,技術(shù)原理是驗(yàn)證系統(tǒng)會(huì)利用AI追蹤分析用戶的鼠標(biāo)鍵盤的軌跡,結(jié)合分析瀏覽器數(shù)據(jù),來綜合判定用戶是不是機(jī)器人。這樣我們不用再費(fèi)心力去辨別眼花繚亂的圖像或者歪歪扭扭的文字,只需要點(diǎn)擊一下我不是機(jī)器人,系統(tǒng)就能為你正名。用戶們幫谷歌訓(xùn)練了那么久的AI,總算能得到一些好處。

我們常用的驗(yàn)證碼也AI了

新時(shí)代,驗(yàn)證碼上的AI怎么玩?

不過reCAPTCHA的我不是機(jī)器人驗(yàn)證碼目前還是獨(dú)家專屬,只覆蓋了約65萬個(gè)網(wǎng)站,沒有和reCAPTCHA合作的公司,只能繼續(xù)使用傳統(tǒng)選擇正確圖片的圖片驗(yàn)證碼或移動(dòng)滑條的驗(yàn)證碼。

圖片驗(yàn)證碼需要用到的圖片資源有限是一大問題,更重要的是一些灰產(chǎn)同樣可以通過人工標(biāo)記打碼的方式,協(xié)助黑客程序進(jìn)行窮舉,如果驗(yàn)證碼圖片庫更新不夠快、數(shù)量不夠多,就容易被撞庫。

因此,進(jìn)入了AI新時(shí)代后,AIGC技術(shù)在驗(yàn)證碼系統(tǒng)上更有妙用。當(dāng)前AIGC每天就可以根據(jù)不同的提示詞為驗(yàn)證碼系統(tǒng)生產(chǎn)超過43萬張的圖片,每張都不完全一樣,能大幅提高軟件破解驗(yàn)證碼的難度;相比傳統(tǒng)的街景、實(shí)拍圖等圖片驗(yàn)證碼素材,AIGC生成的圖片成本更低效率更高,也無需擔(dān)心侵權(quán)問題。

另外基礎(chǔ)的圖片選擇驗(yàn)證碼,實(shí)際上可以視為一個(gè)目標(biāo)檢測的問題,對于機(jī)器視覺來說并不困難。但若改為給定一句文字描述,找出九宮格中符合該描述的圖片,就可以將目標(biāo)檢測升級為語義匹配,對于機(jī)器而言,識別難度提升了多個(gè)數(shù)量級。AIGC生成內(nèi)容本就需要提示詞,不再需要針對圖片另外想問題,和語義匹配驗(yàn)證碼系統(tǒng)有天生的契合性。

無論是reCAPTCHA的我不是機(jī)器人驗(yàn)證碼,還是基于AIGC的語義匹配驗(yàn)證碼,AI的加入為提高驗(yàn)證碼的安全性、易用性體驗(yàn)作出了極其重要的貢獻(xiàn)。今天能在眾多網(wǎng)站安全快速地注冊、瀏覽,郵箱和站內(nèi)私信能避免垃圾信息的轟炸,他們居功至偉。

另一方面,從公司層面,效仿谷歌請海量用戶們免費(fèi)為AIGC內(nèi)容做內(nèi)容標(biāo)注,也是誘人的選擇。

畢竟從現(xiàn)實(shí)角度來考慮,常規(guī)方式訓(xùn)練AI、做數(shù)據(jù)標(biāo)注實(shí)在太費(fèi)錢了。

當(dāng)前做數(shù)據(jù)標(biāo)注主要分為機(jī)標(biāo)和人標(biāo)兩種。機(jī)標(biāo)是指機(jī)器學(xué)習(xí)算法對數(shù)據(jù)進(jìn)行標(biāo)注,這種方法的優(yōu)點(diǎn)是速度快、成本低,缺點(diǎn)是標(biāo)注結(jié)果準(zhǔn)確度較低。而人標(biāo)則是由名為AI訓(xùn)練師或數(shù)據(jù)標(biāo)注師的工作人員對數(shù)據(jù)進(jìn)行標(biāo)注,部分人還會(huì)參與調(diào)整提示詞。這種標(biāo)注方式的優(yōu)點(diǎn)是標(biāo)注結(jié)果準(zhǔn)確度高,但耗時(shí)耗力,成本較高。

有媒體指出,人標(biāo)的成本經(jīng)歷了一輪下降后,依然接近數(shù)據(jù)量的十分之一,如果需要處理1000萬級別的數(shù)據(jù),就可能需要100萬元的人力、租金、設(shè)備成本。如果將AIGC生成的圖片放到驗(yàn)證碼上讓用戶進(jìn)行標(biāo)注,不僅能得到高準(zhǔn)確度的標(biāo)注結(jié)果,省下的錢還會(huì)是一筆可觀的數(shù)字。

只不過讓用戶幫忙訓(xùn)練AI這件事也得有限度。像谷歌這樣讓用戶成為免費(fèi)勞動(dòng)力,已經(jīng)惹怒了部分人,他們認(rèn)為谷歌讓幾百萬人幫他們干活,然后不花一分錢是不合適的;其他公司如果也有意借用驗(yàn)證碼系統(tǒng)來讓用戶無償勞動(dòng),最好關(guān)注一下用戶對此的感受和接受程度。

看完覺得寫得好的,不防打賞一元,以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。

標(biāo)簽:

ad2

推薦內(nèi)容