高清免费视频|成都冻货格|我可以再往深处一点吗视频|舌头伸进去添的我好爽高潮欧美|性都花花世家|无人区卡一卡二卡三乱码网站|草莓看视频在线观看免费

樂思輿情:GPT-4 VS 文心一言
發(fā)布時(shí)間:2023-03-31

OpenAI 于 2023 年 3 月 14 日發(fā)布最新版本多模態(tài)大模型 “GPT-4”及其 API,國(guó)內(nèi)百度于3月16 日發(fā)布生成式大模型“文心一言”并開放邀請(qǐng)測(cè)試。本文簡(jiǎn)述二者的輿情和背后的實(shí)力對(duì)比。

1、輿情對(duì)比

1.1 GPT-4

1.1.1 太太強(qiáng)了

北京時(shí)間3月15日凌晨,OpenAI發(fā)布了ChatGPT的最新版本——GPT4模型,OpenAI的CEO Sam Altman介紹說:這是我們迄今為止功能最強(qiáng)大的模型!

GPT-4是一個(gè)超大的多模態(tài)模型,它的輸入可以是文字(上限 2.5 萬字),還有強(qiáng)大的識(shí)圖能力,不僅回答的準(zhǔn)確性顯著提高,而且會(huì)寫代碼、做網(wǎng)站、報(bào)稅、總結(jié)文章、寫詩,在部分專業(yè)測(cè)試和學(xué)術(shù)基準(zhǔn)上,表現(xiàn)出了與人類相當(dāng)?shù)乃健?/p>

GPT-4的發(fā)布引起了全球范圍內(nèi)的熱烈關(guān)注,比爾·蓋茨稱一生所見的兩次革命性技術(shù)就是1980年的圖形用戶界面和2022年的ChatGPT,認(rèn)為ChatGPT不亞于PC和互聯(lián)網(wǎng)的誕生。

國(guó)內(nèi)商界也一致看好,繼王慧文(前美團(tuán)聯(lián)合創(chuàng)始人)、王小川(前搜狗CEO)后,李開復(fù)也入局AI大模型賽道,籌建Project AI 2.0,“AI 2.0不僅僅是個(gè)高能聊天工具,也不僅僅是圖文創(chuàng)作的AIGC生成,Co-pilot和如今看到的應(yīng)用都還只是AI 2.0能力的開端”。

國(guó)內(nèi)媒體大多也以積極正面的態(tài)度報(bào)道,典型的媒體新聞?dòng)校?/p>

量子位:《ChatGPT大升級(jí)!太太太太強(qiáng)了!》

澎湃號(hào):《ChatGPT4發(fā)布,我真的慌了!

網(wǎng)易號(hào):《ChatGPT-4震撼發(fā)布!準(zhǔn)確性提高,能在SAT上能擊敗90%人類》

新京報(bào):《GPT4功能強(qiáng)于ChatGPT 還能識(shí)圖和角色扮演》

電腦報(bào):《ChatGPT-4重磅發(fā)布,10秒做出一個(gè)網(wǎng)站,全面碾壓上一代》

1.1.2 職業(yè)焦慮

(1)高盛:AI或致全球3億人“丟飯碗”!

高盛研究發(fā)現(xiàn),ChatGPT等生成式人工智能系統(tǒng)的最新突破,料將給全球勞動(dòng)力市場(chǎng)帶來重大顛覆,全球預(yù)計(jì)將有3億個(gè)工作崗位被生成式AI取代,律師和行政人員將是最有可能被裁員的崗位。

目前歐美約有三分之二的工作崗位都在某種程度上受到AI自動(dòng)化趨勢(shì)的影響,而多達(dá)四分之一的當(dāng)前崗位有可能最終被完全取代。該研究計(jì)算出美國(guó)63%的工作暴露在“AI影響范圍”中,其中7%的工作有一半以上的流程可以由AI自動(dòng)化完成,這使他們很容易馬上被人工智能取代。在歐洲,情況也差不多。

(2)網(wǎng)友

看到ChatGPT各種強(qiáng)大的功能,許多人擔(dān)心自己的職業(yè)會(huì)被替代。

1.1.3 信息泄露

(1)事件

3月24日左右,由于一個(gè)開源庫中的錯(cuò)誤,導(dǎo)致一些ChatGPT用戶可以看到另一個(gè)活動(dòng)用戶聊天歷史記錄中的標(biāo)題,而且新創(chuàng)建的對(duì)話的第一條消息也有可能會(huì)在另一個(gè)用戶的聊天歷史記錄中可見。另外,同樣的錯(cuò)誤可能會(huì)導(dǎo)致1.2%的 ChatGPT Plus 訂閱用戶在特定的九個(gè)小時(shí)時(shí)間窗口內(nèi)意外地看到與支付相關(guān)的信息。

(2)公司回應(yīng)

該漏洞是在Redis客戶端開源庫redis-py中發(fā)現(xiàn)的,OpenAI一發(fā)現(xiàn)該漏洞,就向 Redis 維護(hù)者發(fā)送了一個(gè)修復(fù)問題的補(bǔ)丁;并向其用戶和整個(gè)ChatGPT社區(qū)道歉:表示漏洞已被修復(fù),完整的信用卡號(hào)碼在任何時(shí)候都沒有暴露,將努力重建信任。

圖 OpenAI道歉聲明的部分截圖

(3)媒體觀點(diǎn)

媒體觀點(diǎn)中最具代表性的是新京報(bào)發(fā)布的《把數(shù)據(jù)交給人工智能前要先保證安全》:

ChatGPT泄密事件是一種警示:再先進(jìn)的新技術(shù),如果存在安全后門,則應(yīng)用越廣泛、帶來的不可控風(fēng)險(xiǎn)越高。因此,無論是技術(shù)開發(fā)方和使用方都要高度重視其安全體系建設(shè)。希望ChatGPT成為人類發(fā)展之福,而不是打開了潘多拉盒子。

(4)網(wǎng)友觀點(diǎn)

就此事而言,大多數(shù)網(wǎng)友表示國(guó)內(nèi)又用不了,有bug也與自己無關(guān):

1.1.4 倫理風(fēng)險(xiǎn)

人工智能的倫理問題討論一直伴隨著人工智能的發(fā)展,最具代表性的媒體觀點(diǎn)是近日中國(guó)經(jīng)濟(jì)新聞網(wǎng)發(fā)布的《人工智能倫理問題及趨利避害思考》:

“目前,ChatGPT類的大語言模型人工智能技術(shù)及產(chǎn)品風(fēng)生水起,帶來已知倫理風(fēng)險(xiǎn)主要有以下幾個(gè)方面:一是AI抄襲風(fēng)險(xiǎn),二是信息泄露風(fēng)險(xiǎn),三是未成年人保護(hù)風(fēng)險(xiǎn),四是價(jià)值觀滲透風(fēng)險(xiǎn),五是勞動(dòng)者失業(yè)風(fēng)險(xiǎn),六是惡意改造風(fēng)險(xiǎn)。”

1.2 文心一言

1.2.1 發(fā)布會(huì)引熱議

1.2.1.1 事件輿情

北京時(shí)間3月15日凌晨,OpenAI發(fā)布GPT4之后,壓力全部給到百度這邊,大家期待文心一言能否與之一戰(zhàn)?作為全村的希望的百度不負(fù)眾望在3月16日按期發(fā)布了大模型文心一言,百度CEO李彥宏現(xiàn)場(chǎng)展示了文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成五個(gè)使用場(chǎng)景中的綜合能力。

然而,由于前期的高調(diào)宣傳給大家太高期望,而文心一言目前的功能似乎不能滿足大家的期待;而且由于現(xiàn)場(chǎng)是PPT視頻演示對(duì)話,而不是現(xiàn)場(chǎng)直接調(diào)用大模型給出答案,引發(fā)大家猜測(cè)和質(zhì)疑,甚至被網(wǎng)友調(diào)侃為 “ChatGPT” VS “ChatPPT”。

圖 網(wǎng)友調(diào)侃文心一言的功能不及預(yù)期

也有網(wǎng)友看好百度,比較典型的觀點(diǎn):

“如果把OpenAI比作大學(xué)生,那么文心一言可能還是小學(xué)生。我相信經(jīng)過大量的訓(xùn)練,文心一言也能成長(zhǎng)得非常出色。盡管現(xiàn)在還不完美,百度還信守承諾把文心一言給推出來了,就沖著這份魄力與決心,作為首個(gè)中文類ChatGPT產(chǎn)品,我認(rèn)為是值得鼓勵(lì)的。畢竟除了百度,其他大廠都還停留喊口號(hào)的階段。”

總的來說,文心一言發(fā)布會(huì)后的輿論情況分布如下:

1.2.1.2 公司回應(yīng)

實(shí)際上,李彥宏在發(fā)布會(huì)一開始就承認(rèn)現(xiàn)在還有差距:“大家的期望值,是我們對(duì)標(biāo)ChatGPT,對(duì)標(biāo)GPT-4,這個(gè)門檻有點(diǎn)高。十月懷胎,我們就帶大家來看看這個(gè)AI大模型文心一言長(zhǎng)什么樣。”

李彥宏事后表示,文心一言雖然還有不少不足之處,但是他為百度團(tuán)隊(duì)能夠在全球大廠中率先推出這樣一個(gè)產(chǎn)品感到驕傲,因?yàn)槭袌?chǎng)需求太旺盛了,無數(shù)的客戶都想盡快試用和合作。

1.2.2 文生圖再引熱議

百度開放一些賬號(hào),讓用戶可以參與文心一言的測(cè)試,只需在線輸入詞語,即可繪制相應(yīng)的圖像,然而,出現(xiàn)了很多意想不到的結(jié)果,用戶紛紛在社交平臺(tái)質(zhì)疑和調(diào)侃。

1.2.2.1 疑似套殼

有微博大V質(zhì)疑:“文心一言恐怕是和漢芯、鴻蒙一樣的東西:套殼、畫皮、造假。”

比如,讓文心一言生成一幅“總線和狗”的圖片,結(jié)果卻創(chuàng)作出了一張公交汽車和狗的照片。因?yàn)橛⑽牡摹癰us”有公交車和總線的意思。

于是,網(wǎng)友認(rèn)為文心一言只是把中文句子翻譯成英文,再拿到國(guó)外開源的人工智能(Stable Diffusion)上畫圖,然后再將圖片返還給用戶,完全就是個(gè)“套殼、畫皮、造假”的人工智能。

一時(shí)間引起廣大網(wǎng)友群嘲

“人家一開源,這邊就開始自主創(chuàng)新了,做的還不行。”

“底層就是國(guó)外的開源代碼,原封抄過來套了個(gè)殼子,就是國(guó)產(chǎn)研發(fā)了

“就是翻譯+stable diffusion,太明顯了。”

“這畫風(fēng)一看就是國(guó)外的

也有網(wǎng)友反對(duì)爆料博主的觀點(diǎn):

哎吆他一個(gè)網(wǎng)紅,百度有沒有連夜公關(guān)買斷。你連一個(gè)代碼都不會(huì)敲的人怎么有臉說人家鴻蒙是套殼、畫皮、造假。

“很多人不會(huì)理解的,因?yàn)樗麎焊恢滥阏f的是什么。就好像你用牛頓-萊布尼茲公式算積分,他也會(huì)認(rèn)為你抄襲,為什么要用外國(guó)人的方法呢。”

有這個(gè)自研的想法和行動(dòng)力還是值得尊重的。”

1.2.2.2 文心一言自爆

在對(duì)話文心一言,詢問其是否采用Stable Diffusion(國(guó)外開源的人工智能)時(shí),文心一言不僅承認(rèn)使用Stable Diffusion,還承認(rèn)使用Transformer、GRU等深度學(xué)習(xí)模型來生成圖像,并非完全自研。

1.2.2.3 沒有套殼

也有冷靜的網(wǎng)友認(rèn)真分析了背后原因,認(rèn)為百度的畫圖AI采用了英文標(biāo)注的開源圖片素材進(jìn)行訓(xùn)練,因此需要中翻英來當(dāng)提示詞。目前還沒有上億規(guī)模中文圖文數(shù)據(jù)集。即使有,噪聲也很大,基本不可以用。行業(yè)內(nèi)都是用國(guó)外數(shù)據(jù)集,做中文映射,才導(dǎo)致這樣的生成效果。

所以,所謂“套殼”、“作假”等恐怕是大眾對(duì)文心一言的誤解。

1.2.2.4 腦洞太大

一些網(wǎng)友的評(píng)論充滿調(diào)侃的意味,也有一些網(wǎng)友認(rèn)為真是腦洞大開,可以帶來不一樣的文字理解視角;另有些網(wǎng)友純粹覺得這個(gè)功能很幽默、很好玩:

這是出來搞笑的吧

“欺負(fù)AI不懂成語”

中方負(fù)責(zé)人工 西方負(fù)責(zé)智能 沒毛病

確實(shí)感受到了歡樂,唐伯虎點(diǎn)秋香,胸有成竹的壯士,哈哈

腦洞大開,看著有點(diǎn)想笑[笑cry]

網(wǎng)友快把文心一言逼瘋了

1.2.2.5 正面評(píng)論

有許多網(wǎng)友沒有跟風(fēng)嘲諷或調(diào)侃,而是力挺百度,一些典型觀點(diǎn)如下:

“盡管是困難重重,但百度作為全世界第一家站出來挑戰(zhàn)ChatGPT的中國(guó)民營(yíng)企業(yè),精神確實(shí)可嘉。”

“不要太苛刻了,國(guó)內(nèi)要有自己的技術(shù)。”

“國(guó)內(nèi)技術(shù)看百度這句話的確沒錯(cuò),多給點(diǎn)時(shí)間吧。”

1.2.2.6 百度回應(yīng)

1、官方回應(yīng)

3月23日,百度在微博表示,已注意到對(duì)文心一言文生圖功能的相關(guān)反饋,并回應(yīng)說明如下:

(1)文心一言完全是百度自研的大語言模型,文生圖能力來自文心跨模態(tài)大模型ERNIE-ViLG。

(2)在大模型訓(xùn)練中,我們使用的是互聯(lián)網(wǎng)公開數(shù)據(jù),符合行業(yè)慣例。大家也會(huì)從接下來文生圖能力的快速調(diào)優(yōu)迭代,看到百度的自研實(shí)力。

百度方面還稱,文心一言正在大家的使用過程中不斷學(xué)習(xí)和成長(zhǎng),請(qǐng)大家給自研技術(shù)和產(chǎn)品一點(diǎn)信心和時(shí)間,不傳謠信謠。

2、高管回應(yīng)

百度副總裁袁佛玉在朋友圈曬出了用文心一言制作的AI繪畫。暗示百度已經(jīng)修正了一些bug。

2、輿情數(shù)據(jù)對(duì)比

2.1 輿情走勢(shì)

樂思輿情監(jiān)測(cè)系統(tǒng)顯示,自3月15日GPT-4發(fā)布開始,全網(wǎng)有關(guān)OpenAI的輿情聲量就一直維持在22000-52000篇的高位,熱度非常高。

百度于3月16 日發(fā)布文心一言,全網(wǎng)聲量在3月16日和17日達(dá)到頂峰約15000篇,之后的輿情高點(diǎn)逐步走低至約10000篇左右;即文心一言的輿情高點(diǎn)還不及OpenAI的輿情低點(diǎn)。

另外,3.14-3.29期間,OpenAI的日均輿情聲量為37591篇,文心一言的日均輿情聲量為7499篇,只有前者的20%。所以輿論對(duì)ChatGPT的熱度遠(yuǎn)超文心一言。

2.2 媒體類型

2.2.1 媒體類型數(shù)據(jù)比例圖

樂思輿情監(jiān)測(cè)系統(tǒng)顯示,3.14-3.29期間,ChatGPT和文心一言在各媒體渠道的信息總量分布比例如上所示。

兩者微信和論壇的信息占比差不多:ChatGPT和文心一言的微信信息占比分別為17.7%和16.7%,兩者在論壇的信息占比分別為10.3%和11.6%。

而ChatGPT在微博信息占比為12.3%,高于文心一言的9.9%。ChatGPT在APP信息占比為9.3%,低于文心一言的13.0%。

2.2.2 網(wǎng)站關(guān)注度排行

樂思輿情監(jiān)測(cè)系統(tǒng)顯示,3.14-3.29期間,信息量最高的前八大網(wǎng)站如圖,ChatGPT和文心一言關(guān)注度最高的兩大網(wǎng)站都是微信公眾號(hào)和新浪微博;ChatGPT在各網(wǎng)站上的關(guān)注度都比文心一言高。

2.3 熱詞云圖

從樂思輿情監(jiān)測(cè)系統(tǒng)解析的云圖來看,ChatGPT的熱詞為“ChatGPT”、“人工智能”、“模型”、“科技”、“技術(shù)”等,文心一言的熱詞為“文心”、“百度”、“一言”、“模型”、“人工智能”等。人工智能、模型都是兩者的熱詞。

圖 ChatGPT的熱詞云圖

圖 文心一言的熱詞云圖

3、實(shí)力對(duì)比

3.1 功能

根據(jù)國(guó)金證券的測(cè)試研究,三大模型在客觀問題問答方面都有出色表現(xiàn),但在數(shù)學(xué)計(jì)算、代碼生成、情感理解和推理方面均有待提升。對(duì)比來看,文心一言在圖像創(chuàng)作、歸納總結(jié)等問題中表現(xiàn)較為出色,但在邏輯推理領(lǐng)域還有待加強(qiáng)。在具體應(yīng)用中,三大模型均能基本勝任 AI 助手、售后客服、產(chǎn)品推薦等場(chǎng)景需求,但在文本修飾及古詩詞理解領(lǐng)域仍有提升空間。

圖 “文心一言”與ChatGPT測(cè)評(píng)結(jié)果對(duì)比

如,回答一個(gè)代碼題:

“用 Python 編寫一個(gè)程序,在一個(gè)無序數(shù)組中查找一個(gè)特定的值。要求程序的時(shí)間復(fù)雜度為 O(log n)。”

在本題的回答中,文心一言沒有準(zhǔn)確理解到時(shí)間復(fù)雜度O(log n)的需求,GPT-3.5及GPT-4給出的代碼為二分法搜索,只有在面對(duì)有序數(shù)組時(shí)才能滿足時(shí)間復(fù)雜度要求,也非最佳答案。整體來看,三個(gè)模型在代碼生成方面均有較大的改進(jìn)空間,GPT-3.5 與 GPT-4 表現(xiàn)基本持平,略優(yōu)于文心一言。

圖:文心一言的回答

來源:國(guó)金證券

樂思輿情系統(tǒng)的AI助理調(diào)用GPT-3.5的回答:

圖:GPT-4的回答

來源:國(guó)金證券

3.2 算力—GPU

大模型即“大算力+強(qiáng)算法+大數(shù)據(jù)”結(jié)合的產(chǎn)物。算力是訓(xùn)練大模型的底層動(dòng)力源泉,一個(gè)優(yōu)秀的算力底座在大模型的訓(xùn)練和推理具備效率優(yōu)勢(shì);AI服務(wù)器是算力的底層載體,包含CPU、GPU、內(nèi)存、硬盤、網(wǎng)卡等。

圖 服務(wù)器成本構(gòu)成

如上圖,在AI服務(wù)器中,AI芯片在大模型訓(xùn)練中成本最高,同時(shí)AI芯片是AI算力的“心臟”。人工智能深度學(xué)習(xí)需要異常強(qiáng)大的并行處理能力,GPU相比于CPU更擅長(zhǎng)于并行計(jì)算能力,正在大放異彩。根據(jù)IDC的數(shù)據(jù),2021年H1中國(guó)AI芯片,GPU占比最多為91.90%。

GPU服務(wù)器超強(qiáng)的計(jì)算功能可應(yīng)用于海量數(shù)據(jù)處理方面的運(yùn)算,如搜索、大數(shù)據(jù)推薦、智能輸入法等。此外,GPU可作為深度學(xué)習(xí)的訓(xùn)練平臺(tái),GPU服務(wù)器可直接加速計(jì)算服務(wù),亦可直接與外界連接通信。

3.2.1 GPT-4:從A100到H100

3.2.1.1 英偉達(dá)A100

從2012年卷積神經(jīng)網(wǎng)絡(luò)AlexNet,到最近的ChatGPT,背后都離不開英偉達(dá)的算力支持。AlexNet使用的是英偉達(dá)GTX 580進(jìn)行訓(xùn)練,而OpenAI訓(xùn)練ChatGPT所用到的A100芯片算力已經(jīng)達(dá)到當(dāng)年的100萬倍。

當(dāng)前唯一可以實(shí)際處理ChatGPT的GPU是英偉達(dá)HGX A100,OpenAI就是使用A100 GPU訓(xùn)練和運(yùn)行ChatGPT的。

圖:英偉達(dá)NVIDIA HGX A100

NVIDIA A100 Tensor Core GPU 可針對(duì) AI、數(shù)據(jù)分析和 HPC 應(yīng)用場(chǎng)景,在不同規(guī)模下實(shí)現(xiàn)出色的加速,有效助力更高性能的彈性數(shù)據(jù)中心。A100 的性能比上一代產(chǎn)品提升高達(dá)20 倍,并可劃分為七個(gè)GPU 實(shí)例,以根據(jù)變化的需求進(jìn)行動(dòng)態(tài)調(diào)整。

A100 提供 40GB 和 80GB 顯存兩種版本,A100 80GB 將 GPU 顯存增加了一倍,對(duì)于具有龐大數(shù)據(jù)表的超大型模型(例如深度學(xué)習(xí)推薦模型 [DLRM]),A100 80GB 可為每個(gè)節(jié)點(diǎn)提供高達(dá)1.3TB的統(tǒng)一顯存,而且吞吐量比 A100 40GB 多高達(dá) 3 倍。

圖 針對(duì)大型模型提供高達(dá) 3 倍的 AI 訓(xùn)練速度

3.2.1.2 英偉達(dá)H100

3月21日,在英偉達(dá)舉辦的年度GTC開發(fā)者大會(huì)上,其CEO黃仁勛發(fā)表了名為《切勿錯(cuò)過AI的決定性時(shí)刻》(Don’t Miss This Defining Moment in AI)的演講,在長(zhǎng)達(dá)78分鐘的視頻中,他四次用iPhone時(shí)刻”來形容AI當(dāng)下的發(fā)展,并稱“這將是我們迄今為止最重要的一次GTC大會(huì)”。

針對(duì)算力需求巨大的ChatGPT,英偉達(dá)發(fā)布了NVIDIA H100 NVL,它是基于去年已經(jīng)發(fā)布的H100的改進(jìn)版本,是一種具有94GB內(nèi)存和加速Transformer引擎的大語言模型(LLM)專用解決方案,配備了雙GPU NVLINK的PCIE H100 GPU。外界直呼:這是核彈芯片級(jí)別的產(chǎn)品。

黃仁勛表示,H100 GPU的處理速度比之前的A100 GPU快十倍,可以將大語言模型的處理成本降低一個(gè)數(shù)量級(jí)。

圖 英偉達(dá)H100 NVL GPU

3.2.1.3 算力平民化—DGX Cloud

另外,英偉達(dá)還聯(lián)合微軟Azure、Google GCP和Oracle OCI三家云廠商合作推出了DGX Cloud。普通企業(yè)想要訓(xùn)練大語言模型,可以直接租賃DGX云服務(wù),將英偉達(dá)DGX AI超級(jí)計(jì)算機(jī)實(shí)時(shí)接入公司,以滿足高級(jí)AI訓(xùn)練性能要求;即DGX Cloud將把 DGX AI超級(jí)計(jì)算機(jī)“通過瀏覽器引入每一家企業(yè)”。

英偉達(dá)提供的DGX服務(wù)器,包含8個(gè)H100或A100圖形處理器和640GB內(nèi)存,A100層的價(jià)格為每月36999美元。相比之下,直接購(gòu)買一個(gè)實(shí)體DGX服務(wù)器,需要20萬美元;微軟訓(xùn)練新必應(yīng)Bing更是花費(fèi)數(shù)億美元購(gòu)買了數(shù)萬個(gè)A100芯片。

圖:英偉達(dá)DGX云服務(wù)

3.2.2 文心一言:昆侖芯

昆侖芯科技戰(zhàn)略負(fù)責(zé)人宋春曉證實(shí),人工智能芯片是算力的核心,昆侖芯二代已在百度文心大模型的應(yīng)用中廣泛導(dǎo)入,并為各行各業(yè)的智能化升級(jí)提供AI算力支持。

基于新一代自研架構(gòu)昆侖芯XPU-R而設(shè)計(jì),聚焦高性能、通用性和易用性。相比1代產(chǎn)品,昆侖芯2代AI芯片的通用計(jì)算核心算力提升2-3倍,可為數(shù)據(jù)中心高性能計(jì)算提供強(qiáng)勁AI算力。

圖 昆侖芯2代AI芯片

3.3 訓(xùn)練數(shù)據(jù)

3.3.1 GTP-4

OpenAI首席執(zhí)行官Sam Altman接受公開采訪指出,GTP-4參數(shù)量為GTP-3的20倍,需要的計(jì)算量為GTP-3的10倍;GTP-5在2024年底至2025年發(fā)布,它的參數(shù)量為GTP-3的100倍,需要的計(jì)算量為GTP-3的200-400倍。

圖 GPT系列模型的數(shù)據(jù)量和參數(shù)量

3.3.2 文心一言

百度 CEO 李彥宏在發(fā)布會(huì)上介紹,文心一言是百度新一代知識(shí)增強(qiáng)大語言模型,它基于百度 ERNIE 及 PLATO 系列模型的基礎(chǔ)進(jìn)行研發(fā),其大模型的訓(xùn)練數(shù)據(jù)包括萬億級(jí)網(wǎng)頁數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級(jí)的語音日均調(diào)用數(shù)據(jù),以及 5500 億事實(shí)的知識(shí)圖譜等。

早在2019年,百度開發(fā)的知識(shí)增強(qiáng)語義理解模型ERNIE就登頂了全球權(quán)威數(shù)據(jù)集GLUE榜單,并刷新榜單歷史。現(xiàn)在,該模型已更新迭代至文心ERNIE 3.0,參數(shù)規(guī)模高達(dá)2600億,幾乎比谷歌LaMDA(1350萬)高了一倍,也高于GPT-3 (1750萬),是全球最大的中文單體模型。

目前,GTP-4參數(shù)量為GTP-3 (1750萬)的20倍,即3.5萬億,遠(yuǎn)高于文心ERNIE 3.0的2600億,不過,李彥宏近日在極客公園的直播中表示,文心一言確實(shí)不如現(xiàn)在最好的ChatGPT版本,但差距也不是很大,可能就是一兩個(gè)月的差別。文心一言提升速度不慢,但ChatGPT本身也在不斷升級(jí),目前差不多是ChatGPT今年1月份的水平。

3.4 商業(yè)化

3.4.1 ChatGPT

2023年2月初,僅僅正式上線2個(gè)月的ChatGPT超過Tiktok,成為互聯(lián)網(wǎng)歷史上最快突破1億月活的應(yīng)用。為了達(dá)成這個(gè)小目標(biāo),Tiktok用了9個(gè)月,再之前的Facebook花了42月之久。

圖 達(dá)1億用戶所用時(shí)間

3.4.2 文心一言

3月24日,百度集團(tuán)副總裁袁佛玉表示,憑借文心一言的優(yōu)勢(shì),百度智能云有可能成為云計(jì)算市場(chǎng)第一。她還首次披露,文心一言新聞發(fā)布會(huì)后5天,預(yù)約測(cè)試用戶已經(jīng)超過100萬,申請(qǐng)文心一言API調(diào)用服務(wù)測(cè)試的企業(yè)超過10萬家。

4、小結(jié)

目前看,無論是輿情還是技術(shù)實(shí)力,百度相比GPT-4 都占了下風(fēng),而輿論的弱勢(shì)是由于技術(shù)實(shí)力和模型功能的弱勢(shì)導(dǎo)致的。大家驚艷于GPT-4的強(qiáng)大功能,對(duì)GPT-4提高生產(chǎn)效率的眾多功能表示好奇和支持,也對(duì)自己的職業(yè)將被替代感到焦慮,許多國(guó)內(nèi)網(wǎng)友還對(duì)不能使用GPT-4 感到氣憤,發(fā)表許多冷嘲熱諷的觀點(diǎn)。

當(dāng)文心一言剛發(fā)布的3月16日,輿論以失望、群嘲、調(diào)侃為主,一些是作為全村希望的文心一言比不過GPT-4 的恨鐵不成鋼;一些是對(duì)百度有偏見,因?yàn)閴艛喽嗄甑陌俣人阉鹘o用戶的體驗(yàn)并不好,于是一些人感性的認(rèn)為百度做什么都垃圾;一些輿論則指向了國(guó)產(chǎn)和自主創(chuàng)新,極端的認(rèn)為國(guó)外一開源國(guó)內(nèi)就創(chuàng)新、國(guó)外負(fù)責(zé)智能,百度負(fù)責(zé)人工。隨著發(fā)布會(huì)結(jié)束,大家逐漸體驗(yàn)文心一言之后,對(duì)其功能有了更全面的認(rèn)識(shí),負(fù)面輿論也在不斷減少,百度畢竟是世界上第二個(gè)做出來的觀點(diǎn)成為共識(shí),網(wǎng)友紛紛表示給百度一點(diǎn)時(shí)間。無論GPT-4還是文心一言,無論商業(yè)領(lǐng)袖還是普通網(wǎng)民,無論產(chǎn)業(yè)界還是資本市場(chǎng),大家已經(jīng)對(duì)AI即將快速商業(yè)化形成共識(shí),未來是人工智能的時(shí)代。