ChatGPT – 樂思網絡輿情監測,快全準! http://www.galou.cn/wp Fri, 31 Mar 2023 07:18:49 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.5.18 樂思輿情:GPT-4 VS 文心一言 http://www.galou.cn/wp/article/24193 Fri, 31 Mar 2023 15:18:49 +0000 http://www.galou.cn/wp/?p=24193 OpenAI 于 2023 年 3 月 14 日發布最新版本多模態大模型 “GPT-4”及其 API,國內百度于3月16 日發布生成式大模型“文心一言”并開放邀請測試。本文簡述二者的輿情和背后的實力對比。

1、輿情對比

1.1 GPT-4

1.1.1 太太強了

北京時間3月15日凌晨,OpenAI發布了ChatGPT的最新版本——GPT4模型,OpenAI的CEO Sam Altman介紹說:這是我們迄今為止功能最強大的模型!

GPT-4是一個超大的多模態模型,它的輸入可以是文字(上限 2.5 萬字),還有強大的識圖能力,不僅回答的準確性顯著提高,而且會寫代碼、做網站、報稅、總結文章、寫詩,在部分專業測試和學術基準上,表現出了與人類相當的水平。

GPT-4的發布引起了全球范圍內的熱烈關注,比爾·蓋茨稱一生所見的兩次革命性技術就是1980年的圖形用戶界面和2022年的ChatGPT,認為ChatGPT不亞于PC和互聯網的誕生。

國內商界也一致看好,繼王慧文(前美團聯合創始人)、王小川(前搜狗CEO)后,李開復也入局AI大模型賽道,籌建Project AI 2.0,“AI 2.0不僅僅是個高能聊天工具,也不僅僅是圖文創作的AIGC生成,Co-pilot和如今看到的應用都還只是AI 2.0能力的開端”。

國內媒體大多也以積極正面的態度報道,典型的媒體新聞有:

量子位:《ChatGPT大升級!太太太太強了!》

澎湃號:《ChatGPT4發布,我真的慌了!

網易號:《ChatGPT-4震撼發布!準確性提高,能在SAT上能擊敗90%人類》

新京報:《GPT4功能強于ChatGPT 還能識圖和角色扮演》

電腦報:《ChatGPT-4重磅發布,10秒做出一個網站,全面碾壓上一代》

1.1.2 職業焦慮

(1)高盛:AI或致全球3億人“丟飯碗”!

高盛研究發現,ChatGPT等生成式人工智能系統的最新突破,料將給全球勞動力市場帶來重大顛覆,全球預計將有3億個工作崗位被生成式AI取代,律師和行政人員將是最有可能被裁員的崗位。

目前歐美約有三分之二的工作崗位都在某種程度上受到AI自動化趨勢的影響,而多達四分之一的當前崗位有可能最終被完全取代。該研究計算出美國63%的工作暴露在“AI影響范圍”中,其中7%的工作有一半以上的流程可以由AI自動化完成,這使他們很容易馬上被人工智能取代。在歐洲,情況也差不多。

(2)網友

看到ChatGPT各種強大的功能,許多人擔心自己的職業會被替代。

1.1.3 信息泄露

(1)事件

3月24日左右,由于一個開源庫中的錯誤,導致一些ChatGPT用戶可以看到另一個活動用戶聊天歷史記錄中的標題,而且新創建的對話的第一條消息也有可能會在另一個用戶的聊天歷史記錄中可見。另外,同樣的錯誤可能會導致1.2%的 ChatGPT Plus 訂閱用戶在特定的九個小時時間窗口內意外地看到與支付相關的信息。

(2)公司回應

該漏洞是在Redis客戶端開源庫redis-py中發現的,OpenAI一發現該漏洞,就向 Redis 維護者發送了一個修復問題的補丁;并向其用戶和整個ChatGPT社區道歉:表示漏洞已被修復,完整的信用卡號碼在任何時候都沒有暴露,將努力重建信任。

圖 OpenAI道歉聲明的部分截圖

(3)媒體觀點

媒體觀點中最具代表性的是新京報發布的《把數據交給人工智能前要先保證安全》:

ChatGPT泄密事件是一種警示:再先進的新技術,如果存在安全后門,則應用越廣泛、帶來的不可控風險越高。因此,無論是技術開發方和使用方都要高度重視其安全體系建設。希望ChatGPT成為人類發展之福,而不是打開了潘多拉盒子。

(4)網友觀點

就此事而言,大多數網友表示國內又用不了,有bug也與自己無關:

1.1.4 倫理風險

人工智能的倫理問題討論一直伴隨著人工智能的發展,最具代表性的媒體觀點是近日中國經濟新聞網發布的《人工智能倫理問題及趨利避害思考》:

“目前,ChatGPT類的大語言模型人工智能技術及產品風生水起,帶來已知倫理風險主要有以下幾個方面:一是AI抄襲風險,二是信息泄露風險,三是未成年人保護風險,四是價值觀滲透風險,五是勞動者失業風險,六是惡意改造風險。”

1.2 文心一言

1.2.1 發布會引熱議

1.2.1.1 事件輿情

北京時間3月15日凌晨,OpenAI發布GPT4之后,壓力全部給到百度這邊,大家期待文心一言能否與之一戰?作為全村的希望的百度不負眾望在3月16日按期發布了大模型文心一言,百度CEO李彥宏現場展示了文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成五個使用場景中的綜合能力。

然而,由于前期的高調宣傳給大家太高期望,而文心一言目前的功能似乎不能滿足大家的期待;而且由于現場是PPT視頻演示對話,而不是現場直接調用大模型給出答案,引發大家猜測和質疑,甚至被網友調侃為 “ChatGPT” VS “ChatPPT”。

圖 網友調侃文心一言的功能不及預期

也有網友看好百度,比較典型的觀點:

“如果把OpenAI比作大學生,那么文心一言可能還是小學生。我相信經過大量的訓練,文心一言也能成長得非常出色。盡管現在還不完美,百度還信守承諾把文心一言給推出來了,就沖著這份魄力與決心,作為首個中文類ChatGPT產品,我認為是值得鼓勵的。畢竟除了百度,其他大廠都還停留喊口號的階段。”

總的來說,文心一言發布會后的輿論情況分布如下:

1.2.1.2 公司回應

實際上,李彥宏在發布會一開始就承認現在還有差距:“大家的期望值,是我們對標ChatGPT,對標GPT-4,這個門檻有點高。十月懷胎,我們就帶大家來看看這個AI大模型文心一言長什么樣。”

李彥宏事后表示,文心一言雖然還有不少不足之處,但是他為百度團隊能夠在全球大廠中率先推出這樣一個產品感到驕傲,因為市場需求太旺盛了,無數的客戶都想盡快試用和合作。

1.2.2 文生圖再引熱議

百度開放一些賬號,讓用戶可以參與文心一言的測試,只需在線輸入詞語,即可繪制相應的圖像,然而,出現了很多意想不到的結果,用戶紛紛在社交平臺質疑和調侃。

1.2.2.1 疑似套殼

有微博大V質疑:“文心一言恐怕是和漢芯、鴻蒙一樣的東西:套殼、畫皮、造假。”

比如,讓文心一言生成一幅“總線和狗”的圖片,結果卻創作出了一張公交汽車和狗的照片。因為英文的“bus”有公交車和總線的意思。

于是,網友認為文心一言只是把中文句子翻譯成英文,再拿到國外開源的人工智能(Stable Diffusion)上畫圖,然后再將圖片返還給用戶,完全就是個“套殼、畫皮、造假”的人工智能。

一時間引起廣大網友群嘲

“人家一開源,這邊就開始自主創新了,做的還不行。”

“底層就是國外的開源代碼,原封抄過來套了個殼子,就是國產研發了

“就是翻譯+stable diffusion,太明顯了。”

“這畫風一看就是國外的

也有網友反對爆料博主的觀點:

哎吆他一個網紅,百度有沒有連夜公關買斷。你連一個代碼都不會敲的人怎么有臉說人家鴻蒙是套殼、畫皮、造假。

“很多人不會理解的,因為他壓根不知道你說的是什么。就好像你用牛頓-萊布尼茲公式算積分,他也會認為你抄襲,為什么要用外國人的方法呢。”

有這個自研的想法和行動力還是值得尊重的。”

1.2.2.2 文心一言自爆

在對話文心一言,詢問其是否采用Stable Diffusion(國外開源的人工智能)時,文心一言不僅承認使用Stable Diffusion,還承認使用Transformer、GRU等深度學習模型來生成圖像,并非完全自研。

1.2.2.3 沒有套殼

也有冷靜的網友認真分析了背后原因,認為百度的畫圖AI采用了英文標注的開源圖片素材進行訓練,因此需要中翻英來當提示詞。目前還沒有上億規模中文圖文數據集。即使有,噪聲也很大,基本不可以用。行業內都是用國外數據集,做中文映射,才導致這樣的生成效果。

所以,所謂“套殼”、“作假”等恐怕是大眾對文心一言的誤解。

1.2.2.4 腦洞太大

一些網友的評論充滿調侃的意味,也有一些網友認為真是腦洞大開,可以帶來不一樣的文字理解視角;另有些網友純粹覺得這個功能很幽默、很好玩:

這是出來搞笑的吧

“欺負AI不懂成語”

中方負責人工 西方負責智能 沒毛病

確實感受到了歡樂,唐伯虎點秋香,胸有成竹的壯士,哈哈

腦洞大開,看著有點想笑[笑cry]

網友快把文心一言逼瘋了

1.2.2.5 正面評論

有許多網友沒有跟風嘲諷或調侃,而是力挺百度,一些典型觀點如下:

“盡管是困難重重,但百度作為全世界第一家站出來挑戰ChatGPT的中國民營企業,精神確實可嘉。”

“不要太苛刻了,國內要有自己的技術。”

“國內技術看百度這句話的確沒錯,多給點時間吧。”

1.2.2.6 百度回應

1、官方回應

3月23日,百度在微博表示,已注意到對文心一言文生圖功能的相關反饋,并回應說明如下:

(1)文心一言完全是百度自研的大語言模型,文生圖能力來自文心跨模態大模型ERNIE-ViLG。

(2)在大模型訓練中,我們使用的是互聯網公開數據,符合行業慣例。大家也會從接下來文生圖能力的快速調優迭代,看到百度的自研實力。

百度方面還稱,文心一言正在大家的使用過程中不斷學習和成長,請大家給自研技術和產品一點信心和時間,不傳謠信謠。

2、高管回應

百度副總裁袁佛玉在朋友圈曬出了用文心一言制作的AI繪畫。暗示百度已經修正了一些bug。

2、輿情數據對比

2.1 輿情走勢

樂思輿情監測系統顯示,自3月15日GPT-4發布開始,全網有關OpenAI的輿情聲量就一直維持在22000-52000篇的高位,熱度非常高。

百度于3月16 日發布文心一言,全網聲量在3月16日和17日達到頂峰約15000篇,之后的輿情高點逐步走低至約10000篇左右;即文心一言的輿情高點還不及OpenAI的輿情低點。

另外,3.14-3.29期間,OpenAI的日均輿情聲量為37591篇,文心一言的日均輿情聲量為7499篇,只有前者的20%。所以輿論對ChatGPT的熱度遠超文心一言。

2.2 媒體類型

2.2.1 媒體類型數據比例圖

樂思輿情監測系統顯示,3.14-3.29期間,ChatGPT和文心一言在各媒體渠道的信息總量分布比例如上所示。

兩者微信和論壇的信息占比差不多:ChatGPT和文心一言的微信信息占比分別為17.7%和16.7%,兩者在論壇的信息占比分別為10.3%和11.6%。

而ChatGPT在微博信息占比為12.3%,高于文心一言的9.9%。ChatGPT在APP信息占比為9.3%,低于文心一言的13.0%。

2.2.2 網站關注度排行

樂思輿情監測系統顯示,3.14-3.29期間,信息量最高的前八大網站如圖,ChatGPT和文心一言關注度最高的兩大網站都是微信公眾號和新浪微博;ChatGPT在各網站上的關注度都比文心一言高。

2.3 熱詞云圖

從樂思輿情監測系統解析的云圖來看,ChatGPT的熱詞為“ChatGPT”、“人工智能”、“模型”、“科技”、“技術”等,文心一言的熱詞為“文心”、“百度”、“一言”、“模型”、“人工智能”等。人工智能、模型都是兩者的熱詞。

圖 ChatGPT的熱詞云圖

圖 文心一言的熱詞云圖

3、實力對比

3.1 功能

根據國金證券的測試研究,三大模型在客觀問題問答方面都有出色表現,但在數學計算、代碼生成、情感理解和推理方面均有待提升。對比來看,文心一言在圖像創作、歸納總結等問題中表現較為出色,但在邏輯推理領域還有待加強。在具體應用中,三大模型均能基本勝任 AI 助手、售后客服、產品推薦等場景需求,但在文本修飾及古詩詞理解領域仍有提升空間。

圖 “文心一言”與ChatGPT測評結果對比

如,回答一個代碼題:

“用 Python 編寫一個程序,在一個無序數組中查找一個特定的值。要求程序的時間復雜度為 O(log n)。”

在本題的回答中,文心一言沒有準確理解到時間復雜度O(log n)的需求,GPT-3.5及GPT-4給出的代碼為二分法搜索,只有在面對有序數組時才能滿足時間復雜度要求,也非最佳答案。整體來看,三個模型在代碼生成方面均有較大的改進空間,GPT-3.5 與 GPT-4 表現基本持平,略優于文心一言。

圖:文心一言的回答

來源:國金證券

樂思輿情系統的AI助理調用GPT-3.5的回答:

圖:GPT-4的回答

來源:國金證券

3.2 算力—GPU

大模型即“大算力+強算法+大數據”結合的產物。算力是訓練大模型的底層動力源泉,一個優秀的算力底座在大模型的訓練和推理具備效率優勢;AI服務器是算力的底層載體,包含CPU、GPU、內存、硬盤、網卡等。

圖 服務器成本構成

如上圖,在AI服務器中,AI芯片在大模型訓練中成本最高,同時AI芯片是AI算力的“心臟”。人工智能深度學習需要異常強大的并行處理能力,GPU相比于CPU更擅長于并行計算能力,正在大放異彩。根據IDC的數據,2021年H1中國AI芯片,GPU占比最多為91.90%。

GPU服務器超強的計算功能可應用于海量數據處理方面的運算,如搜索、大數據推薦、智能輸入法等。此外,GPU可作為深度學習的訓練平臺,GPU服務器可直接加速計算服務,亦可直接與外界連接通信。

3.2.1 GPT-4:從A100到H100

3.2.1.1 英偉達A100

從2012年卷積神經網絡AlexNet,到最近的ChatGPT,背后都離不開英偉達的算力支持。AlexNet使用的是英偉達GTX 580進行訓練,而OpenAI訓練ChatGPT所用到的A100芯片算力已經達到當年的100萬倍。

當前唯一可以實際處理ChatGPT的GPU是英偉達HGX A100,OpenAI就是使用A100 GPU訓練和運行ChatGPT的。

圖:英偉達NVIDIA HGX A100

NVIDIA A100 Tensor Core GPU 可針對 AI、數據分析和 HPC 應用場景,在不同規模下實現出色的加速,有效助力更高性能的彈性數據中心。A100 的性能比上一代產品提升高達20 倍,并可劃分為七個GPU 實例,以根據變化的需求進行動態調整。

A100 提供 40GB 和 80GB 顯存兩種版本,A100 80GB 將 GPU 顯存增加了一倍,對于具有龐大數據表的超大型模型(例如深度學習推薦模型 [DLRM]),A100 80GB 可為每個節點提供高達1.3TB的統一顯存,而且吞吐量比 A100 40GB 多高達 3 倍。

圖 針對大型模型提供高達 3 倍的 AI 訓練速度

3.2.1.2 英偉達H100

3月21日,在英偉達舉辦的年度GTC開發者大會上,其CEO黃仁勛發表了名為《切勿錯過AI的決定性時刻》(Don’t Miss This Defining Moment in AI)的演講,在長達78分鐘的視頻中,他四次用iPhone時刻”來形容AI當下的發展,并稱“這將是我們迄今為止最重要的一次GTC大會”。

針對算力需求巨大的ChatGPT,英偉達發布了NVIDIA H100 NVL,它是基于去年已經發布的H100的改進版本,是一種具有94GB內存和加速Transformer引擎的大語言模型(LLM)專用解決方案,配備了雙GPU NVLINK的PCIE H100 GPU。外界直呼:這是核彈芯片級別的產品。

黃仁勛表示,H100 GPU的處理速度比之前的A100 GPU快十倍,可以將大語言模型的處理成本降低一個數量級。

圖 英偉達H100 NVL GPU

3.2.1.3 算力平民化—DGX Cloud

另外,英偉達還聯合微軟Azure、Google GCP和Oracle OCI三家云廠商合作推出了DGX Cloud。普通企業想要訓練大語言模型,可以直接租賃DGX云服務,將英偉達DGX AI超級計算機實時接入公司,以滿足高級AI訓練性能要求;即DGX Cloud將把 DGX AI超級計算機“通過瀏覽器引入每一家企業”。

英偉達提供的DGX服務器,包含8個H100或A100圖形處理器和640GB內存,A100層的價格為每月36999美元。相比之下,直接購買一個實體DGX服務器,需要20萬美元;微軟訓練新必應Bing更是花費數億美元購買了數萬個A100芯片。

圖:英偉達DGX云服務

3.2.2 文心一言:昆侖芯

昆侖芯科技戰略負責人宋春曉證實,人工智能芯片是算力的核心,昆侖芯二代已在百度文心大模型的應用中廣泛導入,并為各行各業的智能化升級提供AI算力支持。

基于新一代自研架構昆侖芯XPU-R而設計,聚焦高性能、通用性和易用性。相比1代產品,昆侖芯2代AI芯片的通用計算核心算力提升2-3倍,可為數據中心高性能計算提供強勁AI算力。

圖 昆侖芯2代AI芯片

3.3 訓練數據

3.3.1 GTP-4

OpenAI首席執行官Sam Altman接受公開采訪指出,GTP-4參數量為GTP-3的20倍,需要的計算量為GTP-3的10倍;GTP-5在2024年底至2025年發布,它的參數量為GTP-3的100倍,需要的計算量為GTP-3的200-400倍。

圖 GPT系列模型的數據量和參數量

3.3.2 文心一言

百度 CEO 李彥宏在發布會上介紹,文心一言是百度新一代知識增強大語言模型,它基于百度 ERNIE 及 PLATO 系列模型的基礎進行研發,其大模型的訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據,以及 5500 億事實的知識圖譜等。

早在2019年,百度開發的知識增強語義理解模型ERNIE就登頂了全球權威數據集GLUE榜單,并刷新榜單歷史。現在,該模型已更新迭代至文心ERNIE 3.0,參數規模高達2600億,幾乎比谷歌LaMDA(1350萬)高了一倍,也高于GPT-3 (1750萬),是全球最大的中文單體模型。

目前,GTP-4參數量為GTP-3 (1750萬)的20倍,即3.5萬億,遠高于文心ERNIE 3.0的2600億,不過,李彥宏近日在極客公園的直播中表示,文心一言確實不如現在最好的ChatGPT版本,但差距也不是很大,可能就是一兩個月的差別。文心一言提升速度不慢,但ChatGPT本身也在不斷升級,目前差不多是ChatGPT今年1月份的水平。

3.4 商業化

3.4.1 ChatGPT

2023年2月初,僅僅正式上線2個月的ChatGPT超過Tiktok,成為互聯網歷史上最快突破1億月活的應用。為了達成這個小目標,Tiktok用了9個月,再之前的Facebook花了42月之久。

圖 達1億用戶所用時間

3.4.2 文心一言

3月24日,百度集團副總裁袁佛玉表示,憑借文心一言的優勢,百度智能云有可能成為云計算市場第一。她還首次披露,文心一言新聞發布會后5天,預約測試用戶已經超過100萬,申請文心一言API調用服務測試的企業超過10萬家。

4、小結

目前看,無論是輿情還是技術實力,百度相比GPT-4 都占了下風,而輿論的弱勢是由于技術實力和模型功能的弱勢導致的。大家驚艷于GPT-4的強大功能,對GPT-4提高生產效率的眾多功能表示好奇和支持,也對自己的職業將被替代感到焦慮,許多國內網友還對不能使用GPT-4 感到氣憤,發表許多冷嘲熱諷的觀點。

當文心一言剛發布的3月16日,輿論以失望、群嘲、調侃為主,一些是作為全村希望的文心一言比不過GPT-4 的恨鐵不成鋼;一些是對百度有偏見,因為壟斷多年的百度搜索給用戶的體驗并不好,于是一些人感性的認為百度做什么都垃圾;一些輿論則指向了國產和自主創新,極端的認為國外一開源國內就創新、國外負責智能,百度負責人工。隨著發布會結束,大家逐漸體驗文心一言之后,對其功能有了更全面的認識,負面輿論也在不斷減少,百度畢竟是世界上第二個做出來的觀點成為共識,網友紛紛表示給百度一點時間。無論GPT-4還是文心一言,無論商業領袖還是普通網民,無論產業界還是資本市場,大家已經對AI即將快速商業化形成共識,未來是人工智能的時代。

]]>
樂思輿情監測:ChatGPT輿情傳播分析 http://www.galou.cn/wp/article/23995 Wed, 15 Feb 2023 17:50:04 +0000 http://www.galou.cn/wp/?p=23995 一、概述

近期,人工智能研究公司OpenAI推出的ChatGPT聊天機器人軟件掀起熱潮。根據用戶輸入的問題“侃侃而答”,甚至可以輔助寫論文、寫代碼、輔導作業、構思劇本,ChatGPT五天時間就突破百萬用戶,兩個月便達到1億月活躍用戶,成為史上用戶數量增長最快的消費者應用。在國際和國內互聯網上引起廣泛熱議。

二、ChatGPT簡介

1、基礎功能

ChatGPT是一種聊天機器人軟件: 全名為Chat Generative Pre-Training Transformer,是OpenAI于2022年11月推出的聊天機器人。

ChatGPT功能可分為七大板塊,生成應用和布局、搜索和數據分析、程序生成和分析、文本生成、內容創作、一般推理和其他七部分。基于其龐大的算力和算法分析,應用領域有望覆蓋教育、科研、游戲、新聞等多重板塊并有望持續拓展,擁有潛在空前藍海,市場潛力較大。

ChatGPT功能舉例:

2、ChatGPT的實現路徑和原理

ChatGPT實現路徑:算力與框架支持,應用百花齊放

來源:浙商證券

ChatGPT經歷了人工智能發展的三大趨勢:機器學習、神經網絡和Transformer

ChatGPT的計算邏輯來自于一個名為transformer的算法,它來源于2017年的一篇科研論文《Attention is all your need》。原本這篇論文是聚焦在自然語言處理領域,但由于其出色的解釋性和計算性能開始廣泛地使用在AI各個領域,成為最近幾年最流行的AI算法模型,無論是這篇論文還是transformer模型,都是當今AI科技發展的一個縮影。

transformer的核心算法結構:

3、對AIGC的影響

ChatGPT是生成式人工智能(AIGC)浪潮的一部分,核心價值在于優化內容生產的效率與創意:

華西證券認為,ChatGPT的一小步,是AI發展的一大步: ChatGPT (AIGC)的出現使AI從感知理解世界到生成創造世界的躍遷,AIGC出現前的人工智能更偏向于分析,例如目前最火熱的個性化推薦算法,ChatGPT(AIGC)出現后的人工智能更具備“擬人化”,可以自主的創造文本、圖像、視頻、3D交互內容,以及包括開啟科學新發現、創造新價值和意義。

如果AI推薦算法是內容分發的強大引擎,AIGC則是數據與內容生產的強大引擎,其影響行業包括社交媒體、游戲、編碼設計、平面設計等,原因是AIGC有望把內容創造的邊際成本降至零,從而產生龐大的勞動力,換句話說,AIGC的關鍵影響因素在于以降低成本和自動化的方式生成內容,從而重塑內容身生產的供給模式。

三、輿情走勢

樂思輿情監測系統顯示:2月1日至2月5日,ChatGPT相關聲量走勢平穩,在13000至21000間橫盤波動;2月6日、7日、8日連續暴漲三天,2月8日達到頂峰91965;其后雖然熱點逐日降低,但絕對值看依然熱點很高,超過月初。

四、熱點話題

本月02.01-02.13,全網熱點最高的傳播話題有:

“1分鐘看懂ChatGPT是啥”、

“哪些職業容易被人工智能代替?”、

“#可能被ChatGPT取代的10大職業#”、

“人類要失業了嗎?”、

“經過一個小時的努力,成功使用到了官方的chatGPT”、

“我用ChatGPT搞錢,月賺10萬”、

“ChatGPT爆火,國內研發進展如何?”、

“為什么chatgpt沒有誕生在中國”、

“國內C刊聲明:隱瞞ChatGPT使用情況將被退稿或撤稿”、

“ChatGPT之父傳奇:8歲會編程,16歲出柜,2個月做到月活過億”、

“#美國89%的大學生都是用ChatGPT#”等。

五、媒體類型

1、在各媒體類型上的數據走勢圖如下:

2月6日以來,微博上傳播一直領先:

2、媒體類型數據比例圖:

從輿情渠道分布來看,微博占比22%,新聞占比15%,微信占比14%,APP占比13%。

3、網站關注度排行

六、熱詞云圖

從樂思輿情監測系統解析的云圖來看,“chatgpt”、“人工智能”、“數據”、“市場”、“增長”等是提及的高頻詞匯。

七、各大廠商ChatGPT相關產品動態

各大產商相關產品動態:

公司2021年總收入 (億元)動態
谷歌18000(1)谷歌將推出ChatGPT競爭對手Bard;(2)谷歌將以“搜索伴侶”形式推出類ChatGPT服務。
微軟11760(1)微軟正式發布 ChatGPT 版必應搜索和 Edge;(2)將聊天機器人 ChatGPT 技術整合到 Word、PowerPoint 和 Outlook 等 Office 應用程序中;(3)微軟計劃為公司、學校和政府發布一項技術,讓它們用ChatGPT創建自己的機器人。
京東9516京東云旗下言犀人工智能應用平臺計劃推出產業版ChatGPT——ChatJD,主要應用場景包括內容生成、人機對話、用戶意圖理解等五個方面。
阿里7170阿里內測中的達摩院版ChatGPT,被提前曝光。從內測信息來看,阿里版ChatGPT已經能夠實現類似OpenAI版的對話能力。
華為6368華為在與ChatGPT相關的大模型領域早有布局,2021年發布了鵬城盤古大模型,是業界首個千億級生成和理解中文NLP大模型。
騰訊5600基于此前在AI大模型、機器學習算法以及NLP等領域的技術儲備,騰訊將進一步開展前沿研究及應用探索
字節跳動4391字節跳動的人工智能實驗室(AI Lab)有開展類似ChatGPT和AIGC的相關研發,未來或為PICO提供技術支持。
小米3283小米在ChatGPT領域有豐富落地場景,包括小愛對話、機器人等,其中小愛擁有龐大數據支撐,會讓小米在大模型方面進展更迅速。
百度1245百度宣布類ChatGPT項目——“文心一言”(ERNIE Bot)計劃于3月份完成內測,面向公眾開放。
科大訊飛183科大訊飛日前表示AI學習機將成為該項技術率先落地的產品,并將于今年5月進行產品級發布。
三六零108三六零:公司計劃盡快推出類ChatGPT技術的demo版產品。
昆侖萬維48昆侖萬維:旗下Opera瀏覽器計劃接入ChatGPT功能。
網易有道40網易有道:將推出ChatGPT同源技術產品 落地教育場景。

八、產業鏈

ChatGPT相關的產業鏈產商主要包括三大類——底層的算力、芯片、云服務商,以及上層的模型開發公司(如 OpenAI),還有終端的純調用模型的應用開發公司。

來源:浙商證券

1、算力需求與AI芯片

ChatGPT完美運行的三個條件:訓練數據+模型算法+算力

來源:浙商證券

要獲得ChatGPT功能,需要在基礎模型上進行大規模預訓練,這需要大量算力。據微軟官網,微軟Azure為OpenAI開發的超級計算機是一個單一系統,具有超過28.5萬個CPU核心、1萬個GPU和400 GB/s的GPU服務器網絡傳輸帶寬。據英偉達,使用單個Tesla架構的V100 GPU對1746億參數的GPT-3模型進行一次訓練,需要用288年時間。此外,算力資源的大量消耗,必然伴隨著算力成本的上升,據Lambda,使用訓練一次1746億參數的GPT-3模型所需花費的算力成本超過460萬美元。

算力資源=AI芯片+服務器+數據中心

ChatGPT有著大量復雜計算需求的AI模型,算力消耗非常巨大,需要強大的AI芯片提供算力基礎。 AI芯片專門用于處理人工智能應用中的大量計算任務的模塊,包括GPU(圖形處理器)、FPGA(現場可編程邏輯門陣列)、ASIC(專用集成電路)和DPU(處理器分散處理單元)等。

GPU的性能是模型強大算力的來源。1999年,英偉達推出顯卡GeForce 256,并第一次將圖形處理器定義為“GPU”,由此奠定了其在GPU領域的優勢位置。由于ChatGPT的火爆,英偉達應聲而漲。2月13日收盤,英偉達最新股價已達到217美元,較今年1月3日的143美元上漲50%。

國內主要GPU生產商包括景嘉微、龍芯中科、海光信息。但從機構與公司的公開回應來看,國內ChatGPT相關芯片產業尚處于發展的初期。

景嘉微表示,公司產品未涉及AI訓練和ChatGPT相關業務。“公司GPU主要用來做圖形處理的,ChatGPT需要高速計算我們目前沒有做。”

龍芯中科證代也表示,公司內部并沒有產品用于ChatGPT。

2、模型開發———OpenAI公司

(1)公司項目

OpenAI相關AI項目:

業務名稱描述
ChatGPT對話模式的AI交互模型,具備 回答一系列問題、承認錯誤、質疑不正確的前提和拒絕不適當的請求等功能。
DALL·E2是一個新的人工智能系統,可以根據自然語言的描述創建逼真的圖像和藝術。
Whisper是一種自然語言處理的神經網絡模型,是一種自動語音識別系統。并且支持多種語言的轉錄及翻譯成為英語。
Alignment該項研究專注于訓練AI系統,不斷提升實用性、仿真性和安全性,進一步探索和開發AI系統在人類反饋中學習的方法。

(2)OpenAI發展歷程

微軟投資的OpenAI是一家AI實驗室,與Alphabet(谷歌母公司)旗下的DeepMind和Meta AI(臉書母公司)相競爭,OpenAI被AI研究人員評為全球三大AI實驗室之一。

OpenAI于2015年在舊金山成立,幾位創始人包括特斯拉創始人馬斯克、美國創業孵化器Y Combinator總裁阿爾特曼、全球在線支付平臺PayPal聯合創始人彼得·蒂爾等硅谷科技大亨。

2019年7月,微軟向OpenAI注資10億美元。這筆投資使微軟成為OpenAI的“獨家”云計算服務提供商。

2020年6月11日,OpenAI宣布了GPT-3語言模型,微軟于2020年9月22日取得獨家授權。

2022年1月27日對外表示已從投資者處籌集了2.5億美元。

2023年1月30日,微軟聲明將向OpenAI進行一項為期多年、價值數十億美元的投資,以加速其在人工智能(AI)領域的技術突破。OpenAI估值飆升至290億美元。

(3)商業模式

2月2日,美國OpenAI公司宣布推出付費試點訂閱計劃ChatGPT Plus,定價每月20美元。付費版功能包括高峰時段免排隊、快速響應以及優先獲得新功能和改進等,同時,OpenAI方面仍將提供對ChatGPT的免費訪問權限。

3、終端調用

(1)AI助手版必應+Edge

2023年2月8日,微軟發布會在華盛頓雷德蒙德如期召開,由ChatGPT和GPT-3.5提供支持的全新搜索引擎必應Bing和Edge瀏覽器正式亮相。

新的必應Bing是在一個新的、下一代的OpenAI大型語言模型上運行的,這個模型比ChatGPT更強大,而且是專門為搜索而定制的。它從ChatGPT和GPT-3.5中吸取了關鍵的經驗和進步——更快、更準、更強。

除了新的 Bing,微軟還為Edge瀏覽器推出了兩項新的AI增強功能:“聊天”和“撰寫”。這些功能將嵌入到Edge的側邊欄中。新版必應和 Edge 將搜索、瀏覽和聊天整合為一種統一的體驗,你可以從網絡上的任何地方調用。

(2)樂思萬能助理

ChatGPT 最顯著的一個特性是降低了內容生產的門檻,具有AI算法商業落地經驗的廠商,大幅受益于AIGC(AI Generated Content,人工智能技術生成內容)的發展,原因是AI算法的龍頭廠商在自然語言處理、機器視覺、數據標注方面都具有先發優勢和技術領先性。例如:樂思軟件的萬能助理,可大大提高工作效率:

九、A股市場

目前國外的大公司如微軟、谷歌等都動作頻頻,無論是模型端,還是應用層面,甚至包括現在發布的一些產品,都達到了一定的高度。不過,從國內目前的狀況來看,無論是大公司還是創業公司,更多還處于早期或跟隨的狀態。

資本市場也主要以炒作為主,幾個熱門公司本月漲幅:

A股公司收入2021(億元)總市值(億元)2023.02.01總市值(億元)2023.02.1420230201-20230214漲幅關聯產品
海天瑞聲24487100%據公司2021年年報:公司生成的訓練數據主要覆蓋智能語言、計算機視覺和自然語言處理三大領域。
鴻博股份6386265%在2022年8月鴻博股份就關于北京·AI創新賦能中心的建設發布公告并披露與協議合作方共建的核心業務范圍。其中即包括機器學習、深度學習、NLP自然語言處理、AIOT等AIGC相關的技術研發和產業布局。目前英博數科虛擬管培生小E已經上線。
漢王科技16548658%據2022年半年報:漢王科技作為人工智能領域的先行者,在視覺圖像識別及人機智能交互方面持續投入,擁有業內領先文本圖像識別、自然語言處理、生物特征識別、智能視頻分析、智能人機交互等人工智能產業鏈關鍵技術。
天娛數科187711448%公司制作的虛擬數字人在語音交互功能中應用了基于AIGC技術的NLP問答技術。 “MetaSurfing-元享智能云平臺”未來不僅要實現關鍵詞生成圖片、聲音、圖像、文本、音樂等簡單的內容,同時還要完成智腦化的組合應用,通過關鍵詞、描述生成可直接應用的3D模型資產、短視頻、CG動畫、直播等多類型的視覺/聽覺/應用三位一體的高效內容輸出,以“你說1我做1”為起點向“你說1我做N”為目標,徹徹底底的解決了內容編撰、資產制作、后期特效等工作所帶來的超高的時間成本與運營壓力。
云從科技1116924143%公司在技術研究方面一直保持較大投入,在視覺、語音、NLP等方向上都在實踐類似于ChatGPT的“預訓練模型+反饋調優”的技術路線,通過自研的視覺大模型和NLP大模型,大幅提高了算法的生產效率,也進一步提升了公司核心算法的效果。
三六零10951472742%公司的人工智能研究院從2020年開始一直在包括類ChatGPT技術在內的AIGC技術上有持續性的投入,但截至目前僅作為內部業務自用的生產力工具使用,且投資規模及技術水平與當前的ChatGPT 3相比還有較大差距,各項技術指標只能做到略強于ChatGPT 2。
初靈信息5324540%公司的智能對話平臺是基于人工智能技術,以Chatbot方式面向用戶提供多媒體智能應答服務,已擁有AI智能客服、智能外呼、文本機器人、來電助理、智能培訓等成熟應用。公司的智能對話平臺通過IMS接入產品接入IMS網絡,可通過開發運營商發布的標準接口協議實現和5G消息網關的對接,并通過Chatbot實現人機交互模式。
科大國創17466438%據募集說明書:公司具有科大國創聊天機器人系統[簡稱:聊天機器人]V1.0。
開普云5253331%公司在數智內容、數智安全及元宇宙業務方向上的核心技術均采用了與ChatGPT類似的預訓練語言模型,以GPT、BERT等Transformer類模型為基礎,結合專業領域知識圖譜過濾語言模型中存在的事實性錯誤,同時可以根據交互反饋進行模型的優化訓練。
拓爾思1013417228%公司主要的技術方向是語義智能,是人工智能領域比較前沿的方向。語義智能的核心技術自然語言處理(NLP),拓爾思是國內最早投入自然語言處理技術研發的企業,是中文全文檢索技術的創始者,有著深厚的研發和應用積累。公司的主要產品服務包括TRS DL-CKM人工智能技術平臺、TRS Hybase海貝大數據管理系統、TRS網絡信息雷達系統、TRS ETL分布式數據整合軟件系統、TRS海云集約化智能門戶平臺、TRS融媒體智能生產與傳播服務平臺、TRS輿情態勢感知平臺等;云服務主要有TRS網察大數據云服務、TRS數家媒體大數據云服務、TRS數星智能風控大數據云服務、“冒煙指數”金融風險預警云服務等。

十、一級市場

2020-2022年AIGC相關公司的融資規模正大幅增長:

2020-2022年期間,國內AIGC相關公司的融資詳情:

根據樂思軟件輿情監測系統,AIGC相關的國內公司的最新融資動態如下:

公司融資情況
飛蝶XR科技2023年2月13,近日「飛蝶XR科技」宣布完成數千萬元人民幣A+輪融資,自研零代碼AIGC工具解放XR內容創作力。由開晟創投旗下東南產投基金獨家投資,本輪融資將用于“零代碼XR內容創作工具”(簡稱“飛蝶靈創”,英文名稱:XR CreateX)產品持續迭代。
魔數智擎2023年2月9日,深圳市魔數智擎人工智能有限公司(以下簡稱「魔數智擎」)已完成由理想資本投資的千萬級A1輪融資,「魔數智擎」于2018年正式切入決策類AI垂直賽道,是一家提供可解釋、可干預、簡單化人工智能決策模型平臺的AI決策智能服務商。
深氧科技2023年2月8日,3D短視頻的一站式AIGC引擎技術服務提供商「深氧科技」宣布完成由漢能創投投資的千萬元級天使輪融資
曼孚科技2023年2月6日,近日曼孚科技宣布已完成5000萬元Pre-B輪融資,投資方包括凱復資本以及公司管理團隊,曼孚科技商業化始于2019年,是一家AI基礎架構與數據智能平臺服務商。
橙麥智能2023年2月6日,基于AI數字人技術及AI智能語音技術的“橙麥智能”軟件系統近日拿到A輪融資,融資金額達數千萬元。

樂思軟件輿情監測系統顯示,AIGC融資情況方面的信息,傳播媒體類型構成如下圖所示,主要分布在新聞、APP和微信等:

]]>