國產版 ChatGPT 大盤點
來源:
奇酷教育 發表于:
國產版 ChatGPT 大盤點
? 國產版 ChatGPT 大盤點
3月16日,百度發布類ChatGPT產品「文心一言」,并開放測試。
3月29日,周鴻祎在某大會上,演示360版的ChatGPT產品。
4月7日,阿里版ChatGPT產品「通義千語」并開啟內測邀請。
預約地址:https://tongyi.aliyun.com/
4月9日,360的大預言模型「360智腦」開放預約,即將在4月16日開放測試。預約地址:https://www.so.com/zt/invite.html#/
那在類ChatGPT賽道上,有哪些中國版的ChatGPT?
1、百度:文心一言
3月16日,百度正式推出國內首款生成式AI產品“文心一言”,可支持文學創作、文案創作、數理推算、多模態生成等功能。
“文心一言”基于全棧自研的AI基礎設施進行學習和訓練:
①文心知識增強大模型:“文心一言”的模型層核心能力,該產品主要采用ERNIE系列文心NLP模型,擁有千億參數級別的ERNIE 3.0 Zeus為該系列最新模型,進一步提升了模型 對于不同下游任務的建模能力,大大拓寬了“文心一言”的應用場景。
②飛槳深度學習平臺:“文心一言”的框架層核心能力,系業內首個動靜統一的框架、首個 通用異構參數服務器架構,支持端邊云多硬件和多操作系統,為文心大模型提供有效、快捷、完整的訓練框架。
③昆侖芯2代AI芯片:“文心一言”的芯片層核心能力,采用自研XPU-R架構,通用性和性能顯著提升;256 TOPS@INT8和128 TFLOPS@FP16的算力水平,較一代提升2-3倍, 保障“文心一言”算力需求。
文心一言是國內關注度極高的首款類ChatGPT產品,一經發布便涌入了大量的用戶。雖然百度創始人李彥宏坦誠:文心一言并不完美,大開腦洞的文生圖也一度引起了大眾熱議。
此外,百度還推出了企業級大模型服務平臺“文心千帆”,不僅包括文心一言,還包括百度全套文心大模型、相應的開發工具鏈。未來,文心千帆還會支持第三方的開源大模型。
2、騰訊:混元
3月30日,騰訊集團高級執行副總裁、云與智慧產業事業群CEO湯道生向媒體表示,騰訊正在研發類ChatGPT聊天機器人。對于騰訊的聊天機器人是集成到QQ、微信,還是通過騰訊云向B端用戶服務,湯道生說:“都會有。”
騰訊在大模型領域的布局早已有之,其“混元”系列AI大模型覆蓋了NLP、CV、多模態等基礎大模型以及眾多行業/領域大模型。這成為了騰訊構建類ChatGPT產品的堅實技術儲備。
2022年5月,騰訊混元AI大模型在CLUE總排行榜、閱讀理解、大規模知識圖譜三個榜單同時登頂,一舉打破三項紀錄。
目前,混元AI大模型已經廣泛應用于騰訊微信搜索、騰訊廣告等業務場景,提升了搜索體驗和廣告推薦精準度。
據報道,騰訊針對ChatGPT對話式產品成立了“混元助手(HunyuanAide)”項目組,由騰訊首席科學家、騰訊AI Lab及Robotics X實驗室主任張正友博士負責。
根據最新的騰訊內部學習會議內容:
1、在大模型進展方面:騰訊AI大模型六個BG都有參與,其中TEG(技術工程事業群)在算法上更偏整體,其他BG更偏行業。
2、在水平方面:其萬億參數的水平,相比ChatGPT性能更強,但可能比GPT4比有所不足。混元大模型目前偏自然語言,而GPT4支持多模態。
3、在前景方面:后續在商業化推進中,大模型可能會接入微信、游戲、短視頻、廣告、TOB端等業務。
在全球范圍內,騰訊與谷歌、OpenAI等巨頭相比,在大語言模型AI的技術研究和應用上仍存在差距。不過,憑借龐大的用戶基數、多元化的業務布局以及強大的技術實力,騰訊在大語言模型AI的發展中仍具有其獨特的競爭優勢。
不久前騰訊發布財報后,騰訊總裁劉熾平也透露了騰訊聊天機器人的計劃,“不急于求成,先打好基礎,再追求新進展,我們的第一款產品將會是多次迭代之后的產品,整個過程將是長期的”。
3、阿里:通義千言
4月7日,阿里版ChatGPT產品「通義千語」并開啟內測邀請。
早在2月8日,阿里巴巴內部一款標名“預發布”的應用被“打碼”曝光,被認為是達摩院版的ChatGPT新品。從曝光截圖來看,阿里巴巴可能將AI大模型技術與釘釘生產力工具深度結合。
圖源:知乎
此外,這款傳說中的產品可以實現的功能不止于知識回答,還包括AI繪畫、代碼生成、小說續寫、文案撰寫、寫詩作詞。
媒體向阿里巴巴內部人士證實,目前公司確實在研發相關產品,并已經處于內測階段。據透露,目前該款產品的命名還沒有最終確定。
早在2022年9月,達摩院曾發布過“通義”大模型系列。據透露,阿里版ChatGPT,正是基于通義大模型體系進行融合升級。
據報道,推出的通義大模型底座基于統一學習范式OFA等底層技術打造,具備了能搞定多種任務的“大一統”能力:不引入新增結構,單一模型即可同時處理圖像描述、視覺定位、文生圖、視覺蘊含、文檔摘要等10余項單模態和跨模態任務。升級后,更是可以處理超過包括語音和動作在內的30多種跨模態任務。
但據知情人士透露,打造中文ChatGPT的生態,這個定義對于阿里來說可能窄了一點。相比之下,阿里更希望能引領中文大模型的發展趨勢。
4、字節:組建大模型團隊
2月23日,從多個獨立信源處獲悉,字節跳動在大模型上已有所布局,分別在語言和圖像兩種模態上發力。
字節跳動相關技術負責人對此回應:技術中臺在這些領域有探索,還很初期,不成熟。
一名知情人士透露,語言大模型團隊由字節搜索部門牽頭,目前團隊規模在十數人左右。
圖片大模型團隊則由產品研發與工程架構部下屬的智能創作團隊牽頭。
值得注意的是,字節跳動有不少AI產品,比如:剪映,就是一款視頻智能生成工具。
5、京東:ChatJD
2月10日,京東云官微發布,京東云將推出“產業版”ChatGPT,產品名字叫:ChatJD。并公布ChatJD的落地應用路線圖“125”計劃。
· 1個平臺:ChatJD智能人機對話平臺
· 2個領域:零售、金融
· 5個應用:內容生成、人機對話、用戶意圖理解、信息抽取、情感分類
圖源:通信產業網
6、華為:盤古
華為近日宣布,4月8日將推出其最新的盤古大模型4,稱“將是超過任何其他類似應用的最先進、最強大的自然語言處理應用”。
根據華為云官網顯示,華為即將上線的“盤古系列AI大模型”分別為:NLP大模型、CV大模型、以及科學計算大模型。
其中,盤古“NLP大模型”是被認為最接近人類中文理解能力的AI大模型,而盤古“CV大模型”首次兼顧了圖像判別與生成能力。
01 大模型規模
華為盤古大模型的規模相對較小,僅擁有1200億個參數;而GPT-3則有1750億個參數,是目前最大的自然語言處理模型。因此,在某些任務上,GPT-3可能在表現上更為突出。
02 訓練數據
雖然盤古模型擁有的參數少于GPT-3,但是華為在訓練時使用了大量的中文文本,包括不同類型的文本數據,如百科、新聞、小說、行業專業文本等。這種多樣性的數據來源使得盤古模型擁有更廣泛的知識和語言能力,對于中文應用來說具有很大的優勢。
03 模型用途
華為盤古大模型主要應用于中文的文本生成、問答、翻譯等任務。而GPT-3則可以應用于英文和其他語言的文本生成、翻譯、自然語言推理、問題回答等任務。由于應用領域不同,兩者在某些任務上的效果也有所不同。
7、網易:子曰
早在2月9日,網易有道方面透露,有道AI技術團隊已投入到ChatGPT同源技術(AIGC)在教育場景的落地研發中,目前該團隊已在AI口語老師、中文作文批改等細分學習場景中嘗試應用。
同時,公司有望盡快推出相關的demo版產品,該產品的面世將標志著AIGC技術在國內互聯網教育場景的首次著陸。
網易有道專為教育類場景自研的類ChatGPT模型“子曰“將于近期開放內測。
①在教育內容的數據方面,網易有道在語言學習方面有著較為深厚的積累,2007年網易便推出了有道詞典,這讓網易積累了較多的語言學習數據,為“子曰”提供了良好的培育土壤。
②在算力方面,針對教育垂類,成本將有所下降。有道詞典筆P5產品已升級至NPU方案,相對CPU版本模型推理速度提高了數倍,實現了“一目十行”的識別效率;在模型大小增加15倍的基礎上,AI引擎的精確度也獲得了大幅提升。且網易有道在AI算法方面也處于國內較為領先的地位,不過有道“子曰”的最終效果能夠達到何種程度目前尚不得而知。
8、360:360智腦
4月9日,360的大預言模型「360智腦」開放預約,即將在4月16日開放測試。
一經上線,涌進2萬多人預約。
“搭不上ChatGPT這班車的企業會被淘汰。”周鴻祎與張朝陽在一檔欄目中如是說,而日前,360版本的GPT已經被紅衣教主“抱出來讓大家看看”。
早在3月29日,在數字安全與發展高峰論壇上,周鴻祎發布了360版“ChatGPT”。
從現場演示來看,360版GPT確實已經具備一定的推理能力,但在回答問題時,仍需要多次提問、提醒才能得出讓人比較滿意的答案。
圖源:網絡
此外,周鴻祎還表示360很快便會推出智能辦公產品,并加上類 ChatGPT的能力,這一點和微軟office軟件的發展方向也是類似的。
此前,360稱,目前360搜索是中國搜索引擎的Top 2,市場份額為35%,但截至目前僅作為內部業務自用的生產力工具使用,且投資規模及技術水平與當前的ChatGPT 3相比還有較大差距,各項技術指標只能做到略強于ChatGPT 2。由于訓練數據源及應用方向的原因,在中文環境下的實際效果強于ChatGPT 2。
同時,360在數據資源端有豐富的多模態大數據積累和相關語料、尤其是中文語料,相較于國外同行落后的是預訓練大模型和有效的多模態數據清洗與融合技術。公司有充足的資金儲備可用于購買大規模算力,在繼續深入自行研發的同時,不排除尋找強有力的合作伙伴,以開放的心態搭建多方共享平臺、補足短板,快速縮小差距。
周鴻祎曾表示,360的人工智能戰略用四個字形容就是“兩翼齊飛”,先占據應用場景,同步全力發展核心算法技術。
9、光年之外:廣納AI人才
2月13日,原美團聯合創始人王慧文,發了一條“英雄帖”,稱要出資5000萬美元,打造中國的OpenAI(ChatGPT主體公司),同時為自己的新事業招募人才。
第二天,北京智源人工智能研究院副院長劉江在朋友圈發文表示,已經決定加入王慧文的光年之外團隊。
并稱,將幫助王慧文打造中國AI大模型夢之隊,對標OpenAl,打造中國自己的ChatGPT和基礎大模型。
圖源:微博
接著,搜狗輸入法之父馬占凱,發表微博稱加入光年之外。
最近披露的消息是,光年之外與國產AI框架一流科技(Oneflow)將達成并購意向。目前該消息已被證實,尚在談判中。
可以看出,無論是框架層面、模型算法層面,還是AI產品層面,人員正在齊備,光年之外的類ChatGPT產品雛形正在慢慢清晰。
10、奇酷教育:QIKU人工智能助手
人工智能應用、爬蟲程序、Java代碼,述職報告、論文、作業……無需繁瑣的注冊手續,只需鏈接奇酷教育Qiku-Chat小程序,2023也能狂飆ChatGPT!
