直擊WAIC2023行業(yè)首份《生成式AI》報(bào)告:2024年中國將出現(xiàn)比肩GPT-4的多語言通用大模型
①2024年中國出現(xiàn)比肩GPT-4的多語言通用大模型;超長上下文將引領(lǐng)下一次LLM技術(shù)突破: ②報(bào)告認(rèn)為,隨著算力與模型的進(jìn)步,更多初創(chuàng)企業(yè)正在涌入,它們搶到了時(shí)間的紅利,但也面臨競爭和可能的巨頭碾壓。
《科創(chuàng)板日?qǐng)?bào)》7月7日(記者 陳美)如果說2022年被稱為生成式人工智能之年,2023年則把大模型推向高峰。
7月7日,在2023世界人工智能大會(huì)(WAIC)啟明創(chuàng)投論壇“生成式AI與大模型:變革與創(chuàng)新”上,啟明創(chuàng)投攜手未盡研究,共同發(fā)布《生成式AI》。據(jù)悉,這是首份基于對(duì)海內(nèi)外逾百家企業(yè)深入調(diào)研撰寫的生成式AI洞察報(bào)告。
《科創(chuàng)板日?qǐng)?bào)》記者從現(xiàn)場(chǎng)獲悉,啟明創(chuàng)投合伙人周志峰作為發(fā)布人,從創(chuàng)新應(yīng)用、前沿研究、監(jiān)管、安全、政策、人才以及行業(yè)十大前瞻等多個(gè)方面,對(duì)報(bào)告進(jìn)行了解讀。
在解讀中,周志峰表示,算力目前是最稀缺的資源,也處于最容易獲利的要津。算力作為大模型成本結(jié)構(gòu)中最大一塊,GPU的性能,實(shí)際上決定了這個(gè)新興行業(yè)的步調(diào)。
“隨著算力與模型的進(jìn)步,更多初創(chuàng)企業(yè)正在涌入,它們搶到了時(shí)間的紅利,但也面臨競爭和可能的巨頭碾壓?!敝苤痉褰庾x《生成式AI》時(shí)談到。
與2022年相比,《生成式AI》認(rèn)為,2023年更多比例的新公司聚焦在底層技術(shù)的創(chuàng)新;大模型創(chuàng)業(yè)公司也開始分化,在通用大模型創(chuàng)業(yè)公司方興未艾的同時(shí),許多面向醫(yī)療、電商、科研、工業(yè)、自動(dòng)駕駛和機(jī)器人等特定方向的垂直大模型公司,開始出現(xiàn)。
但在此過程中,《生成式AI》認(rèn)為,大模型既需要超越對(duì)下一個(gè)詞的預(yù)測(cè)能力,也需要一個(gè)更豐富、更復(fù)雜的“慢思考”深層機(jī)制,來監(jiān)督“快思考”預(yù)測(cè)下一個(gè)詞的機(jī)制。
周志峰在講解《生成式AI》時(shí)表示,政府對(duì)于生成式人工智能的監(jiān)管反應(yīng)相當(dāng)及時(shí),各國出現(xiàn)了不同特點(diǎn)。中國在迅速推出生成式人工智能的監(jiān)管辦法并征求意見的同時(shí),也在鼓勵(lì)發(fā)展通用人工智能。
“北京、上海、深圳是最具雄心的第一梯隊(duì),均提出了較具雄心的人工智能科研、創(chuàng)新與產(chǎn)業(yè)目標(biāo)。歐盟繼續(xù)在監(jiān)管和立法方面領(lǐng)先,一如其5年前率先推出GDPR。美國更在意人工智能技術(shù)的領(lǐng)先地位,正在形成以風(fēng)險(xiǎn)管理為原則的監(jiān)管框架?!?
長期來看,人才對(duì)人工智能未來的影響,超過了算力。中國研究人員發(fā)布的論文在數(shù)量上已經(jīng)超過了美國,但金字塔頂端,無論是研究還是創(chuàng)業(yè),美國仍然占據(jù)明顯優(yōu)勢(shì)。同時(shí),科技部已提出了人工智能企業(yè)應(yīng)接受科技倫理審查;審查主體應(yīng)該設(shè)立科技倫理(審查)委員會(huì)。美國人工智能企業(yè)較早開始設(shè)立負(fù)責(zé)任與可信人工智能部門,從去年到今年以來經(jīng)過一些調(diào)整,反映出在生成式人工智能發(fā)生變革之際,企業(yè)正在尋求用更好的技術(shù)和方案,來安全和負(fù)責(zé)地部署新技術(shù)。
值得一提的是,在解讀完這份報(bào)告之后,周志峰還發(fā)布了《生成式AI》的十大前瞻。
其中,在大語言模型方面,《生成式AI》認(rèn)為,2024年中國將出現(xiàn)比肩GPT-4的多語言通用大模型;超長上下文(Long Context)將引領(lǐng)下一次LLM技術(shù)突破;在出現(xiàn)更有前景的大語言模型之前,為實(shí)現(xiàn)垂直領(lǐng)域更好的效果,以下三種方式將共存:第一,在不改變數(shù)據(jù)分布的情況下,利用更多通用數(shù)據(jù)進(jìn)行通用大模型預(yù)訓(xùn)練,不特別引入行業(yè)數(shù)據(jù);第二,利用行業(yè)專屬數(shù)據(jù)微調(diào)(Fine-Tuning)通用大模型;第三,利用行業(yè)數(shù)據(jù)占比更高的數(shù)據(jù)集,進(jìn)行垂直模型預(yù)訓(xùn)練。
多模態(tài)模型中,當(dāng)前CLIP+Diffusion的文生圖模型是過渡態(tài),未來2年內(nèi)將出現(xiàn)一體化的模型結(jié)構(gòu);下一代Text-to-Image模型將具備更強(qiáng)的可控性,它將結(jié)合底層模型能力和前端控制方式,對(duì)模型的設(shè)計(jì)將注重與控制方式的結(jié)合;2025年之前,Video和3D等模態(tài)將迎來里程碑式的模型,大幅提高生成效果。
此外,以PALM-E為代表的具身智能(Embodied AI)展現(xiàn)出機(jī)器人感知、理解和決策等方向上的巨大潛力,但當(dāng)前訓(xùn)練和可靠性存在較大挑戰(zhàn);短期內(nèi)Transformer正成為多個(gè)模態(tài)的主流網(wǎng)絡(luò)結(jié)構(gòu),但壓縮整個(gè)數(shù)字世界的通用方法尚未出現(xiàn),Transformer并不是人工智能技術(shù)的終點(diǎn)。
商業(yè)機(jī)會(huì)上,《生成式AI》認(rèn)為,3年內(nèi)顛覆式的AI應(yīng)用的核心驅(qū)動(dòng)力來自于底層模型的創(chuàng)新,兩者無法解耦,模型的作用將大于產(chǎn)品設(shè)計(jì)的作用;當(dāng)前生成式AI市場(chǎng)處于技術(shù)主導(dǎo)的早期階段,存在千億美元市值的平臺(tái)性企業(yè)的機(jī)會(huì)。