2023年5月10日,后摩智能正式發(fā)布存算一體智駕芯片——鴻途?H30,最高物理算力 256TOPS,典型功耗35W,成為國內(nèi)率先落地存算一體大算力AI芯片的公司。
在人工智能技術飛速發(fā)展的今天,高效的AI計算能力成為智能駕駛普及應用的重要基石。這離不開芯片的底層支持,其是實現(xiàn)智能座艙和自動駕駛等各種功能場景與服務的重要因素。對于如何打造高算力、高效率的芯片平臺,是行業(yè)共同的發(fā)力方向,也催生出了多種多樣的架構創(chuàng)新。
計算效率的提升都是科技發(fā)展和變革的底層驅(qū)動力。類比智能手機,相較于2000年代的個人PC,其計算能力和效率提高了至少1000倍。
后摩智能創(chuàng)始人兼CEO吳強表示,每1000倍的效率提升就會造就一個新的計算時代,創(chuàng)造一個全新的計算方式,就像從大型機到PC到手機,體積越來越小,算力越來越強,功能越來越豐富,一個新的計算形態(tài),也創(chuàng)造了全新的生活和交往方式。
伴隨著AI技術的躍進,未來萬物智能時代的計算系統(tǒng),和今天的芯片相比,在計算能力和效率上至少要再有1000倍以上的提升。
AI技術雖然蓬勃發(fā)展,但目前還是時不時出現(xiàn)一些人工智障的現(xiàn)象?!熬科湓颍覀冞€是認為AI計算的硬件不夠高效,我們希望讓芯片像人腦一樣高效工作,于是,我們打造了這款基于存算一體的大算力AI芯片,來作為我們的起點?!焙竽χ悄苈?lián)合創(chuàng)始人兼研發(fā)副總裁陳亮說到。
2年前,后摩智能成立之際,就選擇聚焦存算一體的底層架構創(chuàng)新。那么,何謂存算一體呢?
據(jù)陳亮介紹,從概念上講,存算一體就是在存儲單元內(nèi)部完成部分或者是全部的計算,它是解決芯片性能瓶頸,提高能效比的一個有效的技術手段。
在AI計算當中存在大量的計算單元和存儲單元之間的數(shù)據(jù)交互,當數(shù)據(jù)被從傳統(tǒng)的存儲器中讀取出來,送到計算單位中進行計算,再寫回存儲器的過程中,會使訪存功耗急劇地增加,還會造成計算單元使用效率的降低。存算一體架構將存儲和計算功能融合,比傳統(tǒng)架構更接近人腦的計算方式,具備遠高于傳統(tǒng)方式的計算效率。
存儲一體芯片的設計目標是提高系統(tǒng)的集成度、和性能效率。通過將計算和存儲性能集成在同一個芯片上,可以減少組件之間的通信延遲,并提高系統(tǒng)的整體性能。存儲計算一體芯片還可以降低系統(tǒng)的尺寸和性能,提高設備的可靠性和效率。
陳亮認為,存算一體技術是對開發(fā)者無侵入式的底層架構創(chuàng)新,從編程角度來看,用戶感知不到任何底層硬件的影響。
而后摩智能之所以選擇智駕場景,也有其深刻考慮。吳強表示,萬物智能的時代,不可能沒有無人駕駛。
從技術和產(chǎn)品需求匹配的角度來看,存算一體帶來的技術和產(chǎn)品的優(yōu)勢,和智能駕駛的關鍵需求是吻合的,“因為智能駕駛的終局是要替代人的駕駛,我們用傳感器代替人的眼睛,用各式各樣的算法代替人的意識和靈魂。底層的智能駕駛芯片又扮演著人類大腦的角色,所以從終局的角度來看,智能駕駛芯片一定要無限接近人大腦的行駛和效率?!眳菑娬f到。
在發(fā)布會上,中國電動汽車百人會副理事長兼秘書長張永偉也指出,存算一體作為一種創(chuàng)新技術,對工藝制程依賴度低,具有極高的競爭力,為智能駕駛芯片提供了更具前瞻性的技術路徑選擇。采用多種技術路徑實現(xiàn)芯片國產(chǎn)化布局,將有利于解決汽車芯片供應鏈中存在的同質(zhì)化競爭問題,助力提升產(chǎn)業(yè)鏈的韌性和供應鏈的安全性。
這款芯片究竟怎么樣?首先從性能上來看,根據(jù)后摩智能介紹,鴻途?H30 基于 SRAM 存儲介質(zhì),采用數(shù)字存算一體架構,擁有較低的訪存功耗和更高的計算密度。
該芯片基于12nm工藝制程,在Int8數(shù)據(jù)精度下實現(xiàn)256TOPS的物理算力,所需功耗不超過35W,整個SoC能效比為7.3Tops/W,具有高計算效率、低計算延時、低工藝依賴等特點。
目前,基于鴻途?H30 已成功運行常用的經(jīng)典CV網(wǎng)絡和多種自動駕駛網(wǎng)絡,包括BEV網(wǎng)絡模型以及廣泛應用于高階輔助駕駛領域的Pointpillar網(wǎng)絡模型。
后摩智能基于鴻途?H30自主研發(fā)了硬件增強機制和檢測機制,在提升芯片可靠性的同時,保障功能安全性。此外,后摩智能面向智能駕駛場景打造了專用IPU(處理器架構)——天樞架構,其采用多核、多硬件線程的方式擴展算力,AI 計算可以在核內(nèi)完成端到端處理,保證通用性。
據(jù)陳亮介紹,天樞架構是后摩智能自主研發(fā)的第一代 IPU(處理器架構),第二代天璇架構已經(jīng)在研發(fā)中,將采用Mesh互聯(lián)結(jié)構,可根據(jù)應用場景的不同配置計算單元的數(shù)量,第三代天璣架構也已經(jīng)開始規(guī)劃。
在商業(yè)化層面,以鴻途?H30 打造的智能駕駛解決方案已經(jīng)在新石器的無人小車上完成部署。
不止于芯片,本次發(fā)布會,后摩智能同步推出了基于鴻途?H30芯片打造的智能駕駛硬件平臺——力馭?。據(jù)悉,力馭?平臺CPU算力達200Kdmips,AI算力達256Tops,支持多傳感器輸入。力馭?平臺功耗為85W,可采用更加靈活的散熱方式,實現(xiàn)更低成本的便捷部署。
后摩智能聯(lián)合創(chuàng)始人兼產(chǎn)品副總裁信曉旭重點提到了工具鏈的打造,“我們的競爭力要構建兩個方面:一個是要基于存算一體架構打造更好的PPA,這是硬的東西;另外一個是軟的東西,我們要把軟件工具鏈當成產(chǎn)品的另外一個關鍵的競爭力來打造,這也是我們的初衷和共識?!毙艜孕裰毖?。
基于此,后摩智能基于鴻途?H30 芯片自主研發(fā)了一款軟件開發(fā)工具鏈——后摩大道?,支持 PyTorch、TensorFlow 、ONNX等主流開源框架,編程兼容CUDA前端語法,同時支持SIMD和SIMT兩種編程模型,兼顧運行效率和開發(fā)效率,以無侵入式的底層架構創(chuàng)新保障了通用性的同時,進一步實現(xiàn)鴻途?H30 的高效、易用。
信曉旭表示,鴻途?H30 將于6月份開始給 Alpha 客戶送測。同時,后摩智能的第二代產(chǎn)品鴻途?H50 已經(jīng)在全力研發(fā)中,將于2024年推出。
發(fā)布會上,后摩智能留下一個彩蛋,在適當?shù)臅r候,后摩智能將會將其AI處理器硬件設計開源,用戶可以在其網(wǎng)站上下載IPU設計資料,在此基礎上可以做PPA的評估、軟件算法的開發(fā),或者將來用到自己的產(chǎn)品當中。
“我們希望有更多的人和組織能夠參與進來,相信以大家的智慧可以更好的讓(存算一體)這個方向落地,大家可以共建生態(tài),最終讓整個產(chǎn)業(yè)鏈受益?!标惲琳f到。