好吊视频一区二区三区-国产精品V欧美精品V日韩精品-老司机亚洲精品影院-国产精品视频免费播放

物聯傳媒 旗下網站
登錄 注冊
RFID世界網 >  新聞中心  >  今日話題  >  正文

“存算一體”:大模型時代端邊算力瓶頸的破局者?

作者:來源網絡(侵權刪)
來源:RFID世界網
日期:2025-08-18 11:23:51
摘要:近年來,隨著信息時代的數據大爆炸以及人工智能浪潮的到來,尤其是大模型技術的廣泛應用,其訓練和推理所需處理的數據量呈指數級增長。而基于“存儲-計算分離”原理的馮·諾依曼架構雖獨具優勢,但在AI浪潮中已顯疲態,存在著不容忽視的局限。
關鍵詞:端邊算力

近年來,隨著信息時代的數據大爆炸以及人工智能浪潮的到來,尤其是大模型技術的廣泛應用,其訓練和推理所需處理的數據量呈指數級增長。而基于“存儲-計算分離”原理的馮·諾依曼架構雖獨具優勢,但在AI浪潮中已顯疲態,存在著不容忽視的局限。


在傳統馮?諾依曼架構中,數據需要在存儲單元與計算單元間頻繁搬運,導致大量的資源被浪費在數據搬運這一環節上。根據英特爾的研究表明,當半導體工藝達到7nm時,數據搬運功耗高達35pJ/bit,占總功耗的63.7%。數據傳輸造成的功耗損失越來越嚴重,限制了芯片發展的速度和效率,形成了“功耗墻”問題。


此外,在馮·諾依曼架構中,存儲器與處理器是兩個完全分離的單元,處理器根據指令從存儲器中讀取數據、完成運算,并存回存儲器。但隨著人工智能、大數據等新興技術的迅猛發展,計算任務對數據處理的速度和規模提出了前所未有的高要求。而當下的存儲器的數據訪問速度跟不上計算單元的數據處理速度,二者之間形成了巨大的性能差距,“內存墻”問題日益凸顯。


面對大模型推理對算力需求的持續拉動,如何攻克“功耗墻”“內存墻”等難題已然成為了工業界和學術界的焦點問題,一場旨在突破現有算力瓶頸的革命正蓄勢待發。


在此背景下,“存算一體”正試圖用一場顛覆式創新打破這一僵局。近年來,在半導體工藝持續突破與AI算力需求爆發的雙重推動下,存算一體技術迎來了新的發展機遇。


從原理上來看,存算一體的核心是將存儲功能與計算功能融合在同一個芯片上,直接利用存儲單元進行數據處理——通過修改“讀”電路的存內計算架構,可以在“讀”電路中獲取運算結果,并將結果直接“寫”回存儲器的目的地址,不再需要在計算單元和存儲單元之間進行頻繁的數據轉移,消除了數據搬移帶來的消耗,極大降低了功耗,大幅提升計算效率。


正是基于這樣的特性,存算一體有力地突破馮·諾依曼架構所面臨的瓶頸限制。


存算一體屬于非馮諾伊曼架構,在特定領域可以提供更大算力(1000TOPS以上)和更高能效(超過10-100TOPS/W),明顯超越現有ASIC算力芯片。除了用于AI計算外,存算技術也可用于感存算一體芯片和類腦芯片,代表了未來主流的大數據計算芯片架構。


近年來,大模型的蓬勃發展與廣泛應用,其對強大算力和高存儲帶寬提出了迫切需求。而存算一體技術憑借其解決數據搬運難題、顯著提升計算效率的優勢,與大模型的發展需求完美契合。與此同時,大模型計算的應用場景正從云端逐步向端邊側拓展延伸,這一趨勢為存算一體技術帶來了更為廣闊的發展空間。


根據量子位智庫數據,預計2025年存算一體市場規模將達125億元,隨著技術成熟度提高以及大規模商用落地,至2030年這一市場規模將達1136億元。


面對極具潛力且規模不斷擴張的市場前景,存算一體芯片成為了科技領域備受矚目的焦點。越來越多的企業正競相投身存算一體芯片領域,并不斷加快布局進程。國內諸如恒爍股份、億鑄科技等企業,均依托自身優勢在不同技術路線上積極開展探索,力求在存算一體芯片市場中占據一席之地。


而在這股熱潮下,后摩智能作為國內存算一體AI芯片的先行者和落地者,具有顯著的代表性,其探索歷程與實踐成果生動展現出了我國存算一體芯片技術的多元化發展圖景。


在大模型技術迅猛發展、應用場景持續拓展的大背景下,市場對于適配大模型的高性能芯片需求日益迫切。基于這一趨勢洞察,后摩智能憑借在存算一體技術領域的前瞻性布局與深厚技術積累,于2023 年年底果斷調整研發方向,將重點轉向基于大模型的應用需求,全力投入存算一體AI 芯片的研發工作。


經過不懈努力與技術攻關,后摩智能迎來了重要時刻。在WAIC 2025期間,后摩智能的后摩漫界?M50芯片正式對外亮相,并同步推出力擎?系列M.2卡、力謀?系列加速卡及計算盒子等硬件組合,形成覆蓋移動終端與邊緣場景的完整產品矩陣。


據了解,后摩漫界M50定位到了端邊大模型應用場景。M50芯片采用存算一體計算架構,實現了160TOPS@INT8、100TFLOPS@bFP16的物理算力,搭配最大48GB內存與153.6GB/s的超高帶寬,而典型功耗僅10W,相當于手機快充的功率。這一性能指標意味著,PC、智能語音設備、機器人等智能移動終端無需依賴云端,即可高效運行1.5B到70B參數的本地大模型,真正實現了“高算力、低功耗、即插即用”的愿景。


后摩智能的M50芯片及其產品矩陣的發布,標志著端邊智能新時代的正式開啟。通過存算一體技術的深度融合,后摩智能成功解決了端邊設備在算力、功耗與帶寬方面的痛點,為消費終端、智能辦公與智能工業等領域提供了高效、安全、低成本的AI解決方案。


值得一提的是,827日,在深圳國際會展中心(寶安)舉辦的“IOTE 2025深圳?邊緣計算產業生態大會”上,后摩智能產品市場負責人張偉超將發表“大模型時代的算力革命-‘存算一體’重塑端邊智能體驗”主題演講,為我們帶來更多后摩智能關于存算一體技術在端邊算力提升路徑、應用場景拓展以及與邊緣計算生態深度融合等方面的結合與思考。

圖片