摩爾線程舉辦MUSA開發者大會:"花港"新架構與萬卡集群讓AI得心應手
白貓 / 2025-12-20 21:5837303想要打造性能出色的GPU并不是一件容易的時期,首先企業要在眾多專利壁壘中打造一條屬于自己的圖形思路,此外你還要構建屬于自己的生態系統并且為行業所接受,因此一直以來玩得轉GPU的廠商寥寥無幾,更不用說基于自研GPU打造成熟的生態系統。不過這幾年國內還是涌現了一批自研GPU企業,例如摩爾線程。
摩爾線程在今天舉辦首屆MUSA開發者大會,公布了國產GPU生態發展的關鍵進展與未來藍圖。此外摩爾線程還展示了全新的GPU架構“花港”以及未來芯片路線“華山”、“廬山”芯片與夸娥萬卡智算集群,面向下一代超大規模智算中心的MTT C256超節點架構規劃以及面向開發者的MTT AIBOOK等產品。


作為GPU的核心,架構的好壞將會決定GPU是否能夠高效地運行各種各樣的任務,摩爾線程在今天推出了全功能GPU架構“花港”,該架構讓GPU在計算密度、能效、精度支持、互聯能力及圖形技術等方面實現全面突破。根據摩爾線程官方的介紹,“花港”采用了新一代的指令集,算力密度提升50%,并且也能大幅優化能效,同時考慮到AI計算需要不同的精度,因此“花港”GPU將會實現從FP4到FP64的全精度計算,同時包括MTFP6/MTFP4等混合低精度計算也將被“花港”GPU所支持,從而讓AI開發者開發更加順利。并且“花港”還支持MTLink高速互聯技術,從而讓十萬卡以上規模智算集群擴展成為可能。


摩爾線程今天還公布了兩款基于“花港”架構打造的兩款芯片路線,包括“華山”以及“廬山”,其中“華山”主打AI訓推一體與超大規模智能計算,其浮點算力,訪問帶寬、訪存容量以及高速互聯帶寬均達到了行業領先的水準,至于“廬山”專注于圖形渲染,相比較初代架構,其幾何處理性能能夠提升16倍,光線追蹤性能提升50倍,AI性能提升64倍,最終讓3A游戲性能提升15倍,并且廬山GPU還可以讓紋理填充率更高,集成AI生成式渲染、UniTE統一渲染架構及全新硬件光追引擎,未來可以為3A大作以及高端圖形創作提供堅實的算力支持。



針對AI訓練所需要的超大模型,摩爾線程也推出了夸娥萬卡集群,其浮點算力最高可以達到10Exa-Flops,并且借助高效的架構,讓訓練算力利用率、訓練有效時間等關鍵指標不斷提升,同時也可以兼容國際主流生態,從而更好地應用于國內外的大模型訓練與推理。


摩爾線程還與硅基流動合作,通過系統級的優化,實現了MTT S5000單卡4000 Tokens/s的壯舉,此外Decode吞吐突破1000 tokens/s,這個成績遠超同行的計算卡,可以說創下了國產推理的新標桿。

對于游戲玩家來說,摩爾線程旗下的游戲顯卡能夠支持更多的游戲才最為實際,對此摩爾線程也對游戲顯卡進行了展望,稱如今的摩爾線程顯卡已經支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流圖形與計算API,預計在2026年將支持DirectX 12 Ultimate,同時基于“花港”架構的硬件光線追蹤加速引擎可以支持DXR API,從而讓游戲更加真實,此外摩爾線程也推出了全自研MTAGR 1.0,為下一代數字創作構建國產技術基座。


摩爾線程也在現場公布了“長江”智能SoC芯片,這顆芯片采用了8個全大核,主頻最高擁有2.65GHz,同時還搭載高性能3D渲染,支持LLM端側推理,此外還支持VPU、DPU以及DSP等多種解碼單元,會后我們也看到了基于“長江”智能SoC打造的MTT E300 AI模組,擁有最高50TOPS的異構AI算力,可以有效地應用于工業、能源、教育等行業。



并且摩爾線程還積極布局下一代技術,包括MT Lambda具身智能仿真訓練平臺,融合物理、渲染與AI三大引擎,能夠為具身智能帶來全棧賦能,此外MUSA架構也在量子科技、AI for 6G等前沿交叉領域展開探索工作,不斷拓展技術邊界。此外摩爾線程還推出了MTT AICube以及MTT AIBOOK,能夠為開發者提供快速且高效的開發環境,賦能開發者在AI時代成為“超級個體”。

首屆MUSA開發者大會上,摩爾線程全面展示了目前已有的技術,還展示了摩爾線程對于未來AI和圖形技術的提前布局,推出了全新的架構以及GPU,還包括眾多的終端產品,可以說目前爆發的AI行業給了摩爾線程更多的展示機會,此外行業朝著自主化前進也讓摩爾線程的GPU生態建設有了更多的伙伴支持,為今后打造成熟且自主的生態系統奠定了基礎。
摩爾線程舉辦MUSA開發者大會:"花港"新架構與萬卡集群讓AI得心應手














滬公網安備 31010702005758號
發表評論注冊|登錄