引言:AI技術革命的"雙子星"與系統化突破
2025年伊始,中國AI領域迎來標志性突破——DeepSeek-R1開源大模型以1/30于OpenAI o1的API成本實現同等推理性能的壯舉震動全球,其"小力出奇跡"的技術哲學顛覆了傳統AI研發范式。緊隨其后,Manus智能體憑借多智能體協同與任務閉環執行能力,在非公開測試階段即引發"中國版AutoGPT"的熱議。這場由認知模型(DeepSeek)與智能體執行終端(Manus)共同掀起的風暴,正推動生成式AI從單點能力突破向系統化架構躍遷。
行業數據顯示,搭載DeepSeek-R1的智能系統已在金融、醫療領域實現8倍效率提升,而Manus展示的簡歷篩選、股票分析等復雜任務處理能力,更驗證了"思考-決策-執行” 全鏈路智能化的五層式生成式人工智能應用系統架構日趨主流。這種"算法創新+工程突破"的雙輪驅動,標志著中國在生成式人工智能系統架構領域實現從追隨到并跑的質變。
本文接下來的內容組織如下:
一、概念解析: 科普大語言模型(LLM)與智能體(AI Agent)的核心定義與技術邊界;
二、架構拆解: 圍繞五層式生成式人工智能運用系統架構展開,包括:模型基座層,提示模板層,鏈式處理層,智能體層,多智能體協作層;
三、技術賦能路徑: 解析七大技術要素(運用定義系統、AI Fabric異構算力調度、大模型基座、先進液冷、可持續擴展架構、安全防護、智能體電算協同);
四、生態實踐:攜手合作伙伴開展的3個方向上的創新工作介紹。
一、大模型LLM是認知引擎(大腦), AI Agent是具身智能體”
人工智能技術正經歷從判別式AI 1.0(以分類、檢測為核心)向生成式AI 2.0(以創造、推理為特征)的范式躍遷。以DeepSeek-R1,OpenAIo1/o3等為代表的推理大模型,突破了早期模型的三大核心瓶頸:邏輯不可靠(如數學符號混淆)、幻覺頻發(如虛構法律條文)和多模態協同不足(如跨文本-圖像推理斷裂)。
在回答問題之前先生成一個詳細的內部思維鏈,模擬人類大腦的深思熟慮,逐步分解復雜的問題,在提高答案的準確性和深度上,取得了驚人的進展,其表現出來的智慧程度,再次觸發業界對“大模型技術能力邊界“的熱議。
以Manus等為代表的AI Agent,是一種半自主系統(終極階段是全自主),能夠與環境交互并代表用戶執行任務,具有自主性,可以在無需持續人工干預的情況下工作。
AI Agent通過分析數據來進行決策,并根據反饋不斷學習和改進,以適應不斷變化的環境和用戶需求。這些智能系統廣泛應用于各個領域,如智能客服、自動駕駛汽車和智能家居助手等,為用戶提供高效便捷的服務,幫助人們更好地應對復雜多變的任務和挑戰,提高工作和生活的效率。
二、五層式生成式人工智能運用系統架構的技術躍遷:構建虛實融合的智能體協同
五層式生成式人工智能應用系統架構以大語言模型操作系統為核心基座,通過分層設計貫通底層算力資源支撐、模型訓練與推理優化、智能體任務編排,實現多智能體協作,形成從硬件資源到群體智能的全棧技術閉環。
其分層架構及功能如下:
1、模型基座層(Models):作為系統基礎能力底座,通過多模態大模型API調用(如文本/圖像/代碼生成)與多機態支持(云端/邊緣端部署)構建操作系統級服務能力,在成本控制與算力調度層面實現動態優化,支撐上層應用開發。
2、提示模板層(Prompt):通過結構化模板設計實現動態適配與場景復用,其核心機制包括變量占位符注入、角色指令分層(系統指令定義任務規則,用戶輸入填充動態參數),以及多模態格式控制,顯著提升生成內容與業務需求的匹配度,提升意圖識別準確率。
該層通過工程化模板復用降低開發復雜度,可借由預定義任務指令與上下文規則,結合多輪對話消息鏈實現復雜邏輯編排,也可使用LangChain的PromptTemplate類實現跨領域任務快速遷移,提升模型輸出準確率。
3、鏈式處理層(Chains):基于思維鏈(CoT)技術構建任務流水線引擎,將復雜需求拆解為有序子任務序列,包含順序鏈(Sequential Chain)確保線性執行、路由鏈(Router Chain)實現條件分支,以及轉換鏈(Transform Chain)插入自定義處理邏輯,其核心價值在于標準化流程復用與靈活組合能力。
4、智能體層(Agent):能夠通過傳感器感知環境,并通過執行器自主采取行動以實現特定目標的實體,其核心特性包括自主性(無需外部干預)、反應性(快速響應環境變化)、主動性(基于目標主動規劃)及社會性(與其他智能體協作)。
通過集成大語言模型(LLM)作為認知中樞,結合工具調用(如API接口、機械臂控制)和長期記憶模塊,實現從文本交互到物理世界改造的技術躍遷。
5、多智能體協作層(Multi-Agent):通過分布式自治架構實現復雜任務的高效協同,其核心機制包括動態任務分解、角色分工(如生成者、評審者、協調者等)以及智能體間的實時通信與協商,通過共享記憶網絡和共識模型實現全局狀態同步。
例如OpenManus框架通過PlanningTool將用戶需求拆解為線性子任務序列,并動態分配至專業化智能體(如代碼生成Agent、部署驗證Agent),結合工具鏈實現端到端閉環;多智能體協作可通過信息共享與交叉驗證,突破單一模型的認知邊界,解決復雜長鏈任務。
三、協同生態驅動的全棧生成式AI架構創新:安擎基于七大技術要素構建五層式系統,賦能虛擬認知至物理改造的智能范式演進
安擎協同生態合作伙伴圍繞生成式人工智能應用系統架構的七大技術要素:運用定義系統架構、GenAI光電路交換(OCS)互聯架構、強韌大模型基座層、智能調試與根因定位技術、先進液冷方案、可持續碳優化計算體系、系統安全及智能體電算協同管理,構建覆蓋虛擬認知至物理改造的全棧技術體系,通過多層級技術融合實現五層式架構(模型基座層→提示模板層→鏈式處理層→智能體層→多智能體協作層)的深度優化。
2025年重點開展的創新項目及工作介紹如下:
基于分布式OCS開放互連技術,首創“Switchless” Scale Up和Scale Out 雙向融合系統架構:
該系統架構專為生成式人工智能(GenAI)應用設計,提供開放互聯及靈活配置的優化運行環境,實現跨物理服務器的高速卡間與機間互聯,充分滿足多樣化GenAI對大規模多維并行處理和實時數據交換的高要求。
分布式OCS技術憑借異構資源池化與智能管理策略,顯著提升資源利用效率,確保業務應用性能卓越與資源優化,為構建先進的綠色智能計算開放生態奠定堅實基礎。同時,該技術內置的可靠容錯與冗余機制,有效保障系統的高可用性和業務連續性,大幅降低系統故障風險。
通過首創的“Switchless”雙向融合系統架構,我們在AI服務器及系統架構領域開辟了一條全新路徑,有力推動了多樣化GenAI業務的創新應用與產品競爭力的提升。
基于超流體技術的先進冷板油冷方案,100%解決水冷板漏液業界痛點:
高性能GPU和CPU因功耗巨大且散熱需求高,給Gen AI服務器系統的冷卻帶來了極大挑戰。目前,間接接觸液體冷卻系統(如冷板輔助方案)普遍采用水或丙二醇與水的混合物作為冷卻介質。然而,在電子設備中,水冷系統存在泄漏隱患,一旦管理不當,可能會對敏感元件造成重大損害。即便是微小的泄漏,也可能引發短路和腐蝕,進而導致系統停機或產生高昂的維修成本。盡管通過加強防漏連接、及時檢測泄漏和實施定期維護等常規工程措施可以降低這些風險,但泄漏問題依然難以完全根除。這已成為數據中心在大規模部署高端人工智能服務器時,水冷解決方案所面臨的關鍵行業痛點之一。
本項目發布了一種創新的冷板液冷解決方案,該方案融合了基于綠色介電冷卻液的創新超流體技術,以及優化設計的冷板與中心分配單元(CDU)。
這一創新設計成功解決了水冷系統長期存在的泄漏隱患這一行業難題,能夠在高密度AI服務器系統中對單芯片TDP(熱設計功耗)超過1500W的高性能處理器實現高效且可靠的冷卻。
Ultra Pooling GenAI Rack Scale系統架構方案 “綠色超池智算基座”:
該實現方案以最小化的池化POD單元為基礎構建模塊,包括專為推理設計的"通用AI加速卡"POD、企業級推理GPU POD,以及為大規模數據訓練定制的GPU POD。
系統根據工作負載需求,動態組合POD 節點,以實現資源的高效配置。Ultra Host Processor Node(UHP)作為系統的智能管理中心,集中監控和管理機架內的服務器、存儲和網絡設備,負責供電、散熱、 遠程控制、故障診斷、報警和系統安全管理。UHP也是 GenAI 應用的優化核心,提供模型感知、基于DeepSeek時代的Scaling Law策略的工作負載調度、機架級碳優化計算,以及支持 Climatik 和 Gen AI Operator等運作。Ultra Pooling Switch (UPS)利用開放互聯OCS 技術,執行AI Fabric功能組裝,實現異構 GPU 資源的有效池化。與 Ultra Host Processor Node (UHP)相結合,UPS 能夠根據不同應用場景的需求,靈活重構系統資源池。UPS支持運行包括 UALINK、Ethernet、OISA 在內的Scale up 互聯,確保 GPU POD之間的高效互聯。
綠色超池智算基座具備高度的適應性,能夠覆蓋從數據中心到邊緣計算的多種部署場景。它不僅能夠擴展成多機架的 Super POD,滿足超大規模數據中心的需求;也能在單機 架內集成 CDU、UPS、儲能單元和電力算力協同單元,適用于企業 邊緣和邊緣數據中心等邊緣計算環境。這種靈活性使得系統能夠根據不同環境的需求進行定制和擴展。
后續,安擎資深技術專家將陸續推出一系列技術專欄內容,深入剖析前沿技術與行業應用。若您對前沿技術洞察、實用技術干貨感興趣,歡迎持續關注我們,一同解鎖更多專業知識。