久久一区二区精品,亚洲综合久久久久久中文字幕,国产综合精品一区二区,日韩欧美久久一区二区,综合欧美国产视频二区,亚洲国产欧美日韩精品一区二区三区,亚洲一区二区综合

ModelHub XC適配OpenAI最新開源模型Circuit Sparsity
商界 2025-12-31 17:13:26

信創(chuàng)模盒ModelHub XC近日完成OpenAI最新開源模型Circuit Sparsity的適配與驗證,并在昇騰910B4 NPU等國產(chǎn)算力平臺上實現(xiàn)穩(wěn)定、高效運行。

Circuit Sparsity模型

OpenAI的Circuit Sparsity稀疏模型架構(參數(shù)量0.4B、99.9% 權重為零)一經(jīng)開源即引來巨大關注,其以原生稀疏架構構建可讀“電路”,破解了大模型“黑箱”難題,成為AI可解釋性領域的顛覆性突破和未來大模型演進的重要技術方向。

該模型采用動態(tài)剪枝等技術,電路規(guī)模較密集模型縮減16倍,顛覆傳統(tǒng)參數(shù)競賽,引領行業(yè)向“透明化 + 高效化”轉(zhuǎn)型。OpenAI通過 “橋梁網(wǎng)絡” 連接稀疏與密集模型,實現(xiàn)了對現(xiàn)有大模型的可解釋性行為編輯。

Circuit Sparsity不僅是現(xiàn)有模型的優(yōu)化,更提供了全新架構方法論,驗證了結構性稀疏兼具高性能與高可解釋性的可行性,預示下一代模型將走向“電路化”“稀疏化”設計。

ModelHub XC完成Circuit Sparsity 開源型的適配

架構適配:

該新型極度稀疏架構算法底層基于 Transformers 架構——以Transformers為藍本,通過引入動態(tài)稀疏約束和組件微調(diào),從根本上重構出一個天生具有結構化稀疏性的新模型架構。同時,這一新架構的編譯、計算和數(shù)據(jù)流模式,又經(jīng)過優(yōu)化,以充分釋放如昇騰910B這類專用NPU的極致算力。

適配結果:

測試數(shù)據(jù)顯示,ModelHub XC平臺在昇騰910B4 NPU上對OpenAI開源Circuit Sparsity模型完成了適配與性能驗證。

1. 性能提升倍數(shù)(關鍵指標)

請求延遲:NPU 處理單條請求平均延遲僅需 2.00 秒,CPU 則高達 56.21 秒。NPU 的單條處理速度提升了 28.11 倍。

吞吐量 (QPS):NPU 的吞吐量為 0.50 條/秒,是 CPU(0.02 條/秒)的 25 倍。

2. 結果分析

巨大性能鴻溝:從“分鐘級”響應(CPU)到“秒級”響應(NPU)的跨越,證明了 Circuit Sparsity 這類稀疏模型極度依賴專用AI計算硬件(如NPU)的并行計算與高效內(nèi)存訪問能力,在通用CPU上運行效率極低。

關于信創(chuàng)模盒ModelHub XC

信創(chuàng)模盒ModelHub XC是面向信創(chuàng)算力生態(tài)的AI模型與工具平臺,兼具社區(qū)和服務的功能,致力于推動國產(chǎn)硬件平臺上的人工智能創(chuàng)新與落地,提供涵蓋模型訓練、推理到部署的全流程解決方案。

0
歡迎關注商界網(wǎng)公眾號(微信號:shangjiexinmeiti)
標簽開源模型  AI  

評論

登錄后參與評論
廣告
廣告
熱門資訊
廣告
商界APP
  • 最新最熱
    行業(yè)資訊

  • 訂閱欄目
    效率閱讀

  • 音頻新聞
    通勤最愛

廣告