鯤鵬×研揚科技:加速普惠AI應用,激發千行萬業數字化潛能
人工智能技術的爆發式增長,推動了AI大模型向千行萬業滲透。在2025年政府工作報告中更是提出,持續推進“人工智能+”行動,將數字技術與制造優勢、市場優勢更好結合起來,支持大模型廣泛應用。在宏觀政策導向與行業發展趨勢下,市場對于能夠支撐大模型高效運行的技術解決方案需求極為迫切。
然而,高昂的訓練與推理成本一直是大模型應用普及的瓶頸。一方面,大模型訓練與推理的算力消耗巨大,傳統云端部署雖功能強大,卻面臨數據隱私泄漏風險、網絡延遲及成本高昂等問題;另一方面,高敏感行業需要解決數據越權訪問、敏感信息泄露及xPU計算環境安全漏洞等挑戰。
站在人工智能發展的關鍵轉折點,DeepSeek的出現具有重要意義,它有力地證明了在邊緣端應用場景中,完全能夠以更低的成本投入,依托更優化的模型架構實現高效運作。在DeepSeek問世之前,業界普遍將研發重點集中于數據中心基礎設施的規模化擴展,主要通過持續提升計算資源的部署規模以及增加模型參數量(如從百萬級到千億級)來驅動模型精度的優化和訓練迭代周期的壓縮。這種技術路徑本質上遵循了"規模擴展法則(Scaling Law)",即通過算力與數據規模的線性增長換取模型性能的指數級提升。
但隨著行業逐步向邊緣化、場景化方向演進,客戶需求結構發生了顯著變化。他們不再滿足于傳統的計算服務模式,而是希望以更高效、更低總體擁有成本的方式實現業務場景的快速部署。這就要求企業能夠提供更加靈活、便捷、高效的解決方案,以滿足客戶在不同場景下的多樣化需求。
以鯤鵬模組為智能底座,打造大模型推理一體工作站
面對市場對于高效能計算平臺日益增長的需求,鯤鵬與全球工業嵌入式計算領域的領軍者研揚科技的合作順勢展開,雙方基于各自技術優勢與資源儲備,針對上述行業難題開啟了一系列創新性實踐探索。
鯤鵬模組作為AI開放生態的智能算力基座,其特點鮮明:硬件方面,提供主板、模組、部件等創新產品,支持多種國產GPU和昇騰NPU的靈活適配。軟件方面,openEuler操作系統以其獨特的sysHAX加速能力,顯著提升系統性能,優化資源利用效率;實現億級數據毫秒級檢索,為大數據分析和人工智能應用提供高效支撐;openGauss的DataVec向量數據庫實現億級數據毫秒級檢索,為大數據分析和人工智能應用提供高效支撐;鯤鵬BoostKit PCIPC安全能力則全方位保障AI大模型和RAG端到端的安全性,確保數據傳輸和存儲的可靠性,讓合作伙伴在開發和部署過程中無后顧之憂。
華為堅持硬件開放、軟件開源的戰略,鯤鵬模組能夠輕松融入廣泛的生態系統,支持合作伙伴快速推出自有品牌的產品,共同推動產業繁榮發展。基于鯤鵬模組,研揚科技打造了AIWS系列大模型推理一體工作站。該工作站深度融合鯤鵬生態優勢,助力企業靈活構建智能化應用場景。
AIWS大模型推理一體工作站為各行業提供了高效、經濟的私有化模型部署方案,顯著提升了模型推理的性價比與部署靈活性,加速了AI普惠化的普及,助力了企業實現智能化轉型。采用單路Smart版鯤鵬模組,具備32核性能,搭配128G內存,強大的多線程能力和內存容量為客戶的應用和加速推理性能提供有力的保障。
結合昇騰或其他國產算力卡,再配以openEuler操作系統,打造出全棧自主的工作站形態。該工作站具有以下三個特點:
大模型離線部署
避免私有數據接入云端,助力全國4000萬家中小微企業,以及政府、大型央國企部門、科室進行本地數據私有化部署。
靜音化與小體積設計
區別于大型服務器,工作站進行了大量靜音化設計,極致靜音體驗可選擇液冷款,體積小巧。
寬溫范圍
適應復雜環境,溫度適應范圍為0~55度,可放置在辦公室、雜物間、小型機柜等場所。
在DeepSeek出現后,研揚與鯤鵬產品線緊密合作,僅用7天便完成了DeepSeek蒸餾版模型(70B、32B、14B)在工作站的適配和性能優化。在通義千問QwQ - 32B發布后,研揚科技更是第一時間將QwQ-32B進行了實測部署,僅用3 - 4天便全部部署到工作站上。基于QwQ-32B的測試結果顯示,AIWS工作站并發數達50路,系統吞吐量469 token/s,單路速度26token/s,推理效率顯著提升。基于鯤鵬+昇騰的推理工作站搭配QwQ-32B大模型底座這套黃金組合,使得用戶以經濟高效的方式實現本地化AI部署。
以工廠安全生產場景為例,研揚推出的基于鯤鵬模組的推理工作站,部署DeepSeek R1 32B模型,將工廠安全生產操作手冊等資料做為本地知識庫掛載進大模型,打造專屬的AI安全助手,將產線工人安全培訓的效率極大提高。以往,生產員培訓需要研讀大篇幅的手冊文檔,且無法結合實際操作場景發現問題,借助AI專屬安全助手,生產員可以通過智能問答,全局搜索,場景化考題,自動糾錯等功能,快速熟悉安全生產的有關規定和操作指南。這一應用不僅將新員工入職安全培訓的效率大幅提升50%,也更好的滿足了企業生產安全的核心訴求,符合政策監管要求。工作站采用鯤鵬模組與openEuler操作系統,可將整體系統吞吐量提升30%,滿足更多人同時使用,提供更快的響應速度,充分展現了鯤鵬模組與大模型結合在實際場景中的優勢。
為進一步提升大模型在真實場景中的應用體驗,實現開箱即用的便捷性,研揚科技推出 AIOS系統。該系統集成了編碼助手、智能搜索、知識庫、寫作等模塊化、矩陣化的AI應用。搭配AIOS系統,可實現一鍵開啟高效推理全流程服務。在客戶專業場景中,AI工作站應作為專屬助手。例如,在安全生產領域,可搭載安全手冊等數據到數據庫,用RAG方式讓大模型輸出員工培訓、考試等內容;在政務領域,科室可借助其進行政策解讀、時間軸輸出、報告生成等;還可應用于AI程序員、醫療、司法助手等面向用戶具體場景的嘗試。
此外,AIOS系統包括軟硬件安裝、調試和部署在內的全方位專業服務,并支持私有化部署,用戶僅需簡單操作,即可實現與DeepSeek的無縫對接,一鍵啟動DeepSeek高效推理全流程服務。
攜手鯤鵬,驅動AI普惠新生態
通過鯤鵬與研揚科技的緊密合作,AIWS大模型推理一體工作站及AIOS系統,正為各行業的智能化轉型注入新動能,推動產業向高效率、高智能、高安全方向演進。
研揚科技與鯤鵬保持著緊密且深度的合作關系。2024年,研揚便加入了首批KPN伙伴計劃。依托鯤鵬在硬件產品、計算技術和生態建設方面的深厚積累,為研揚提供高性能的鯤鵬模組;研揚則發揮自身擅長定制化服務的專長,將邊緣AI快速落地到千行百業。在鯤鵬產品線的大力支持下,研揚科技研發周期縮短30%,人員投入減少20%,高效合作成果顯著。
隨著雙方合作的不斷深入,研揚科技將持續優化和拓展AIWS大模型推理一體工作站的功能和應用場景。在技術創新方面,基于鯤鵬系列模組,豐富AIWS系列產品線;借助openEuler操作系統提升系統吞吐量;持續升級大模型底座,提升AI專屬助手性能,更好地服務客戶。在應用拓展上,探索更多行業的應用可能性,推動人工智能技術在更多領域的深度融合,使客戶能以更低成本在本地運行大模型推理任務,高效快速地進行智能化升級,為AI下沉千行百業貢獻更多智慧與力量。

提交
拓展碳循環新思路 電裝探索CO?回收新方案
培育電動化未來人才,電裝助推學生方程式賽事創新發展
測量精度小于1納米,性能進入全球一梯隊,優可測旗艦白光干涉儀發布
磐鑫自動化(PPX)邀您共赴2025上海機器視覺展
HIMA智能安全測試助力巴斯夫湛江一體化基地實現降本增效