清華團隊突破 AI 算力限制 RTX 4090 竟能運行 671B 大模型

2025-02-15 6558

清華團隊突破 AI 算力限制 RTX 4090 竟能運行 671B 大模型

清華大學團隊再創 AI 突破！據國內媒體報導，清華大學 KVCache.AI 團隊與趨境科技聯手，為開源專案 KTransformers 帶來重大更新，成功將大模型推理門檻大幅降低，甚至能在 RTX 4090（24GB 顯存）上運行 DeepSeek-R1、V3 的 671B 滿血版。

清華團隊突破 AI 算力限制 RTX 4090 竟能運行 671B 大模型

KTransformers 計畫的核心技術在於異質運算策略，透過以下關鍵技術降低顯存負擔：

稀疏矩陣優化（MoE 架構）：僅啟動部分專家模組，並將非共享的稀疏矩陣卸載至 CPU 內存，大幅壓縮VRAM佔用至 24GB。
4bit 量化與算子優化：使用 Marlin GPU 算子，讓運算效率提升 3.87 倍，並透過 llamafile 多執行緒並行，將預處理速度提升至 286 tokens/s。
CUDA Graph 加速：減少 CPU/GPU 通訊延遲，單次解碼僅需一次完整 CUDA Graph 調用，生成速度高達 14 tokens/s。

清華團隊突破 AI 算力限制 RTX 4090 竟能運行 671B 大模型

這項突破帶來的影響驚人！傳統 AI 訓練方案需要 8 張 A100 伺服器，成本超過百萬，雲端租用費用每小時高達數千元。但 RTX 4090 單卡方案讓這一切變得更親民：

整機成本：僅約 2 萬元
功耗：僅 80W，大幅降低能耗
適用對象：中小型 AI 團隊、個人開發者

這次突破不只是技術的勝利，更是開源精神與硬體潛能的極致發揮，讓 AI 研究更具可及性，顛覆了傳統算力瓶頸！

Tags： AI 技術顯示卡算力開源專案

分享給朋友：

追蹤我們專頁

youtube

事前登錄

《Abyssdia》事前登錄開跑免費領取 SR「エレナ」與抽卡券 8 月 20 日上線

《終極三國》聯動決定超解壓三國休閒競技手遊《小兵來支援！》事前預約開啟

Bandai Namco新作塔防遊戲《Jump＋Jumble Rush》事前登記啟動間諜家家酒參戰

道長抓鬼新作MMO《邪門鬼道》即將開啟事前預約搶先感受世界觀背景

集英社網易共同開發手遊《unVEIL the world》開放事前登記　參加抽選有機會獲得iPhone 16與PS5

最新人氣下載

Loading...

遊戲APK下載搜尋

人氣新聞

Logitech MX Master 4 曝光：觸覺回饋與防污升級

Windows 11 更新爆嚴重故障風險 KB5063878 傳輸逾 50GB 或令 SSD 當機

《黑神話》系列再擴展新商標曝光共七款作品

《潛龍諜影 Delta：食蛇者》重製版獲 M18 評級保留原作色情元素

全新生存遊戲《CrisisX》公開巨型生存地圖面積等同一個香港支援 5,000 玩家

《Brown Dust 2》官方推出「立體抱枕套」引起熱烈討論售價驚人

最新情報

《Silent Hill f》完整地圖曝光　村莊與森林環境細節公開

成績不輸《星嗚特攻》玩家人數暴跌至個位數《FBC: Firebreak》乃將九月推出新內容

騰訊公布 VisVise AI 工具：遊戲美術與動畫製作壓縮至分鐘

《刺客教條：幻象》免費故事章節今年登場新地點奧拉揭曉

《黑神話：悟空》仍會延續但 Game Science 先推新作《黑神話：鍾馗》

《The Division 2》迎來「Survivors」模式聚焦撤離與生存玩法 2026 年推出

《生化危機安魂曲》官方為怪物新增「遠程武器」突襲玩家

《Battlefield 6》Steam 銷售榜強勢領跑《Black Ops 7》未入前 25

Bungie CEO 宣佈辭職《Marathon》開發陷困境

傳《生化危機：聖女密碼》重製版開發中　或列入正統系列

關於 GameApps

GameApps 手機版
聯絡我們刊登廣告

手機版 | 聯絡我們
© GameApps.HK 香港手機遊戲網 2013-2025