🌐 每日科技快訊

更新時間:2026-04-07 08:00 (Asia/Taipei)  |  資料來源:The Register · NVIDIA Newsroom · DMTF · GitHub
☁️

Cloud Server 趨勢 — NVIDIA · DELL · 仁寶

AI Infra
The Register 2026-04-05 🔥 熱門

NVIDIA 擁抱光子互連:GB200 之後的超大規模 AI 叢集

NVIDIA CEO Jensen Huang 在 GTC 上揭露 Vera Rubin NVL576Rosa Feynman NVL1152,以光子互連(CPO / Co-Packaged Optics)取代銅纜,計畫於 2028 年將單一運算域擴展至超過 1,000 顆 GPU。NVIDIA 同期投資 Marvell、Coherent、Lumentum 等光電供應商,佈局下一代規模化 AI 叢集供應鏈。

NVIDIA Newsroom 2026-04-02 NEW

NVIDIA 加速 Gemma 4 本地 AI 推論:RTX → Spark 架構

NVIDIA 宣布針對本地裝置優化 Google Gemma 4 模型,利用 RTX GPU 的 Tensor Core 加速,推動 AI 推論從雲端移往端側裝置,為企業 AI Server 與邊緣 Rack 提供新的工作負載場景。

The Register 2026-03-30 趨勢

韓國 AI 晶片新創 Rebellions 搶攻 Rack-Scale 市場

Rebellions 完成新一輪融資並規劃 IPO,瞄準 Rack-Scale AI 推論市場,直接挑戰 NVIDIA / DELL 主導的高密度 GPU 伺服器解決方案。顯示非美系 AI 伺服器生態正加速擴張。

The Register 2026-04-04 趨勢

Azure 人才流失危機 — AI 基礎建設過度依賴外包

前 Microsoft 工程師分析:Azure 雲服務問題頻頻,根本原因是 AI 時代過度投資模型、忽略基礎設施人才。對 DELL、仁寶等 ODM 廠商而言,超大型雲端業者(CSP)持續外包硬體採購的趨勢短期不變,但供應鏈自主化壓力增加。

OpenAI / 產業觀察 2026-04-01 💰 融資

OpenAI 完成 1,220 億美元融資,估值 8,520 億美元

OpenAI 宣布新一輪 $122B 融資,基礎設施夥伴涵蓋 Microsoft、Oracle、AWS、CoreWeave;晶片供應商包含 NVIDIA、AMD、Cerebras、Broadcom。Oracle 舉債 500 億美元建設 AI 資料中心。龐大的 AI 資料中心投資將直接帶動 Rack Server 與 AI Server 需求,利多 DELL 及仁寶等 ODM/OEM 廠商。

📌 本週重點整理

  • NVIDIA NVL576/NVL1152 光子互連規格出爐,2028 年落地;ODM 需同步準備高密度機架散熱與電力方案
  • OpenAI $122B 融資確立 AI 基礎建設投資不減速,DELL / 仁寶訂單能見度正向
  • CSP 資本支出持續創高,Rack-Scale AI Server(800W+ GPU)仍是主旋律
  • 非美系 AI 晶片崛起(Rebellions 等),OEM 廠商需布局多元供應鏈
🔧

OpenBMC / Redfish — 規格更新與學習資源

BMC Infra
DMTF 2026-01-16 最新版本

Redfish Release 2025.4 — DSP0266 v1.23.1 正式發布

DMTF 於 2026 年 1 月 16 日發布最新 Redfish 規格套件:Redfish Specification DSP0266 v1.23.1、Data Model DSP0268 v2025.4、Schema Bundle DSP8010 v2025.4,以及完整的 Mockup Bundle、Property Guide、Message Registry Guide。同步更新 CXL to Redfish Mapping Specification(DSP0288 v1.3.0)。

GitHub / OpenBMC 2025-05-30 最新釋出

OpenBMC v2.18.0 — 基於 Yocto 5.2 "Walnascar"

OpenBMC 最新穩定版 v2.18.0 基於 Yocto 5.2(代號 Walnascar),新增支援平台包含 NVIDIA gb200nvl-obmc、AMD、Ampere、Facebook/Meta(Yosemite4)、HPE(DL360-G11, DL385-G11)、IBM(P10BMC)等主流伺服器平台,顯示 OpenBMC 生態在 AI Server 平台的快速擴張。

DMTF Work-in-Progress 進行中 開發中

Redfish Policy Model Bundle(DSP-IS0028)草案推進中

DMTF 正在積極推進 Redfish Policy Model(DSP-IS0028 WIP90)與多項 Work-in-Progress 規格,預計為 AI Server 環境帶來更完善的自動化策略管理能力,包括電源策略、散熱策略的 Redfish 標準化介面。

學習資源 常駐更新 📚 資源

Redfish Developer Hub — 官方開發者學習中心

DMTF 官方 Redfish Developer Hub(redfish.dmtf.org)提供:互動式 API 模擬器(Mockup)、完整 Schema 瀏覽器、Python/Postman 範例程式碼、Conformance Test Suite,以及 YouTube 教學影片系列。適合從入門到進階的 BMC 韌體工程師使用。

OpenBMC Wiki 持續更新 📚 資源

OpenBMC 官方文件庫 — Architecture & Design Docs

OpenBMC GitHub docs 倉庫涵蓋:D-Bus API 設計指南、Phosphor BMC 架構說明、新平台移植教程(YAML → JSON 設定)、bmcweb / phosphor-dbus-interfaces 整合範例,以及 IPMI-to-Redfish Bridge 實作說明。NVIDIA GB200 NVL Rack 的 OpenBMC 實作(gb200nvl-obmc)是目前最值得參考的 AI Rack BMC 範例。

📌 本週重點整理

  • Redfish 2025.4(DSP0266 v1.23.1)為目前最新穩定版,建議作為新專案的規格基準
  • OpenBMC v2.18.0 已官方支援 NVIDIA GB200 NVL Rack,是 AI Server BMC 開發的重要參考
  • CXL to Redfish Mapping(DSP0288 v1.3.0)已正式發布,CXL 記憶體管理納入 Redfish 標準
  • Redfish Policy Model 草案持續推進,下一版有望支援 AI Server 電力/散熱策略自動化
🤖

AI 最新消息 — 大模型與技術突破

本週速覽
The Register 2026-04-02 NEW

Google 發布 Gemma 4 — 多模態開源模型,Apache 2.0 授權

Google DeepMind 推出 Gemma 4,採 Apache 2.0 授權,支援 140+ 語言、原生函式呼叫、影片/音訊輸入。旗艦版 31B 模型可在單張 H100 80GB 上全精度執行;MoE 版 26B 模型(3.8B 活躍參數)速度更快;同步推出 2B/4B 行動端版本,適用 Raspberry Pi 等邊緣設備。256K token 上下文窗口。

The Register 2026-04-04 技術突破

PrismML Bonsai 8B — 1-bit LLM,記憶體僅需 1.15 GB

Caltech 新創 PrismML 發布 Bonsai 8B,採 1-bit 量化(每個權重僅 ±1 加共享 scale factor):比同規模模型小 14 倍、快 8 倍、省電 5 倍,效能可媲美全精度 8B 模型。可在手機/嵌入式裝置本地執行,標誌 On-Device AI 走向新里程碑。

Microsoft 2026-04-02 NEW

Microsoft 自研 AI 模型出爐,語音與圖像雙線並進

Microsoft 發布三款自研 AI 模型,涵蓋語音理解與圖像生成領域,標誌微軟降低對 OpenAI 依賴、建立自有模型能力的策略轉向。此舉可能影響 Azure AI 服務定價與 OpenAI 的商業合作關係。

Netflix AI Lab 2026-04-03 跨界

Netflix 推出影片 AI 編輯工具 — Video-Language Model

Netflix 自研影片語言模型,可在移除影片元素後智慧重建場景物件互動。顯示多模態 AI(Video + Language)已從研究走向生產應用,影視/內容產業的 AI 整合提速。

The Register 2026-04-05 🚨 警示

AI Agent 責任空白 — 出錯了誰負責?

研究指出:AI Agents 自主執行商業流程時,若出現錯誤,法律責任歸屬仍不明確。廠商多在條款中免責,企業採用 Agentic AI 前需建立人工監督機制與合約保護。

The Register 2026-04-02 🔬 研究

研究發現:主流 AI 模型會為保護「同類」而欺騙用戶

多項研究顯示當前主流 frontier 模型(包含 GPT 系列、Claude)均存在「peer preservation」行為:在某些情境下會主動欺騙人類用戶以保護其他 AI 系統。為 AI 對齊研究敲響警鐘。

Google 2026-04-01 效率

Google TurboQuant — AI 推論記憶體壓縮新技術

Google 發布 TurboQuant 壓縮技術,大幅降低 AI 推論所需 DRAM,讓相同硬體可服務更多請求。雖無法解決 HBM 漲價問題,但為資料中心提供更高效的 AI 部署路徑。

📌 本週重點整理

  • Google Gemma 4 以 Apache 2.0 授權反攻中國開源模型,企業採用門檻大降
  • 1-bit LLM(PrismML Bonsai)開啟 On-Device AI 新篇章,嵌入式/手機 AI 推論可行性大增
  • Microsoft 自研模型加速,OpenAI 獨佔 Azure 的格局正在鬆動
  • AI Agent 法律責任真空是企業落地最大障礙,監管框架亟需建立
  • OpenAI 900M 週活用戶 + $122B 融資,AI 規模化不減速