財經中心/廖珪如報導
原本火紅的記憶體族群近期遭到血洗,華邦電更跌落100元,引發這場記憶體爭議的起源,是Google Research 於今年3月24日正式發表 TurboQuant 研究論文,這項針對大型語言模型推理階段 Key-Value Cache 的極致壓縮技術,預期將在長期內大幅提升人工智慧算力效率。群益投顧最新發布的產業速報指出,儘管該技術短期內引發記憶體股價承壓,但長線而言將強烈帶動高頻寬記憶體(HBM)與先進封裝(CoWoS)的需求成長。
TurboQuant 透過 PolarQuant 極座標量化與 QJL 量化演算法,將 KV Cache 從原本的16-bit大幅壓縮至約2.6到3 bits,成功實現至少6倍的記憶體縮減,同時在 Attention Logits 計算上帶來8倍的速度提升,且幾乎達到零精度損失。該技術已在多項基準測試中獲得驗證,並適用於大規模搜索引擎的向量檢索場景。相關論文預計於4月底的 ICLR 2026 國際會議正式發表,目前仍處於研究階段,官方尚未釋出程式碼或軟體庫。
針對 TurboQuant 發布當日記憶體巨頭美光(Micron)股價一度重挫逾5%的情緒性反應,群益投顧分析師直言,這是市場對雲端算力商業邏輯的根本誤判。雲端服務商的獲利模式以最大化「用戶數乘上單價除以硬體成本」為核心,壓縮後所釋放的記憶體空間並不會閒置,而是會被用來將併發請求(Batch Size)提升6倍,或將上下文長度擴展8倍。這將大幅增加資料交換頻率,導致對 GPU 總頻寬的需求不減反增。
報告強調,當前的物理限制在於頻寬而非單純的容量,要提升頻寬最直接的方式就是增加 HBM 的堆疊數。隨著 JEDEC 預計發布的 HBM4 標準將單層傳輸速度推升至接近 2TB/s,高技術門檻將有力支撐 SK 海力士與美光的平均售價。同時,HBM 堆疊數增加也將連帶帶動 CoWoS 中介層面積擴大。群益投顧更引用「傑文斯悖論」指出,效率提升降低了總擁有成本,反而會讓過去因成本過高而無法落地的 AI 應用變得有利可圖,進一步刺激企業擴大資本支出,整個 AI 供應鏈將處於長線成長軌道。
基於上述邏輯,群益投顧維持對先進封裝與高階記憶體產業的長期正面看法,並將2026至2027年 NVIDIA Rubin 平台的 HBM 顆數配置與 CoWoS 中介層面積視為後續驗證關鍵。在個股投資建議方面,群益投顧給予華邦電(2344)「買進」評等,預估其2026年每股盈餘為10.02元,目標價上看150元,隱含漲幅達52.74%;同時也給予南亞科(2408)「買進」評等,預估2026年每股盈餘達31.66元,目標價設定為300元,隱含漲幅為32.45%。不過分析師也提醒,若壓縮技術未能有效轉化為實際應用需求,或雲端大廠未將效率紅利轉化為資本支出,對記憶體需求的推升力道可能就會低於預期。
三立新聞網提醒您:
內容僅供參考,投資人於決策時應審慎評估風險,並就投資結果自行負責。
投資一定有風險,基金投資有賺有賠,申購前應詳閱公開說明書。
更多三立新聞網報導
. 快檢查!不是炎黃子孫? 這四個姓代表你可能戰神後代
. 電價審議凍漲? 商總回應了!
. VLSI TSA時程曝 英特爾、美光都來
. 台電今提交核三再運轉計畫 時程曝