真相終於大白。黃仁勳先前賣關子的「前所未見的晶片」,其實是將輝達Vera Rubin機櫃與推理晶片Groq整合,推理Token生成速度可望提升350倍。不過比新晶片更意外的是,在今日GTC上,向來力挺「銅進光退」的黃仁勳,卻改口宣布2028、2029年的Feynman架構將走向「銅光並存」,直言「兩種我們都要」。
黃仁勳先前曾賣關子表示,將在GTC發表前所未見的晶片,今天真相大了一個白,原來是指輝達即將推出的Vera Rubin與Groq的整合。輝達在去年耶誕節前宣布,以200億美元的天價獲得推論晶片新創Groq的技術授權,並將關鍵核心人物延攬至輝達,被視為是輝達面對CSP自研的AI ASIC在推論上的硬體成本、電力消耗優勢的解方。
黃仁勳表示,GPU雖然強大,但當AI模型變得越來越大,或者上下文長度達到數百萬時,還要以極高速度生成Token(例如每秒1000 個Token)時,會「耗盡動力」,所以輝達在Vera Rubin機櫃導入Groq的LPU(語言處理單元),Groq的LPU專攻低延遲的Token生成,這樣的組合能讓Token生成速度提升350倍,在現有的電力限制下,這種組合能創造出最高的營收產出率。
【點擊看完整全文】
更多鏡報報導
AI算力需求暴增100萬倍!黃仁勳GTC再開金口:輝達訂單2027衝破1兆美元
黃仁勳欽點Vera Rubin機櫃首發名單 這顆關鍵晶片竟非台積電代工
黃仁勳揭示光革命到來 新一代CPO交換器將問世 不只台積電這些台廠率先卡位



