科技中心/張家寧報導
▲DeepSeek推出後引發全球關注。(圖/翻攝自unsplash)
大陸AI新創公司DeepSeek號稱以不到600萬美元的成本,開發出大型AI模型,消息曝光後震驚全球科技業。而針對外界好奇DeepSeek為何能「比較節省晶片」一事,有醫師則曝光DeepSeek團隊發表的論文揭秘其中原因。
AI模型DeepSeek推出後震驚科技業,然而,針對外界好奇DeepSeek的模型為何比較節省晶片一事,精神科醫師沈政男近日在臉書發文表示,從DeepSeek團隊發表的論文中可以看到,「他們的模型比較節省晶片,就因為少了一個步驟,也就是價值函數的訓練。」
沈政男表示,Open AI使用的PPO趨近策略優化,缺點是需要大量晶片運算來做價值函數的訓練,對於機器的輸出值,每一個都要給予評價,「就好像老師必須對班上每一個同學的每一次考試,都給予個別考核一樣。」
沈政男指出,反觀DeepSeek不使用價值函數,「不需要額外聘請評估的老師,而是從同學們的群體輸出值裡,藉由相互比較,來得出最好的策略。」
沈政男斷言「AI基本上是大國遊戲,就好像製藥工業與汽車產業一樣,台灣玩不起。」而DeepSeek到底會影響全球AI市場到什麼程度,有待觀察,但對於AI領域,他認為目前狀態就是過熱與過譽,「它確實很厲害,但距離智慧兩個字,還有很長的路要走,基本上就還只是一種運算。」
更多三立新聞網報導
. 大S驟逝!林志玲深夜「IG悲痛發聲了」 6字惹哭全網
. 大S數度送醫「日本為什麼不收住院?」 醫揭驚人1差異:台灣人無法想像
. 中輸美商品「加徵10%關稅」生效倒數!川普:兩國可能24小時內對話
. 大S私下有多暖?昔「大量金援大炳」暖舉曝 他聞噩耗淚崩