大型語言模型(LLMs)其實不貴。這聽起來也許像句廢話,但實際上,「LLM很貴」這個觀點不但還在傳播,而且似乎越來越常出現在各種分析裡,從預測AI企業注定虧損,到斷言消費型AI不可能盈利,完全忽略了現實中的成本變化。
我能理解這種錯誤從哪來——AI熱潮剛開始那會兒,推理(inference)確實很貴,大家也談了很多。但隨著模型越來越強,推理成本下降的速度更快。問題在於,人類對一件東西在兩年內變得一千倍便宜完全沒直覺。這不常見,也不直觀。再加上API價格用的是「每百萬個token幾塊錢」這種難以想像的單位,誤解自然也就持續存在。
我想拿網頁搜尋來當比較對象,因為它跟LLM用途接近,而且是大家每天都在用但從來沒付過錢的東西。我不是在說搜尋可以被LLM取代,而是想提供一個有意義的參照點。
搜尋查詢多少錢?
根據2025年5月的公開API價格:
- Google Gemini Search API 的「與Google Search接地」功能:$35 / 千次查詢
- Bing Search API:$15 / 千次查詢
- Brave Search API:$9 / 千次查詢
不同引擎的價格有落差,但差距沒那麼誇張,而且品質高的通常也比較貴。
LLM查詢多少錢?
我從自己的搜尋紀錄裡挑了幾個問題,轉換成自然語言,丟到Gemini 2.5 Flash(Thinking mode off)裡跑:
- 「LLM這個詞是什麼時候開始用的?」→ 361 tokens,用了 2.5 秒
- 「有哪些熱門的 JavaScript 遊戲引擎?」→ 1145 tokens,用了 7.6 秒
- 「歐洲一般的手提行李尺寸限制是多少?」→ 506 tokens,用了 3.4 秒
- 「列出史上十次最大的停電事件」→ 583 tokens,用了 3.7 秒
所以每次查詢大約在 500–1000 token 之間。我就取這個範圍來估算。
根據2025年5月的API價格,部分模型的成本如下:
模型 | 價格(每百萬 token) |
---|---|
Gemma 3 27B | $0.20 |
Qwen3 30B A3B | $0.30 |
Gemini 2.5 Flash Preview | $0.60 |
GPT-4.1 mini | $1.60 |
GPT-4.1 | $8.00 |
Gemini 2.5 Pro Preview | $10.00 |
Claude 3.7 Sonnet | $15.00 |
o3 | $40.00 |
假設每次查詢大概用掉1,000 token,那上表中的價格就可以直接對比搜尋API的千次查詢價格。
換句話說,哪怕是主流、功能完整的中階模型,也比搜尋API便宜一個數量級。像Gemini 2.5 Flash就只要$0.60,比Bing的$15還不到二十分之一。
有人可能會提出的反對意見
我知道你可能會覺得這種估算過於粗糙,下面是我預想到的一些常見反駁:
「LLM回應字數比那幾個例子多多了」
我選的本來就是偏長的問題,也符合一般人拿來搜尋的用途。如果你想處理更長的輸入/輸出(例如程式碼生成),那也應該和其他類似用途的成本做比較。
「API價格太低,肯定在虧本補貼搶市佔」
我不同意。因為:
- 沒有長期綁定,便宜也留不住用戶;
- 大部分API的使用資料不會被用來訓練模型;
- 有些開源模型的API是由第三方提供,他們沒理由補貼成本;
- Deepseek公開過自己的成本結構,他們的R1 API毛利高達80%。
「搜尋引擎的成本還要攤提索引建構費」
很有可能,但這也不至於把差價補平。OpenAI過去財報裡提到,每年花在推理上的費用約為40億美金,訓練則是30億,但推理流量的成長非常快,攤提成本效率更高。
「搜尋更快,怎麼會更貴?」
搜尋可以並行運算,LLM目前還得一個token一個token生成(雖然單個token預測可並行)。這是技術路線的差異,不等於成本一定更低。
「OpenAI還是虧錢啊」
對,但這是因為他們沒急著賺錢。據說2024年OpenAI虧損50億美元,月活用戶5億人。只要每人每月廣告創收1美元就能打平。這不是成本問題,而是商業模式選擇問題。
為什麼我覺得這很重要?
很多人現在仍在用一個早就失效的假設在思考AI的商業未來。他們相信生成式AI太貴,沒法養活自己,最後注定泡沫化。但事實是:
- 成本一直在降,價格也隨之下降;
- 價格下降反而開啟更多應用場景,需求會增加;
- 給終端使用者用的LLM其實比搜尋還便宜;
- 未來最大成本壓力會來自AI背後所依賴的服務生態,不是模型本身。
當AI代理開始橫跨應用、幫你買票、訂餐、預約時,那些原本的網站才會面臨真實成本壓力。他們被當成免費的資料來源,卻沒得到任何補償,而且還可能因為AI取代了用戶界面而失去原本的廣告收入。
所以我認為,真正需要被問的是:AI代理使用的第三方服務成本怎麼辦?
這可能導致:
- 更多網站封鎖爬蟲,改為強制登入;
- 從網頁轉向APP或需裝置驗證的服務;
- 某些服務商乾脆退出市場。
屆時AI代理又會怎麼選?繼續對抗性爬取?還是建立合作關係、直接付費存取?我不知道。但我很確定:跑AI本身不會是那個拖垮AI經濟的成本黑洞。
如果你下次又聽到有人說「LLM太貴了啦」,就把這篇文章丟給他。