文章目錄
前兩天我在折騰一個個人項目,想搭個AI助手,就需要呼叫大模型。一問價格,好傢伙,GPT-4o一次調用幾毛錢,要是我們這項目真跑起來,一個月光API費就得大幾千。
我們就尋思,有沒有什麼便宜的路子。
然後我們就翻到了Cloudflare Workers AI。其實之前就知道Cloudflare搞了AI推理,但一直沒當一回事,覺得大廠的東西一定得收費吧。結果一看,好傢伙,每天白送10000 Neurons。
10000 Neurons什麼概念?差不多幾百次對話或幾百次圖像生成,一天。個人玩完全夠了。
當時我就來勁了,立刻去研究了一波。
Cloudflare Workers AI 是什麼?

Cloudflare Workers AI這玩意,怎麼說呢,我覺得它的本土化挺有意思的。它不是一個單純的模型供應商,它是一個跑在Cloudflare全球邊緣網路上的AI推理平台。 300多個城市的邊緣節點,離用戶賊近。
你想想看,你用OpenAI的API,請求先跑去美國,處理完再回來,一趟三四百毫秒。 Cloudflare這個,因為它本身就是做CDN的,全球到處都有節點,你人在哪,它就在離你最近的節點上跑模型。
典型響應不到100毫秒。這個差距,體感上很明顯。
而且它有個很騷的地方,就是冷啟動是毫秒級的,自動擴縮容。流量突然爆了也不會卡,不像有些平台凌晨三點沒人用的時候回應快得要死,白天一高峰直接炸了。
50+ 模型,覆蓋全場景
支援的模型也很多,2026年6月這個時間點,已經有50多個了。
文字對話這塊,Llama 3、Llama 4、Mistral、GLM、Qwen、Gemma、deepseek-r1都有。影像生成有Stable Diffusion、FLUX、Pixverse。語音方面有Whisper語音轉文字,也有TTS文字轉語音,甚至有視訊生成。
而且它的API設計得很乾淨。不管用什麼模型,都是統一的一個接口,改一下模型名就行。
env.AI.run(“模型名”, {…})
一行程式碼換模型,太舒服了。
價格極便宜,免費額度友好
價格這塊我也算了一下。免費額度每天10000 Neurons,個人折騰完全夠了。如果要付費,0.011美元1000 Neurons,比OpenAI便宜60%到90%。而且它是按Neuron計費的,不是按token,小對話更划算。
這個計費方式,說實話我覺得挺良心的。你簡簡單單聊兩句和一個超長上下文,花的Neurons不一樣,但差別不會像token計費那麼離譜。
說到這你可能想問,那到底怎麼用?
我親自走了一遍流程,給你說。
註冊與建立API 令牌
第一步,先註冊Cloudflare帳號。有帳號的直接登入就行,沒有的話註冊一個也不麻煩,填個郵箱設個密碼就完事了。
登入之後,點選左邊選單的AI,再點Workers AI。

進去之後會看到一個創建API令牌的按鈕,點一下就能產生令牌。

這裡有個細節要注意一下,生成的令牌只有創建的時候能看到一次,一定要保存好。頁面同時也會給你一個帳戶ID,這兩個東西後面都要用。

保存好之後,頁面下面會有呼叫範例,就是curl指令。把帳戶ID和APIKEY替換進去就好。命令長這樣:
curl \
https://api.cloudflare.com/client/v4/accounts/账户ID/ai/run/@cf/模型ID \
-H "Authorization: Bearer 刚才生成的APIKEY" \
-d '{"messages":[{"role":"system","content":"You are a friendly assistant that helps write stories"},{"role":"user","content":"Write a short story about a llama that goes on a journey to find an orange cloud"}]}'查看可用模型列表
然後問題來了,模型ID去哪看?
在Workers AI頁面右邊有個文件按鈕。

點進去找到Models這個分類,那裡是所有模型的清單。

選一個你想用的,點進去就能看到模型ID。

測試調用kimi2.6 模型
我選擇用kimi2.6測試一下。把模型ID複製出來,替換到curl指令裡,從@cf開始替換。
請求發出去,很快就回傳了結果。

反應速度確實很快,比我想像中還要流暢。
說實話,我就是想看看這個免費額度到底能做什麼,結果發現還蠻能打的。日常聊天、內容產生、翻譯、寫程式碼,這些場景完全夠用。
而且你想想,這玩意跑在邊緣節點上,你部署一個AI應用,用戶遍布全國甚至全球,響應速度都能保持一致,不用考慮區域部署的問題。對於個人開發者和小團隊來說,這個吸引力太大了。
以前你要跑模型,要嘛自己買GPU搭建,貴得要死,要嘛用雲端廠商的GPU實例,配置麻煩。 Cloudflare這個,直接幫你封裝好了,你寫程式呼叫就行,後面那些亂七八糟的事都幫你處理了。
我覺得這個思路是對的。 AI能力會越來越像水電一樣的基礎設施,你不需要知道電是怎麼發的,插上就能用。 Cloudflare Workers AI就是把這個「插上就能用」做得更極致了一點。
當然它也不是沒有缺點。免費額度只有10000 Neurons,真要上生產環境,流量大的話還是要付費的。而且模型雖然有50多個,但跟OpenAI那種啥都有的生態比起來,還是有些小眾模型或是最新的模型不支持。
但對於個人專案、小工具、或只是好奇心驅動的嘗試,我覺得已經完全夠用了。
以上就是我的真實體驗。既然看到這裡了,如果覺得不錯,隨手按讚、轉發吧,如果想第一時間收到推播,也可以給我個關注⭐~
謝謝你看我的文章,我們,下次再見。
希望陳溈亮博客( https://www.chenweiliang.com/ ) 分享的《Cloudflare Workers AI免費呼叫API全流程:註冊、設定、上線一步到位》,對您有幫助。
