Cloudflare Workers AI免費呼叫API全流程:註冊、設定、上線一步到位

前兩天我在折騰一個個人項目,想搭個AI助手,就需要呼叫大模型。一問價格,好傢伙,GPT-4o一次調用幾毛錢,要是我們這項目真跑起來,一個月光API費就得大幾千。

我們就尋思,有沒有什麼便宜的路子。

然後我們就翻到了Cloudflare Workers AI。其實之前就知道Cloudflare搞了AI推理,但一直沒當一回事,覺得大廠的東西一定得收費吧。結果一看,好傢伙,每天白送10000 Neurons。

10000 Neurons什麼概念?差不多幾百次對話或幾百次圖像生成,一天。個人玩完全夠了。

當時我就來勁了,立刻去研究了一波。

Cloudflare Workers AI 是什麼?

Cloudflare Workers AI免費呼叫API全流程:註冊、設定、上線一步到位

Cloudflare Workers AI這玩意,怎麼說呢,我覺得它的本土化挺有意思的。它不是一個單純的模型供應商,它是一個跑在Cloudflare全球邊緣網路上的AI推理平台。 300多個城市的邊緣節點,離用戶賊近。

你想想看,你用OpenAI的API,請求先跑去美國,處理完再回來,一趟三四百毫秒。 Cloudflare這個,因為它本身就是做CDN的,全球到處都有節點,你人在哪,它就在離你最近的節點上跑模型。

典型響應不到100毫秒。這個差距,體感上很明顯。

而且它有個很騷的地方,就是冷啟動是毫秒級的,自動擴縮容。流量突然爆了也不會卡,不像有些平台凌晨三點沒人用的時候回應快得要死,白天一高峰直接炸了。

50+ 模型,覆蓋全場景

支援的模型也很多,2026年6月這個時間點,已經有50多個了。

文字對話這塊,Llama 3、Llama 4、Mistral、GLM、Qwen、Gemma、deepseek-r1都有。影像生成有Stable Diffusion、FLUX、Pixverse。語音方面有Whisper語音轉文字,也有TTS文字轉語音,甚至有視訊生成。

而且它的API設計得很乾淨。不管用什麼模型,都是統一的一個接口,改一下模型名就行。

env.AI.run(“模型名”, {…})

一行程式碼換模型,太舒服了。

價格極便宜,免費額度友好

價格這塊我也算了一下。免費額度每天10000 Neurons,個人折騰完全夠了。如果要付費,0.011美元1000 Neurons,比OpenAI便宜60%到90%。而且它是按Neuron計費的,不是按token,小對話更划算。

這個計費方式,說實話我覺得挺良心的。你簡簡單單聊兩句和一個超長上下文,花的Neurons不一樣,但差別不會像token計費那麼離譜。

說到這你可能想問,那到底怎麼用?

我親自走了一遍流程,給你說。

註冊與建立API 令牌

第一步,先註冊Cloudflare帳號。有帳號的直接登入就行,沒有的話註冊一個也不麻煩,填個郵箱設個密碼就完事了。

登入之後,點選左邊選單的AI,再點Workers AI。

Cloudflare Workers AI 入口介面

進去之後會看到一個創建API令牌的按鈕,點一下就能產生令牌。

建立Workers AI API 令牌

這裡有個細節要注意一下,生成的令牌只有創建的時候能看到一次,一定要保存好。頁面同時也會給你一個帳戶ID,這兩個東西後面都要用。

儲存API 令牌和帳戶ID

保存好之後,頁面下面會有呼叫範例,就是curl指令。把帳戶ID和APIKEY替換進去就好。命令長這樣:

curl \
  https://api.cloudflare.com/client/v4/accounts/账户ID/ai/run/@cf/模型ID \
  -H "Authorization: Bearer 刚才生成的APIKEY" \
  -d '{"messages":[{"role":"system","content":"You are a friendly assistant that helps write stories"},{"role":"user","content":"Write a short story about a llama that goes on a journey to find an orange cloud"}]}'

查看可用模型列表

然後問題來了,模型ID去哪看?

在Workers AI頁面右邊有個文件按鈕。

點選文檔按鈕

點進去找到Models這個分類,那裡是所有模型的清單。

Models 模型列表

選一個你想用的,點進去就能看到模型ID。

查看模型ID

測試調用kimi2.6 模型

我選擇用kimi2.6測試一下。把模型ID複製出來,替換到curl指令裡,從@cf開始替換。

請求發出去,很快就回傳了結果。

測試調用kimi2.6 結果

反應速度確實很快,比我想像中還要流暢。

說實話,我就是想看看這個免費額度到底能做什麼,結果發現還蠻能打的。日常聊天、內容產生、翻譯、寫程式碼,這些場景完全夠用。

而且你想想,這玩意跑在邊緣節點上,你部署一個AI應用,用戶遍布全國甚至全球,響應速度都能保持一致,不用考慮區域部署的問題。對於個人開發者和小團隊來說,這個吸引力太大了。

以前你要跑模型,要嘛自己買GPU搭建,貴得要死,要嘛用雲端廠商的GPU實例,配置麻煩。 Cloudflare這個,直接幫你封裝好了,你寫程式呼叫就行,後面那些亂七八糟的事都幫你處理了。

我覺得這個思路是對的。 AI能力會越來越像水電一樣的基礎設施,你不需要知道電是怎麼發的,插上就能用。 Cloudflare Workers AI就是把這個「插上就能用」做得更極致了一點。

當然它也不是沒有缺點。免費額度只有10000 Neurons,真要上生產環境,流量大的話還是要付費的。而且模型雖然有50多個,但跟OpenAI那種啥都有的生態比起來,還是有些小眾模型或是最新的模型不支持。

但對於個人專案、小工具、或只是好奇心驅動的嘗試,我覺得已經完全夠用了。

以上就是我的真實體驗。既然看到這裡了,如果覺得不錯,隨手按讚、轉發吧,如果想第一時間收到推播,也可以給我個關注⭐~

謝謝你看我的文章,我們,下次再見。

希望陳溈亮博客( https://www.chenweiliang.com/ ) 分享的《Cloudflare Workers AI免費呼叫API全流程:註冊、設定、上線一步到位》,對您有幫助。

歡迎分享本文鏈接:https://www.chenweiliang.com/cwl-34244.html

想解鎖更多隱藏秘技🔑,歡迎加入Telegram頻道!

喜歡就分享和按讚!您的分享與按贊,是我們持續的動力!

 

發表評論

您的郵箱地址不會被公開。 必填項已用 * 標註

文章目錄
回到頁首