Pêvajoya Banga API ya Belaş a AI ya Cloudflare Workers: Qeydkirin, Mîhengkirin, û Bicîhkirin di Yek Gavekê de

前两天我在折腾一个个人项目,想搭个AI助手,就需要调用大模型。一问价格,好家伙,GPT-4o一次调用几毛钱,要是我们这项目真跑起来,一个月光API费就得大几千。

我们就寻思,有没有什么便宜的路子。

然后我们就翻到了Cloudflare Workers AI。其实之前就知道Cloudflare搞了AI推理,但一直没当回事,觉得大厂的东西肯定得收费吧。结果一看,好家伙,每天白送10000 Neurons。

10000 Neurons什么概念?差不多几百次对话或几百次图像生成,一天。个人玩完全够了。

当时我就来劲了,立马去研究了一波。

Cloudflare Workers AI 是什么?

Pêvajoya Banga API ya Belaş a AI ya Cloudflare Workers: Qeydkirin, Mîhengkirin, û Bicîhkirin di Yek Gavekê de

Cloudflare Workers AI这玩意,怎么说呢,我觉得它的Positioning挺有意思的。它不是一个单纯的模型提供商,它是一个跑在Cloudflare全球边缘网络上的AI推理平台。300多个城市的边缘节点,离用户贼近。

你想想看,你用OpenAI的API,请求先跑去美国,处理完再回来,一趟三四百毫秒。Cloudflare这个,因为它本身就是做CDN的,全球到处都有节点,你人在哪,它就在离你最近的节点上跑模型。

典型响应不到100毫秒。这个差距,体感上很明显。

而且它有个很骚的地方,就是冷启动是毫秒级的,自动扩缩容。流量突然爆了也不会卡,不像有些平台凌晨三点没人用的时候响应快得要死,白天一高峰直接炸了。

50+ 模型,覆盖全场景

支持的模型也很多,2026年6月这个时间点,已经有50多个了。

文本对话这块,Llama 3、Llama 4、Mistral、GLM、Qwen、Gemma、deepseek-r1都有。图像生成有Stable Diffusion、FLUX、Pixverse。语音方面有Whisper语音转文字,也有TTS文字转语音,甚至还有视频生成。

而且它的API设计得很干净。不管用什么模型,都是统一的一个接口,改一下模型名就行。

env.AI.run(“模型名”, {…})

一行代码换模型,太舒服了。

价格极便宜,免费额度友好

价格这块我也算了一下。免费额度每天10000 Neurons,个人折腾完全够了。如果要付费,0.011美元1000 Neurons,比OpenAI便宜60%到90%。而且它是按Neuron计费的,不是按token,小对话更划算。

这个计费方式,说实话我觉得挺良心的。你简简单单聊两句和一个超长上下文,花的Neurons不一样,但差别不会像token计费那么离谱。

说到这你可能想问,那到底怎么用?

我亲自走了一遍流程,给你说说。

注册与创建 API 令牌

第一步,先注册Cloudflare账号。有账号的直接登录就行,没有的话注册一个也不麻烦,填个邮箱设个密码就完事了。

登录之后,点左边菜单的AI,再点Workers AI。

Cloudflare Workers AI 入口界面

 

进去之后会看到一个创建API令牌的按钮,点一下就能生成令牌。

创建 Workers AI API 令牌

这里有个细节要注意一下,生成的令牌只有创建的时候能看到一次,一定要保存好。页面同时还会给你一个账户ID,这两个东西后面都要用。

保存 API 令牌和账户 ID

保存好之后,页面下面会有调用示例,就是curl命令。把账户ID和APIKEY替换进去就行。命令长这样:

curl \
  https://api.cloudflare.com/client/v4/accounts/账户ID/ai/run/@cf/模型ID \
  -H "Authorization: Bearer 刚才生成的APIKEY" \
  -d '{"messages":[{"role":"system","content":"You are a friendly assistant that helps write stories"},{"role":"user","content":"Write a short story about a llama that goes on a journey to find an orange cloud"}]}'

查看可用模型列表

然后问题来了,模型ID去哪看?

在Workers AI页面右边有个文档按钮。

点击文档按钮

点进去找到Models这个分类,那里是所有模型的列表。

Models 模型列表

选一个你想用的,点进去就能看到模型ID。

查看模型 ID

测试调用 kimi2.6 模型

我选择用kimi2.6来测试一下。把模型ID复制出来,替换到curl命令里,从@cf/开始替换。

请求发出去,很快就返回了结果。

测试调用 kimi2.6 结果

响应速度确实很快,比我想象中要流畅。

说实话,我就是想看看这个免费额度到底能干什么,结果发现还挺能打的。日常聊天、内容生成、翻译、写代码,这些场景完全够用。

而且你想想,这玩意跑在边缘节点上,你部署一个AI应用,用户遍布全国甚至全球,响应速度都能保持一致,不用考虑区域部署的问题。对于个人开发者和小团队来说,这个吸引力太大了。

以前你要跑模型,要么自己买GPU搭建,贵得要死,要么用云厂商的GPU实例,配置起来麻烦。Cloudflare这个,直接给你封装好了,你写代码调用就行,后面那些乱七八糟的事都帮你处理了。

我觉得这个思路是对的。AI能力会越来越像水电一样的基础设施,你不需要知道电是怎么发的,插上就能用。Cloudflare Workers AI就是把这个「插上就能用」做得更极致了一点。

当然它也不是没有缺点。免费额度只有10000 Neurons,真要上生产环境,流量大的话还是要付费的。而且模型虽然有50多个,但跟OpenAI那种啥都有的生态比起来,还是有些小众模型或者最新的模型不支持。

但对于个人项目、小工具、或者只是好奇心驱动的尝试,我觉得已经完全够用了。

以上就是我的真实体验。既然看到这里了,如果觉得不错,随手点赞、转发吧,如果想第一时间收到推送,也可以给我个关注⭐~

Spas ji bo xwendina gotara min. Careke din hevdû dibînin.

Hope Chen Weiliang Blog ( https://www.chenweiliang.com/ ) 分享的《Cloudflare Workers AI免费调用API全流程:注册、配置、上线一步到位》,对您有帮助。

Bi xêr hatî bo parvekirina girêdana vê gotarê:https://www.chenweiliang.com/cwl-34244.html

Ji bo vekirina bêtir hîleyên veşartî🔑, bi xêr hatin beşdarî kanala me ya Telegramê bibin!

Heke hûn jê hez dikin parve bikin û hez bikin! Parvekirin û ecibandinên we motîvasyona me ya berdewam in!

 

评论

Navnîşana e-nameya we nayê weşandin. Zeviyên pêdivî têne bikar anîn * Awanasî

pelrêça gotarê
Scroll to Top