記事ディレクトリ
先日、個人的なプロジェクトに取り組んでいたのですが、あるプロジェクトを構築したいと思いました...AIアシスタントは大規模なモデルを呼び出す必要がある。料金について尋ねたところ、なんとGPT-40への呼び出し1回あたり数セントかかるという。もし実際にプロジェクトが稼働すれば、API料金だけで月に数千ドルにもなるだろう。
もっと安い方法はないかと考えた。
そして、Cloudflare Workers AIに出会いました。CloudflareがAI推論に関わっていることは以前から知っていましたが、大企業は製品を有料で提供するものだと思い込んで、真剣に受け止めていませんでした。ところが、なんと、毎日10000万個のニューロンを無料で提供しているのです。
1万個のニューロンとはどういう意味でしょうか?おおよそ、1日に数百回の対話、あるいは数百回の画像生成セッションを行う量に相当します。これは、一人で遊ぶには十分すぎるほどの量です。
私はとても興奮して、すぐにそれについて調べ始めました。
Cloudflare Workers AIとは何ですか?

Cloudflare Workers AI は、そうですね、私は...ポジショニングそれは非常に興味深いですね。単なるモデルプロバイダーではなく、Cloudflareのグローバルエッジネットワーク上で動作するAI推論プラットフォームなのです。300以上の都市にエッジノードがあるため、ユーザーとの距離が非常に近いと言えます。
考えてみてください。OpenAIのAPIを使う場合、リクエストはまず米国に送信され、処理されてから返送されます。これには300~400ミリ秒かかります。一方、Cloudflareは世界中にノードを持つCDNプロバイダーです。ユーザーがどこにいても、Cloudflareは最も近いノードでモデルを実行します。
標準的な応答時間は100ミリ秒未満です。この違いはユーザーにとってはっきりと感じられます。
このサービスの本当に素晴らしい点は、コールドスタートがミリ秒単位で、自動的にスケールアップ・スケールダウンすることです。トラフィックが急増してもラグが発生しません。午前3時など誰も利用していない時間帯には驚くほど高速なのに、日中のピーク時には完全にクラッシュしてしまうようなプラットフォームとは大違いです。
50種類以上のモデルで、あらゆるシナリオに対応
対応機種も多数あり、2026年6月時点で既に50機種以上となっています。
テキストベースの対話処理には、Llama 3、Llama 4、Mistral、GLM、Qwen、Gemma、Deepseek-r1が利用可能です。画像生成には、Stable Diffusion、FLUX、Pixverseがあります。音声処理には、音声認識用のWhisper、音声合成用のTTS、さらには動画生成機能も利用できます。
さらに、そのAPIは非常に簡潔に設計されています。使用するモデルに関わらず、統一されたインターフェースを使用するため、モデル名を変更するだけで済みます。
env.AI.run(“モデル名”, {…})
たった1行のコードでモデルを変更できるのは、とても便利です。
非常に低価格、寛大な無料クレジット限度額
価格設定も行いました。無料の1日あたりの利用上限は10000ニューロンで、個人的な実験には十分すぎる量です。有料の場合は、1000ニューロンあたり0.011ドルで、OpenAIよりも60%~90%安価です。さらに、トークンではなくニューロン単位で課金されるため、小規模な会話にはより費用対効果が高いと言えます。
正直言って、この課金方法はかなり公平だと思います。消費するニューロンの数は、簡単な会話か長時間の会話かによって異なりますが、トークンベースの課金ほど大きな差はありません。
この時点で、あなたは「具体的にどのように使うのか?」と疑問に思うかもしれません。
私もその過程を経験したので、そのことについてお話ししましょう。
APIトークンを登録して作成する
まず最初に、Cloudflareアカウントを登録してください。既にアカウントをお持ちの場合は、ログインしてください。アカウントをお持ちでない場合は、メールアドレスを入力してパスワードを設定するだけで簡単に登録できます。
ログイン後、左側のメニューで「AI」をクリックし、次に「ワーカーAI」をクリックしてください。

中に入ると、APIトークンを作成するボタンが表示されます。それをクリックしてトークンを生成してください。

注意すべき点として、生成されたトークンは作成時に一度しか表示されないため、必ず保存してください。また、ページにはアカウントIDも表示されます。これらは後で必要になります。

保存後、ページ下部に使用例(curlコマンド)が表示されます。アカウントIDとAPIキーをご自身のものに置き換えてください。コマンドは次のようになります。
curl \
https://api.cloudflare.com/client/v4/accounts/账户ID/ai/run/@cf/模型ID \
-H "Authorization: Bearer 刚才生成的APIKEY" \
-d '{"messages":[{"role":"system","content":"You are a friendly assistant that helps write stories"},{"role":"user","content":"Write a short story about a llama that goes on a journey to find an orange cloud"}]}'利用可能なモデルの一覧を見る
そこで疑問が生じます。モデルIDはどこで見つけられるのでしょうか?
Workers AIページの右側にドキュメントボタンがあります。

「モデル」カテゴリをクリックしてください。そこにすべてのモデルのリストが表示されます。

使用したいものを選択してください。クリックするとモデルIDが表示されます。

Kimi 2.6モデルの呼び出しテスト
我选择用kimi2.6来测试一下。把模型ID复制出来,替换到curl命令里,从@cf/开始替换。
依頼が送信され、結果はすぐに返ってきた。

応答速度は確かに非常に速く、予想以上にスムーズでした。
正直なところ、この無料クレジットで何ができるのか試してみたかっただけなのですが、実際はかなり強力でした。日常的なチャット、コンテンツ作成、翻訳、コーディングには十分すぎるほどです。
考えてみてください。このシステムはエッジノード上で動作します。国内、あるいは世界中にユーザーがいるAIアプリケーションをデプロイしても、地域的なデプロイの問題を気にすることなく、応答速度は一定に保たれます。これは、個人開発者や小規模チームにとって非常に魅力的な点です。
以前は、モデルを実行するには、非常に高価なGPUを購入して自作するか、設定が複雑なクラウドプロバイダーのGPUインスタンスを使用するかのどちらかを選択する必要がありました。一方、Cloudflareはそれらすべてをまとめて提供してくれます。呼び出すコードを書くだけで、面倒な処理はすべてCloudflareが行ってくれます。
この考え方は正しいと思います。AIの機能は、水道や電気といったインフラのように、ますます身近なものになっていくでしょう。電気がどのように発電されるかを知る必要はなく、ただ差し込むだけで使えるようになるのです。Cloudflare Workers AIは、この「プラグアンドプレイ」の概念をさらに極限まで推し進めたものです。
もちろん、欠点がないわけではありません。無料の割り当てはニューロン数10000個のみなので、トラフィック量の多い本番環境に導入する場合は料金を支払う必要があります。また、50種類以上のモデルが用意されていますが、OpenAIの包括的なエコシステムと比較すると、ニッチなモデルや新しいモデルの一部はサポートされていません。
しかし、個人的なプロジェクトや小型ツール、あるいは単なる好奇心に基づく実験であれば、十分すぎるほどだと思います。
これが私の正直な体験談です。ここまで読んでくださったので、もしこの記事が役に立ったと思ったら、ぜひ「いいね!」やシェアをお願いします。最新情報をいち早く受け取りたい方は、フォローもお願いします!⭐
私の記事を読んでいただき、ありがとうございました。また次回お会いしましょう。
Hope Chen Weiliang ブログ ( https://www.chenweiliang.com/ こちらで共有されている記事「Cloudflare Workers AI 無料API呼び出しプロセス:登録、設定、デプロイをワンステップで完了」が、お役に立つかもしれません。
この記事のリンクを共有することを歓迎します。https://www.chenweiliang.com/cwl-34244.html
