Directori d'articles
L'altre dia estava treballant en un projecte personal i volia construir un...AIL'assistent necessita trucar a models grans. Quan vaig preguntar pel preu, ostres, cada trucada a GPT-4o costa uns quants cèntims. Si el nostre projecte realment funcionés, les tarifes de l'API per si soles ascendirien a diversos milers al mes.
Ens preguntàvem si hi havia alguna manera més barata.
Aleshores vam descobrir Cloudflare Workers AI. Sabíem que Cloudflare ja estava involucrat en la inferència d'IA, però no ens ho vam prendre seriosament, suposant que les grans empreses cobrarien pels seus productes. Resulta que, ostres, regalen 10000 neurones cada dia.
Què vol dir 10000 neurones? Són aproximadament uns quants centenars de diàlegs o unes quantes centenars de sessions de generació d'imatges al dia. Això és més que suficient perquè una persona hi pugui jugar.
Em vaig emocionar molt i de seguida vaig començar a investigar-ho.
Què és la IA dels treballadors de Cloudflare?

La IA dels treballadors de Cloudflare, bé, crec que és...PosicionamentAixò és força interessant. No és només un simple proveïdor de models; és una plataforma d'inferència d'IA que s'executa a la xarxa perimetral global de Cloudflare. Amb nodes perimetrals a més de 300 ciutats, està increïblement a prop dels usuaris.
Pensa-hi: quan fas servir l'API d'OpenAI, la sol·licitud primer va als EUA, es processa i després torna, trigant entre tres-cents i quatre-cents mil·lisegons. Cloudflare, en canvi, és un proveïdor de CDN amb nodes a tot el món. Siguis on siguis, executa el model al node més proper.
El temps de resposta típic és inferior a 100 mil·lisegons. Aquesta diferència és perceptible per a l'usuari.
El que és realment genial és que el seu inici en fred és al nivell de mil·lisegons i s'escala automàticament amunt i avall. Fins i tot amb un augment sobtat de trànsit, no tindrà retard, a diferència d'algunes plataformes que són increïblement ràpides quan ningú les fa servir a les 3 del matí, però després es bloquegen completament durant les hores punta del dia.
Més de 50 models, que cobreixen tots els escenaris
També hi ha molts models compatibles; a juny de 2026, ja n'hi havia més de 50.
Per al diàleg basat en text, hi ha disponibles Llama 3, Llama 4, Mistral, GLM, Qwen, Gemma i Deepseek-r1. Per a la generació d'imatges, hi ha Stable Diffusion, FLUX i Pixverse. Per a la parla, hi ha Whisper per a la conversió de veu a text, TTS per a la conversió de text a veu i fins i tot la generació de vídeo.
A més, la seva API està dissenyada per ser molt neta. Independentment del model utilitzat, utilitza una interfície unificada; només cal canviar el nom del model.
env.AI.run("nom del model", {…})
Canviar el model amb només una línia de codi és molt convenient.
Preu extremadament econòmic, límit de crèdit gratuït generós
També he fet els preus. La quantitat diària gratuïta és de 10000 Neurones, que és més que suficient per a l'experimentació personal. Si voleu pagar, són 0.011 dòlars per cada 1000 Neurones, que és entre un 60% i un 90% més barat que OpenAI. A més, es factura per Neurones, no per tokens, cosa que el fa més rendible per a converses més petites.
Sincerament, crec que aquest mètode de facturació és força just. El nombre de neurones que gastes varia segons si estàs tenint una conversa senzilla o una de molt llarga, però la diferència no és tan escandalosa com amb la facturació basada en tokens.
En aquest punt, potser us preguntareu, com ho feu servir exactament?
Jo mateix vaig passar pel procés, deixa'm que t'ho expliqui.
Registrar i crear tokens d'API
El primer pas és registrar un compte de Cloudflare. Si ja teniu un compte, només cal que inicieu la sessió. Si no, registrar-se és fàcil; només cal que introduïu una adreça de correu electrònic i definiu una contrasenya.
Després d'iniciar la sessió, feu clic a IA al menú esquerre i, a continuació, feu clic a Treballadors IA.

Un cop a dins, veureu un botó per crear un token d'API. Feu-hi clic per generar un token.

Aquí teniu un detall a tenir en compte: el testimoni generat només es pot veure una vegada durant la creació, així que assegureu-vos de desar-lo. La pàgina també us proporcionarà un ID de compte; necessitareu tots dos més endavant.

Després de desar, veureu un exemple d'ús a la part inferior de la pàgina, que és l'ordre curl. Només cal que la substituïu pel vostre ID de compte i APIKEY. L'ordre té aquest aspecte:
curl \
https://api.cloudflare.com/client/v4/accounts/账户ID/ai/run/@cf/模型ID \
-H "Authorization: Bearer 刚才生成的APIKEY" \
-d '{"messages":[{"role":"system","content":"You are a friendly assistant that helps write stories"},{"role":"user","content":"Write a short story about a llama that goes on a journey to find an orange cloud"}]}'Veure la llista de models disponibles
Aleshores sorgeix la pregunta: on trobeu l'ID del model?
Hi ha un botó de document a la part dreta de la pàgina de la IA dels treballadors.

Feu clic a la categoria "Models"; allà trobareu una llista de tots els models.

Trieu el que vulgueu utilitzar i podreu veure l'ID del model fent-hi clic.

Prova de crida del model Kimi 2.6
我选择用kimi2.6来测试一下。把模型ID复制出来,替换到curl命令里,从@cf/开始替换。
La sol·licitud es va enviar i el resultat es va retornar ràpidament.

La velocitat de resposta és realment molt ràpida, més suau del que esperava.
Si he de ser sincer, només volia veure què podia fer aquest crèdit gratuït, i resulta que és força potent. És perfectament adequat per a xatejar diàriament, generar contingut, traduir i programar.
I penseu-hi: això funciona en nodes perimetrals. Implementeu una aplicació d'IA amb usuaris a tot el país o fins i tot al món, i la velocitat de resposta es manté constant, sense haver de preocupar-se pels problemes de desplegament regional. Això és increïblement atractiu per a desenvolupadors individuals i equips petits.
Abans, si volies executar un model, havies de comprar una GPU i construir-ne una de pròpia, cosa que era increïblement cara, o utilitzar una instància de GPU d'un proveïdor de núvol, cosa que era complicada de configurar. Cloudflare, en canvi, ho té tot preparat. Només cal escriure codi per cridar-lo i ell s'encarrega de totes les coses complicades per tu.
Crec que aquesta línia de pensament és correcta. Les capacitats de la IA esdevindran cada cop més com infraestructures com l'aigua i l'electricitat; no cal saber com es genera l'electricitat, només cal connectar-la i utilitzar-la. La IA de Cloudflare Workers porta aquest concepte de "connectar i utilitzar" a un nivell encara més extrem.
Per descomptat, no està exempt d'inconvenients. La quota gratuïta és de només 10000 neurones, de manera que encara haureu de pagar si voleu implementar-la en un entorn de producció amb molt trànsit. A més, tot i que hi ha més de 50 models, en comparació amb l'ecosistema complet d'OpenAI, alguns models de nínxol o més nous no són compatibles.
Però per a projectes personals, petites eines o simplement experiments motivats per la curiositat, crec que és més que suficient.
Aquesta és la meva experiència honesta. Ja que has llegit fins aquí, si t'ha semblat útil, fes-hi un "m'agrada" i comparteix-ho. Si vols rebre actualitzacions primer, també em pots seguir! ⭐
Gràcies per llegir el meu article. Fins la propera.
Bloc d'Hope Chen Weiliang ( https://www.chenweiliang.com/ L'article "Procés de crida a l'API gratuïta d'IA de Cloudflare Workers: registre, configuració i implementació en un sol pas", compartit aquí, us pot ser útil.
Benvingut a compartir l'enllaç d'aquest article:https://www.chenweiliang.com/cwl-34244.html
