Articulu Directory
Travagliava nant'à un prughjettu persunale l'altru ghjornu, è vulia custruisce un...AIL'assistente hà bisognu di chjamà i mudelli grossi. Quandu aghju dumandatu u prezzu, wow, ogni chjama à GPT-4o costa uni pochi di centesimi. Sè u nostru prughjettu fussi veramente in corsu, i tariffi API solu ammontarianu à parechji millaie à u mese.
Ci dumandavamu s'ellu ci era un modu più economicu.
Dopu avemu scupertu Cloudflare Workers AI. Sapìamu chì Cloudflare era implicatu in l'inferenza AI prima, ma ùn l'avemu micca pigliatu in seriu, supponendu chì e grande cumpagnie facianu pagà per i so prudutti. Si scopre, wow, stanu regalendu 10000 Neuroni ogni ghjornu.
Chì significa 10000 Neuroni ? Si tratta di circa uni pochi di centinaie di dialoghi o uni pochi di centinaie di sessioni di generazione d'imagine à ghjornu. Hè più chè abbastanza per una persona per ghjucà.
Mi sò entusiasmatu assai è aghju subitu cuminciatu à fà ricerche.
Chì ghjè l'IA di i travagliadori di Cloudflare?

L'IA di i travagliadori di Cloudflare, bè, pensu chì sia...PusizionamentuHè abbastanza interessante. Ùn hè micca solu un simplice fornitore di mudelli; hè una piattaforma d'inferenza AI chì funziona nantu à a rete globale di Cloudflare. Cù nodi di punta in più di 300 cità, hè incredibilmente vicinu à l'utilizatori.
Pensateci: quandu aduprate l'API d'OpenAI, a dumanda và prima in i Stati Uniti, hè trattata, è dopu torna, pigliendu da trè à quattru centu millisecondi. Cloudflare, invece, hè un fornitore CDN cù nodi in tuttu u mondu. Induve site, esegue u mudellu nantu à u nodu u più vicinu.
U tempu di risposta tipicu hè menu di 100 millisecondi. Sta differenza hè percepibile per l'utilizatore.
Ciò chì hè veramente bellu hè chì u so principiu à fretu hè di livellu di millisecondi, è si scala automaticamente in su è in giù. Ancu cù un aumentu improvvisu di u trafficu, ùn serà micca in ritardu, à u cuntrariu di alcune piattaforme chì sò incredibilmente veloci quandu nimu l'utiliza à 3 ore di mane, ma poi si bloccanu cumpletamente durante l'ore di punta di u ghjornu.
Più di 50 mudelli, chì coprenu tutti i scenarii
Ci sò ancu parechji mudelli supportati; à ghjugnu 2026, ci sò digià più di 50.
Per i dialoghi basati nantu à u testu, Llama 3, Llama 4, Mistral, GLM, Qwen, Gemma, è Deepseek-r1 sò tutti dispunibili. Per a generazione d'imagine, ci sò Stable Diffusion, FLUX, è Pixverse. Per a voce, ci hè Whisper per a cunversione di voce in testu, TTS per a cunversione di testu in voce, è ancu a generazione di video.
Inoltre, a so API hè cuncipita per esse assai pulita. Indipendentemente da u mudellu utilizatu, usa una interfaccia unificata; basta à cambià u nome di u mudellu.
env.AI.run ("nome di u mudellu", {…})
Cambià u mudellu cù una sola linea di codice hè cusì cunveniente.
Prezzu estremamente bassu, limite di creditu gratuitu generosu
Aghju ancu fattu i prezzi. L'indennità ghjurnata gratuita hè di 10000 Neuroni, chì hè più chè abbastanza per a sperimentazione persunale. Sè vo vulete pagà, hè $ 0.011 per 1000 Neuroni, chì hè da 60% à 90% più economicu chè OpenAI. Inoltre, hè fatturatu da Neuroni, micca da gettoni, ciò chì u rende più economicu per e conversazioni più chjuche.
Sinceramente, pensu chì questu metudu di fatturazione sia abbastanza ghjustu. U numeru di Neuroni chì spendete varieghja secondu s'è vo avete una cunversazione simplice o una assai longa, ma a differenza ùn hè micca cusì scandalosa cum'è cù a fatturazione basata nantu à i gettoni.
À questu puntu, vi puderete dumandà, cumu si usa esattamente?
Aghju passatu per u prucessu stessu, lasciami cuntà ti ne.
Registratevi è create gettoni API
U primu passu hè di registrà un contu Cloudflare. Sè vo avete digià un contu, basta à cunnettassi. Altrimenti, a registrazione hè faciule; basta à inserisce un indirizzu email è stabilisce una password.
Dopu avè cunnessu, cliccate nant'à IA in u menù di manca, dopu cliccate nant'à IA di i travagliadori.

Una volta dentru, viderete un buttone per creà un token API. Cliccateci per generà un token.

Eccu un dettagliu da nutà: u gettone generatu pò esse vistu solu una volta durante a creazione, dunque assicuratevi di salvallu. A pagina vi darà ancu un ID di contu; averete bisognu di tramindui dopu.

Dopu avè salvatu, viderete un esempiu d'usu in fondu à a pagina, chì hè u cumandamentu curl. Basta à rimpiazzallu cù u vostru ID di contu è APIKEY. U cumandamentu s'assumiglia à questu:
curl \
https://api.cloudflare.com/client/v4/accounts/账户ID/ai/run/@cf/模型ID \
-H "Authorization: Bearer 刚才生成的APIKEY" \
-d '{"messages":[{"role":"system","content":"You are a friendly assistant that helps write stories"},{"role":"user","content":"Write a short story about a llama that goes on a journey to find an orange cloud"}]}'Vede a lista di i mudelli dispunibili
Allora a quistione nasce: induve si trova l'ID di u mudellu?
Ci hè un buttone di documentu à a diritta di a pagina IA di i travagliadori.

Cliccate nant'à a categuria "Modelli"; hè quì chì truverete una lista di tutti i mudelli.

Sceglite quellu chì vulete aduprà, è pudete vede l'ID di u mudellu clicchendu nantu à ellu.

Pruva di chjama di u mudellu Kimi 2.6
Adupraraghju Kimi 2.6 per e prove. Copiate l'ID di u mudellu è rimpiazzatelu in u cumandamentu curl, cuminciendu cù @cf.
A dumanda hè stata mandata, è u risultatu hè statu restituitu rapidamente.

A velocità di risposta hè veramente assai rapida, più fluida di ciò chì mi aspettavu.
À esse onestu, vulia solu vede ciò chì stu creditu gratuitu puderia fà, è si scopre chì hè abbastanza putente. Hè perfettamente adeguatu per e chat di ogni ghjornu, a generazione di cuntenutu, a traduzzione è a codificazione.
È pensateci: sta cosa funziona nantu à i nodi di punta. Implementate una applicazione IA cù utilizatori in tuttu u paese o ancu in u mondu sanu, è a velocità di risposta ferma consistente, senza avè da preoccupassi di prublemi di implementazione regiunale. Questu hè incredibilmente attraente per i sviluppatori individuali è e piccule squadre.
Prima, sè vulete eseguisce un mudellu, duviate cumprà una GPU è custruisce a vostra propria, chì era incredibilmente cara, o aduprà una istanza GPU da un fornitore di cloud, chì era cumplicatu da cunfigurà. Cloudflare, invece, hà tuttu imballatu per voi. Basta à scrive u codice per chjamallu, è ellu gestisce tutte e cose complicate per voi.
Credu chì sta linea di pensamentu sia curretta. E capacità di l'IA diventeranu sempre di più cum'è infrastrutture cum'è l'acqua è l'elettricità; ùn avete micca bisognu di sapè cumu l'elettricità hè generata, pudete solu cunnettela è aduprà. Cloudflare Workers AI porta stu cuncettu "plug and play" à un livellu ancu più estremu.
Benintesa, ùn hè micca senza svantaghji. A quota gratuita hè solu di 10000 Neuroni, dunque duverete sempre pagà se vulete implementallu in un ambiente di pruduzzione cù un trafficu elevatu. Inoltre, mentre ci sò più di 50 mudelli, paragunatu à l'ecosistema cumpletu di OpenAI, alcuni mudelli di nicchia o più recenti ùn sò micca supportati.
Ma per prughjetti persunali, picculi strumenti, o solu esperimenti motivati da a curiosità, pensu chì sia più chè abbastanza.
Questa hè a mo sperienza onesta. Siccomu avete lettu finu à quì, sè l'avete trovu utile, per piacè lasciate un "mi piace" è spartitelu. Sè vo vulete riceve prima l'aghjurnamenti, pudete ancu seguità mi! ⭐
Grazie per avè lettu u mo articulu. À a prossima volta.
Hope Chen Weiliang Blog ( https://www.chenweiliang.com/ L'articulu "Cloudflare Workers AI Free API Call Process: Registrazione, Cunfigurazione è Implementazione in un Solu Passu", spartutu quì, pò esse utile per voi.
Benvenuti à sparte u ligame di stu articulu:https://www.chenweiliang.com/cwl-34244.html
