Processo di chiamata API gratuito di Cloudflare Workers AI: registrazione, configurazione e implementazione in un unico passaggio

L'altro giorno stavo lavorando a un progetto personale e volevo costruire un...AIL'assistente deve richiamare modelli complessi. Quando ho chiesto informazioni sul prezzo, sono rimasto sorpreso: ogni chiamata a GPT-4o costa pochi centesimi. Se il nostro progetto dovesse effettivamente essere realizzato, i soli costi dell'API ammonterebbero a diverse migliaia di dollari al mese.

Ci chiedevamo se esistesse un modo più economico.

Poi ci siamo imbattuti in Cloudflare Workers AI. Sapevamo già che Cloudflare si occupava di inferenza AI, ma non l'avevamo presa sul serio, presumendo che le grandi aziende avrebbero fatto pagare i loro prodotti. Ebbene, a quanto pare, stanno regalando 10000 neuroni ogni giorno.

Cosa significano 10000 neuroni? Sono all'incirca un centinaio di dialoghi o un centinaio di sessioni di generazione di immagini al giorno. Più che sufficienti per una persona che voglia semplicemente divertirsi.

Mi sono entusiasmato molto e ho subito iniziato a fare ricerche.

Che cos'è Cloudflare Workers AI?

Processo di chiamata API gratuito di Cloudflare Workers AI: registrazione, configurazione e implementazione in un unico passaggio

Cloudflare Workers AI, beh, penso che sia...PosizionamentoÈ davvero interessante. Non si tratta di un semplice fornitore di modelli; è una piattaforma di inferenza AI che opera sulla rete edge globale di Cloudflare. Con nodi edge in oltre 300 città, è incredibilmente vicina agli utenti.

Pensaci: quando usi l'API di OpenAI, la richiesta va prima negli Stati Uniti, viene elaborata e poi torna indietro, impiegando dai tre ai quattrocento millisecondi. Cloudflare, d'altro canto, è un provider CDN con nodi in tutto il mondo. Ovunque tu sia, esegue il modello sul nodo più vicino.

Il tempo di risposta tipico è inferiore a 100 millisecondi. Questa differenza è percepibile dall'utente.

La cosa davvero interessante è che l'avvio a freddo è a livello di millisecondi e si adatta automaticamente alle esigenze. Anche in caso di un improvviso aumento del traffico, non si verificano rallentamenti, a differenza di alcune piattaforme che sono incredibilmente veloci quando nessuno le utilizza alle 3 del mattino, ma poi si bloccano completamente durante le ore di punta del giorno.

Oltre 50 modelli, che coprono tutti gli scenari

Sono inoltre disponibili numerosi modelli supportati; a giugno 2026, se ne contavano già più di 50.

Per i dialoghi testuali sono disponibili Llama 3, Llama 4, Mistral, GLM, Qwen, Gemma e Deepseek-r1. Per la generazione di immagini, ci sono Stable Diffusion, FLUX e Pixverse. Per il parlato, ci sono Whisper per la conversione da parlato a testo, TTS per la sintesi vocale e persino la generazione di video.

Inoltre, la sua API è progettata per essere molto pulita. Indipendentemente dal modello utilizzato, usa un'interfaccia unificata; è sufficiente cambiare il nome del modello.

env.AI.run(“nome del modello”, {…})

Cambiare il modello con una sola riga di codice è davvero comodo.

Prezzo estremamente conveniente, limite di credito gratuito generoso

Ho anche calcolato i prezzi. La quota giornaliera gratuita è di 10000 Neuroni, più che sufficiente per la sperimentazione personale. Se si desidera pagare, il costo è di 0.011 dollari ogni 1000 Neuroni, ovvero dal 60% al 90% in meno rispetto a OpenAI. Inoltre, la fatturazione avviene per Neuroni e non per token, il che lo rende più conveniente per conversazioni di piccole dimensioni.

Sinceramente, penso che questo metodo di fatturazione sia abbastanza equo. Il numero di Neuroni che si spendono varia a seconda che si tratti di una conversazione semplice o di una molto lunga, ma la differenza non è così esorbitante come con la fatturazione basata sui token.

A questo punto, potreste chiedervi: come si usa esattamente?

Ho vissuto personalmente questa esperienza, quindi ve la racconto.

Registrati e crea token API

Il primo passo è registrare un account Cloudflare. Se hai già un account, accedi semplicemente. Altrimenti, la registrazione è facile: basta inserire un indirizzo email e impostare una password.

Dopo aver effettuato l'accesso, fai clic su AI nel menu a sinistra, quindi fai clic su Workers AI.

Interfaccia di inserimento IA per i lavoratori di Cloudflare

 

Una volta all'interno, vedrai un pulsante per creare un token API. Cliccaci sopra per generare un token.

Crea un token API di Workers AI

Ecco un dettaglio importante: il token generato è visibile solo una volta durante la creazione, quindi assicurati di salvarlo. La pagina ti fornirà anche un ID account; avrai bisogno di entrambi in seguito.

Salva il token API e l'ID dell'account

Dopo aver salvato, vedrai un esempio di utilizzo in fondo alla pagina, ovvero il comando curl. Ti basterà sostituirlo con il tuo ID account e la tua APIKEY. Il comando ha questo aspetto:

curl \
  https://api.cloudflare.com/client/v4/accounts/账户ID/ai/run/@cf/模型ID \
  -H "Authorization: Bearer 刚才生成的APIKEY" \
  -d '{"messages":[{"role":"system","content":"You are a friendly assistant that helps write stories"},{"role":"user","content":"Write a short story about a llama that goes on a journey to find an orange cloud"}]}'

Visualizza l'elenco dei modelli disponibili

Sorge quindi spontanea la domanda: dove si trova l'ID del modello?

Nella pagina Workers AI è presente un pulsante per i documenti sul lato destro.

Fare clic sul pulsante del documento

Fai clic sulla categoria "Modelli"; lì troverai un elenco di tutti i modelli.

Modelli (Elenco dei modelli)

Scegli quello che desideri utilizzare e potrai visualizzare l'ID del modello cliccandoci sopra.

Visualizza ID modello

Prova di chiamata del modello Kimi 2.6

我选择用kimi2.6来测试一下。把模型ID复制出来,替换到curl命令里,从@cf/开始替换。

La richiesta è stata inviata e il risultato è stato restituito rapidamente.

Risultati del test della chiamata a kimi2.6

La velocità di risposta è effettivamente molto elevata, più fluida di quanto mi aspettassi.

A dire il vero, volevo solo vedere cosa si potesse fare con questo credito gratuito, e si è rivelato piuttosto potente. È perfettamente adeguato per chattare quotidianamente, creare contenuti, tradurre e programmare.

E pensateci: questo sistema funziona su nodi periferici. Potete implementare un'applicazione di intelligenza artificiale con utenti in tutto il paese o persino nel mondo, e la velocità di risposta rimarrà costante, senza dovervi preoccupare di problemi di implementazione a livello regionale. Questo è incredibilmente interessante per i singoli sviluppatori e i piccoli team.

In precedenza, per eseguire un modello, bisognava acquistare una GPU e costruirne una propria, il che risultava incredibilmente costoso, oppure utilizzare un'istanza GPU di un provider cloud, la cui configurazione era complessa. Cloudflare, invece, si occupa di tutto. Basta scrivere il codice per richiamarlo e Cloudflare gestisce automaticamente tutti gli aspetti più complessi.

Credo che questo ragionamento sia corretto. Le capacità dell'IA diventeranno sempre più simili alle infrastrutture come l'acqua e l'elettricità: non c'è bisogno di sapere come viene generata l'elettricità, basta collegarla e usarla. Cloudflare Workers AI porta questo concetto di "plug and play" a un livello ancora più estremo.

Certo, non è esente da svantaggi. La quota gratuita è di soli 10000 neuroni, quindi sarà comunque necessario pagare se si desidera implementarlo in un ambiente di produzione con traffico elevato. Inoltre, sebbene siano disponibili oltre 50 modelli, rispetto all'ecosistema completo di OpenAI, alcuni modelli di nicchia o più recenti non sono supportati.

Ma per progetti personali, piccoli strumenti o semplici esperimenti dettati dalla curiosità, credo che sia più che sufficiente.

Questa è la mia esperienza personale. Dato che hai letto fin qui, se l'hai trovato utile, metti mi piace e condividilo. Se vuoi ricevere aggiornamenti in anteprima, puoi anche seguirmi! ⭐

Grazie per aver letto il mio articolo. Alla prossima.

Speranza Chen Weiliang Blog ( https://www.chenweiliang.com/ L'articolo "Processo di chiamata API gratuita di Cloudflare Workers AI: registrazione, configurazione e implementazione in un unico passaggio", condiviso qui, potrebbe esservi utile.

Benvenuti a condividere il link di questo articolo:https://www.chenweiliang.com/cwl-34244.html

Per scoprire altri trucchi nascosti🔑, unisciti al nostro canale Telegram!

Condividi e metti mi piace se ti piace! Le tue condivisioni e i tuoi Mi piace sono la nostra continua motivazione!

 

发表 评论

Il tuo indirizzo email non verrà pubblicato. 必填 项 已 用 * 标注

Directory articoli
Scorrere fino a Top