Artikelkatalog
Jag jobbade med ett personligt projekt häromdagen, och jag ville bygga en...AIAssistenten behöver ringa stora modeller. När jag frågade om priset, wow, varje samtal till GPT-4o kostar några cent. Om vårt projekt faktiskt skulle köras skulle enbart API-avgifterna uppgå till flera tusen i månaden.
Vi undrade om det fanns något billigare sätt.
Sedan stötte vi på Cloudflare Workers AI. Vi visste att Cloudflare var involverat i AI-inferens tidigare, men vi tog det inte på allvar, eftersom vi antog att stora företag skulle ta betalt för sina produkter. Det visar sig, wow, att de ger bort 10 000 neuroner gratis varje dag.
Vad betyder 10 000 neuroner? Det är ungefär några hundra dialoger eller några hundra bildgenereringssessioner per dag. Det är mer än tillräckligt för en person att leka med.
Jag blev väldigt exalterad och började genast undersöka det.
Vad är Cloudflare Workers AI?

Cloudflare Workers AI, ja, jag tror det är...PositioneringDet är ganska intressant. Det är inte bara en enkel modellleverantör; det är en AI-inferensplattform som körs på Cloudflares globala edge-nätverk. Med edge-noder i över 300 städer är det otroligt nära användarna.
Tänk på det: när du använder OpenAI:s API går förfrågan först till USA, bearbetas och kommer sedan tillbaka, vilket tar tre till fyra hundra millisekunder. Cloudflare, å andra sidan, är en CDN-leverantör med noder över hela världen. Var du än befinner dig kör den modellen på närmaste nod.
Den typiska svarstiden är mindre än 100 millisekunder. Denna skillnad är märkbar för användaren.
Det som är riktigt coolt med den är att den kallstartar på millisekundnivå, och den skalar upp och ner automatiskt. Även vid en plötslig trafikökning laggar den inte, till skillnad från vissa plattformar som är otroligt snabba när ingen använder den klockan 3 på morgonen, men sedan kraschar helt under rusningstid på dagtid.
50+ modeller, som täcker alla scenarier
Det finns också många modeller som stöds; från och med juni 2026 finns det redan fler än 50 stycken.
För textbaserad dialog finns Llama 3, Llama 4, Mistral, GLM, Qwen, Gemma och Deepseek-r1 tillgängliga. För bildgenerering finns Stable Diffusion, FLUX och Pixverse. För tal finns Whisper för tal-till-text, TTS för text-till-tal och till och med videogenerering.
Dessutom är dess API utformat för att vara mycket rent. Oavsett vilken modell som används använder den ett enhetligt gränssnitt; du behöver bara ändra modellnamnet.
env.AI.run("modellnamn", {…})
Att ändra modellen med bara en rad kod är så bekvämt.
Extremt billigt pris, generös fri kreditgräns
Jag gjorde också prissättningen. Den kostnadsfria dagliga tilldelningen är 10 000 neuroner, vilket är mer än tillräckligt för personliga experiment. Om du vill betala är det 0.011 dollar per 1 000 neuroner, vilket är 60 % till 90 % billigare än OpenAI. Dessutom faktureras det av neuroner, inte med tokens, vilket gör det mer kostnadseffektivt för mindre samtal.
Ärligt talat tycker jag att den här faktureringsmetoden är ganska rättvis. Antalet neuroner du spenderar varierar beroende på om du har en enkel konversation eller en väldigt lång, men skillnaden är inte lika upprörande som med tokenbaserad fakturering.
Vid det här laget kanske du undrar, hur exakt använder du det?
Jag gick igenom processen själv, låt mig berätta om den.
Registrera och skapa API-tokens
Det första steget är att registrera ett Cloudflare-konto. Om du redan har ett konto loggar du bara in. Om inte är det enkelt att registrera sig; fyll bara i en e-postadress och ange ett lösenord.
Efter inloggning klickar du på AI i vänstermenyn och sedan på Arbetares AI.

När du är inne ser du en knapp för att skapa en API-token. Klicka på den för att generera en token.

Här är en detalj att notera: den genererade token kan bara ses en gång under skapandet, så se till att spara den. Sidan kommer också att ge dig ett konto-ID; du behöver båda dessa senare.

Efter att du har sparat ser du ett exempel på användning längst ner på sidan, vilket är kommandot curl. Ersätt det bara med ditt konto-ID och APIKEY. Kommandot ser ut så här:
curl \
https://api.cloudflare.com/client/v4/accounts/账户ID/ai/run/@cf/模型ID \
-H "Authorization: Bearer 刚才生成的APIKEY" \
-d '{"messages":[{"role":"system","content":"You are a friendly assistant that helps write stories"},{"role":"user","content":"Write a short story about a llama that goes on a journey to find an orange cloud"}]}'Se listan över tillgängliga modeller
Då uppstår frågan: var hittar man modell-ID:t?
Det finns en dokumentknapp på höger sida av sidan Arbetarnas AI.

Klicka på kategorin "Modeller"; där hittar du en lista över alla modeller.

Välj den du vill använda, så kan du se modell-ID:t genom att klicka på den.

Testanrop av Kimi 2.6-modellen
我选择用kimi2.6来测试一下。把模型ID复制出来,替换到curl命令里,从@cf/开始替换。
Förfrågan skickades ut och resultatet returnerades snabbt.

Svarshastigheten är verkligen mycket snabb, smidigare än jag förväntade mig.
Ärligt talat ville jag bara se vad den här gratiskrediten kunde göra, och det visade sig att den är ganska kraftfull. Den är helt tillräcklig för vardaglig chatt, innehållsgenerering, översättning och kodning.
Och tänk på det: den här grejen körs på edge-noder. Du driftsätter en AI-applikation med användare över hela landet eller till och med världen, och svarshastigheten förblir jämn, utan att du behöver oroa dig för regionala driftsättningsproblem. Detta är otroligt attraktivt för enskilda utvecklare och små team.
Tidigare, om man ville köra en modell, var man antingen tvungen att köpa en GPU och bygga en egen, vilket var otroligt dyrt, eller använda en GPU-instans från en molnleverantör, vilket var komplicerat att konfigurera. Cloudflare, å andra sidan, har allt för dig. Du skriver bara kod för att anropa den, och den hanterar allt det röriga åt dig.
Jag tror att det här tankesättet är korrekt. AI-kapacitet kommer i allt högre grad att likna infrastruktur som vatten och elektricitet; du behöver inte veta hur elektriciteten genereras, du kan bara koppla in den och använda den. Cloudflare Workers AI tar detta "plug and play"-koncept till en ännu mer extrem nivå.
Naturligtvis är det inte utan nackdelar. Den kostnadsfria kvoten är bara 10 000 neuroner, så du måste fortfarande betala om du vill driftsätta det i en produktionsmiljö med hög trafik. Även om det finns över 50 modeller, jämfört med OpenAI:s omfattande ekosystem, stöds inte vissa nisch- eller nyare modeller.
Men för personliga projekt, små verktyg eller bara nyfikenhetsdrivna experiment, tror jag att det räcker mer än väl.
Det är min ärliga erfarenhet. Eftersom du har läst så här långt, om du tyckte att det var hjälpsamt, gilla och dela det gärna. Om du vill få uppdateringar först kan du också följa mig! ⭐
Tack för att du läste min artikel. Vi ses nästa gång.
Hope Chen Weiliang blogg ( https://www.chenweiliang.com/ Artikeln "Cloudflare Workers AI Free API Call Process: Registration, Configuration, and Deployment in One Step", som delas här, kan vara till hjälp för dig.
Välkommen att dela länken till denna artikel:https://www.chenweiliang.com/cwl-34244.html
