Cloudflare Workers AI Free API-kallprosess: Registrering, konfigurasjon og distribusjon i ett trinn

Jeg jobbet med et personlig prosjekt her om dagen, og jeg ønsket å bygge en...AIAssistenten må ringe store modeller. Da jeg spurte om prisen, sa jeg: wow, hver samtale til GPT-4o koster noen få cent. Hvis prosjektet vårt faktisk skulle kjøres, ville API-avgiftene alene komme opp i flere tusen i måneden.

Vi lurte på om det fantes noen billigere måte.

Så kom vi over Cloudflare Workers AI. Vi visste at Cloudflare var involvert i AI-inferens fra før, men vi tok det ikke seriøst, og antok at store selskaper ville ta betalt for produktene sine. Det viser seg, wow, at de gir bort 10 000 nevroner gratis hver dag.

Hva betyr 10 000 nevroner? Det er omtrent noen få hundre dialoger eller noen få hundre bildegenereringsøkter per dag. Det er mer enn nok for én person å leke med.

Jeg ble veldig begeistret og begynte umiddelbart å undersøke det.

Hva er Cloudflare Workers AI?

Cloudflare Workers AI Free API-kallprosess: Registrering, konfigurasjon og distribusjon i ett trinn

Cloudflare Workers AI, vel, jeg tror det er...PosisjoneringDet er ganske interessant. Det er ikke bare en enkel modellleverandør; det er en AI-inferensplattform som kjører på Cloudflares globale edge-nettverk. Med edge-noder i over 300 byer er det utrolig nært brukerne.

Tenk på det: når du bruker OpenAIs API, går forespørselen først til USA, blir behandlet og kommer deretter tilbake, noe som tar tre til fire hundre millisekunder. Cloudflare, derimot, er en CDN-leverandør med noder over hele verden. Uansett hvor du er, kjører den modellen på nærmeste node.

Den typiske responstiden er mindre enn 100 millisekunder. Denne forskjellen er merkbar for brukeren.

Det som er skikkelig kult med den er at kaldstarten er på millisekundnivå, og den skalerer automatisk opp og ned. Selv med en plutselig økning i trafikken, vil den ikke ha forsinkelser, i motsetning til noen plattformer som er utrolig raske når ingen bruker den klokken 3 om natten, men som deretter krasjer fullstendig i rushtiden på dagtid.

50+ modeller, som dekker alle scenarier

Det finnes også mange støttede modeller; per juni 2026 er det allerede mer enn 50.

For tekstbasert dialog er Llama 3, Llama 4, Mistral, GLM, Qwen, Gemma og Deepseek-r1 tilgjengelige. For bildegenerering finnes Stable Diffusion, FLUX og Pixverse. For tale finnes Whisper for tale-til-tekst, TTS for tekst-til-tale og til og med videogenerering.

Dessuten er API-et designet for å være veldig rent. Uansett hvilken modell som brukes, bruker den et enhetlig grensesnitt; du trenger bare å endre modellnavnet.

env.AI.run(“modellnavn”, {…})

Det er så praktisk å endre modellen med bare én kodelinje.

Ekstremt billig pris, generøs gratis kredittgrense

Jeg har også gjort prissettingen. Den gratis daglige kvoten er 10 000 nevroner, som er mer enn nok til personlig eksperimentering. Hvis du vil betale, er det $0.011 per 1000 nevroner, som er 60 % til 90 % billigere enn OpenAI. I tillegg faktureres det av nevroner, ikke med tokens, noe som gjør det mer kostnadseffektivt for mindre samtaler.

Ærlig talt synes jeg denne faktureringsmetoden er ganske rettferdig. Antall nevroner du bruker varierer avhengig av om du har en enkel samtale eller en veldig lang en, men forskjellen er ikke så opprørende som med tokenbasert fakturering.

På dette tidspunktet lurer du kanskje på hvordan du bruker det egentlig?

Jeg gikk gjennom prosessen selv, la meg fortelle deg om den.

Registrer og opprett API-tokener

Det første trinnet er å registrere en Cloudflare-konto. Hvis du allerede har en konto, er det bare å logge inn. Hvis ikke, er det enkelt å registrere seg; bare fyll ut en e-postadresse og angi et passord.

Etter innlogging klikker du på KI i menyen til venstre, og deretter på Arbeidernes KI.

Cloudflare-arbeidere AI-inngangsgrensesnitt

Når du er inne, ser du en knapp for å opprette et API-token. Klikk på den for å generere et token.

Opprett arbeidernes AI API-token

Her er en detalj å merke seg: den genererte tokenen kan bare sees én gang under opprettelsen, så sørg for å lagre den. Siden vil også gi deg en konto-ID; du trenger begge disse senere.

Lagre API-token og konto-ID

Etter at du har lagret, vil du se et brukseksempel nederst på siden, som er curl-kommandoen. Bare erstatt den med konto-ID-en din og APIKEY. Kommandoen ser slik ut:

curl \
  https://api.cloudflare.com/client/v4/accounts/账户ID/ai/run/@cf/模型ID \
  -H "Authorization: Bearer 刚才生成的APIKEY" \
  -d '{"messages":[{"role":"system","content":"You are a friendly assistant that helps write stories"},{"role":"user","content":"Write a short story about a llama that goes on a journey to find an orange cloud"}]}'

Se listen over tilgjengelige modeller

Så oppstår spørsmålet: hvor finner du modell-ID-en?

Det finnes en dokumentknapp på høyre side av siden for arbeidernes AI.

Klikk på dokumentknappen

Klikk på kategorien «Modeller»; der finner du en liste over alle modellene.

Modeller (liste over modeller)

Velg den du vil bruke, og du kan se modell-ID-en ved å klikke på den.

Vis modell-ID

Testkall på Kimi 2.6-modellen

Jeg bruker Kimi 2.6 til testing. Kopier modell-ID-en og erstatt den i curl-kommandoen, og start med @cf.

Forespørselen ble sendt ut, og resultatet kom raskt tilbake.

Testresultater av å kalle kimi2.6

Responshastigheten er faktisk veldig rask, jevnere enn jeg forventet.

For å være ærlig, ville jeg bare se hva denne gratis kreditten kunne gjøre, og det viser seg at den er ganske kraftig. Den er helt tilstrekkelig for hverdagslig chatting, innholdsgenerering, oversettelse og koding.

Og tenk på det: denne tingen kjører på edge-noder. Du distribuerer en AI-applikasjon med brukere over hele landet eller til og med verden, og responshastigheten forblir konsistent, uten å måtte bekymre deg for regionale distribusjonsproblemer. Dette er utrolig attraktivt for individuelle utviklere og små team.

Tidligere, hvis du ville kjøre en modell, måtte du enten kjøpe en GPU og bygge din egen, noe som var utrolig dyrt, eller bruke en GPU-instans fra en skyleverandør, noe som var komplisert å konfigurere. Cloudflare, derimot, har alt pakket inn for deg. Du skriver bare kode for å kalle den, og den håndterer alt det rotete for deg.

Jeg tror denne tankegangen er riktig. AI-kapasiteter vil i økende grad bli som infrastruktur som vann og elektrisitet; du trenger ikke å vite hvordan strømmen genereres, du kan bare koble den til og bruke den. Cloudflare Workers AI tar dette «plug and play»-konseptet til et enda mer ekstremt nivå.

Selvfølgelig er det ikke uten ulemper. Gratiskvoten er bare 10 000 nevroner, så du må fortsatt betale hvis du vil distribuere den i et produksjonsmiljø med høy trafikk. Selv om det finnes over 50 modeller, sammenlignet med OpenAIs omfattende økosystem, støttes ikke noen nisje- eller nyere modeller.

Men for personlige prosjekter, små verktøy eller bare nysgjerrighetsdrevne eksperimenter, tror jeg det er mer enn nok.

Det er min ærlige erfaring. Siden du har lest så langt, så lik og del det hvis du syntes det var nyttig. Hvis du vil motta oppdateringer først, kan du også følge meg! ⭐

Takk for at du leste artikkelen min. Vi sees neste gang.

发表 评论

E-postadressen din vil ikke bli publisert. 必填 项 已 用 * Merkelapp

Artikkelkatalog
Rull til toppen