Imenik člankov
Pred nekaj dnevi sem delal na osebnem projektu in želel sem zgraditi ...AIAsistent mora klicati velike modele. Ko sem vprašal o ceni, so rekli: vau, vsak klic GPT-4o stane nekaj centov. Če bi naš projekt dejansko deloval, bi samo stroški API-ja znašali več tisoč na mesec.
Spraševali smo se, ali obstaja kakšna cenejša možnost.
Potem smo naleteli na Cloudflare Workers AI. Vedeli smo, da se Cloudflare že prej ukvarja z umetno inteligenco, vendar tega nismo jemali resno, saj smo predvidevali, da bodo velika podjetja zaračunavala za svoje izdelke. Izkazalo se je, vau, vsak dan podarjajo 10000 nevronov brezplačno.
Kaj pomeni 10000 nevronov? To je približno nekaj sto dialogov ali nekaj sto sej generiranja slik na dan. To je več kot dovolj za eno osebo.
Res sem se navdušil in takoj začel raziskovati.
Kaj je umetna inteligenca za delavce v Cloudflareu?

Cloudflare Workers AI, no, mislim, da je to ...PozicioniranjeTo je precej zanimivo. Ne gre le za preprostega ponudnika modelov; gre za platformo za sklepanje z umetno inteligenco, ki deluje na globalnem robnem omrežju Cloudflare. Z robnimi vozlišči v več kot 300 mestih je neverjetno blizu uporabnikom.
Pomislite: ko uporabljate API OpenAI, zahteva najprej gre v ZDA, kjer se obdela in se nato vrne, kar traja od tristo do štiristo milisekund. Cloudflare pa je ponudnik CDN z vozlišči po vsem svetu. Kjerkoli že ste, model izvaja na najbližjem vozlišču.
Tipičen odzivni čas je krajši od 100 milisekund. Ta razlika je za uporabnika opazna.
Resnično kul je, da se hladen zagon izvaja v milisekundah in se samodejno povečuje in zmanjšuje. Tudi pri nenadnem porastu prometa ne bo zaostajal, za razliko od nekaterih platform, ki so neverjetno hitre, ko jih ob 3. uri zjutraj nihče ne uporablja, nato pa se podnevi v času prometnih konic popolnoma sesujejo.
Več kot 50 modelov, ki pokrivajo vse scenarije
Podprtih je tudi veliko modelov; od junija 2026 jih je že več kot 50.
Za dialoge na podlagi besedila so na voljo Llama 3, Llama 4, Mistral, GLM, Qwen, Gemma in Deepseek-r1. Za ustvarjanje slik so na voljo Stable Diffusion, FLUX in Pixverse. Za govor je na voljo Whisper za pretvorbo govora v besedilo, TTS za pretvorbo besedila v govor in celo ustvarjanje videa.
Poleg tega je njegov API zasnovan zelo pregledno. Ne glede na uporabljeni model uporablja enoten vmesnik; spremeniti morate le ime modela.
env.AI.run("ime modela", {…})
Spreminjanje modela z samo eno vrstico kode je zelo priročno.
Izjemno ugodna cena, velikodušna brezplačna kreditna omejitev
Prav tako sem določil cene. Brezplačna dnevna količina je 10000 nevronov, kar je več kot dovolj za osebno eksperimentiranje. Če želite plačati, je to 0.011 USD na 1000 nevronov, kar je od 60 % do 90 % ceneje kot OpenAI. Poleg tega se zaračunava po nevronih in ne po žetonih, zaradi česar je stroškovno učinkovitejši za manjše pogovore.
Iskreno povedano, mislim, da je ta način obračunavanja precej pošten. Število nevronov, ki jih porabite, se razlikuje glede na to, ali imate preprost ali zelo dolg pogovor, vendar razlika ni tako velika kot pri obračunavanju na podlagi žetonov.
Na tej točki se morda sprašujete, kako točno ga uporabljate?
Sam sem šel skozi ta postopek, naj vam povem o njem.
Registracija in ustvarjanje žetonov API
Prvi korak je registracija računa Cloudflare. Če že imate račun, se preprosto prijavite. Če ga nimate, je registracija preprosta; preprosto vnesite e-poštni naslov in nastavite geslo.
Po prijavi kliknite UI v levem meniju in nato kliknite Delavci UI.

Ko ste notri, boste videli gumb za ustvarjanje žetona API. Kliknite ga, da ustvarite žeton.

Tukaj je podrobnost, ki jo je treba upoštevati: ustvarjeni žeton si lahko ogledate le enkrat med ustvarjanjem, zato ga ne pozabite shraniti. Stran vam bo prikazala tudi ID računa; oba boste potrebovali kasneje.

Po shranjevanju boste na dnu strani videli primer uporabe, to je ukaz curl. Zamenjajte ga z ID-jem svojega računa in APIKEY-jem. Ukaz je videti takole:
curl \
https://api.cloudflare.com/client/v4/accounts/账户ID/ai/run/@cf/模型ID \
-H "Authorization: Bearer 刚才生成的APIKEY" \
-d '{"messages":[{"role":"system","content":"You are a friendly assistant that helps write stories"},{"role":"user","content":"Write a short story about a llama that goes on a journey to find an orange cloud"}]}'Oglejte si seznam razpoložljivih modelov
Potem se postavlja vprašanje: kje najdete ID modela?
Na desni strani strani Delavci z umetno inteligenco je gumb za dokument.

Kliknite na kategorijo »Modeli«; tam boste našli seznam vseh modelov.

Izberite tistega, ki ga želite uporabiti, in ID modela si lahko ogledate tako, da kliknete nanj.

Testni klic modela Kimi 2.6
Za testiranje bom uporabil Kimi 2.6. Kopiraj ID modela in ga zamenjaj v ukazu curl, začenši z @cf.
Zahteva je bila poslana in rezultat je bil hitro vrnjen.

Odziv je res zelo hiter, bolj gladek, kot sem pričakoval.
Iskreno povedano, sem želel le videti, kaj zmore ta brezplačni kredit, in izkazalo se je, da je precej zmogljiv. Popolnoma zadostuje za vsakodnevno klepetanje, ustvarjanje vsebin, prevajanje in kodiranje.
In pomislite: ta stvar deluje na robnih vozliščih. Aplikacijo umetne inteligence namestite z uporabniki po vsej državi ali celo svetu, hitrost odziva pa ostane dosledna, ne da bi vam bilo treba skrbeti za regionalne težave z uvajanjem. To je neverjetno privlačno za posamezne razvijalce in majhne ekipe.
Prej ste morali, če ste želeli zagnati model, bodisi kupiti grafični procesor in ga zgraditi sami, kar je bilo neverjetno drago, bodisi uporabiti primerek grafičnega procesorja od ponudnika storitev v oblaku, kar je bilo zapleteno konfigurirati. Cloudflare pa ima vse to urejeno namesto vas. Samo napišete kodo za klic in on namesto vas poskrbi za vse neurejene stvari.
Mislim, da je ta način razmišljanja pravilen. Zmogljivosti umetne inteligence bodo vse bolj podobne infrastrukturi, kot sta voda in elektrika; ni vam treba vedeti, kako se elektrika proizvaja, lahko jo preprosto priključite in uporabljate. Cloudflare Workers AI ta koncept »priklopi in uporabljaj« popelje na še bolj ekstremno raven.
Seveda pa ni brez pomanjkljivosti. Brezplačna kvota je le 10000 nevronov, zato boste morali še vedno plačati, če ga želite namestiti v produkcijskem okolju z velikim prometom. Čeprav je na voljo več kot 50 modelov, v primerjavi s celovitim ekosistemom OpenAI nekateri nišni ali novejši modeli niso podprti.
Ampak za osebne projekte, majhna orodja ali zgolj iz radovednosti gnane eksperimente, mislim, da je to več kot dovolj.
To je moja iskrena izkušnja. Ker ste prebrali do sem, vam je bilo v pomoč, prosim všečkajte in delite. Če želite prvi prejemati posodobitve, mi lahko tudi sledite! ⭐
Hvala, ker ste prebrali moj članek. Se vidimo naslednjič.
Blog Hope Chen Weiliang ( https://www.chenweiliang.com/ Članek »Postopek klica brezplačnega API-ja za umetno inteligenco v storitvi Cloudflare Workers: registracija, konfiguracija in uvedba v enem koraku«, ki je objavljen tukaj, vam bo morda v pomoč.
Dobrodošli, da delite povezavo tega članka:https://www.chenweiliang.com/cwl-34244.html
