Adresář článků
Nedávno jsem pracoval na osobním projektu a chtěl jsem si postavit...AIAsistent potřebuje volat velké modely. Když jsem se zeptal na cenu, wow, každé volání do GPT-4o stojí pár centů. Pokud by náš projekt skutečně běžel, jen poplatky za API by se vyšplhaly na několik tisíc měsíčně.
Přemýšleli jsme, jestli existuje nějaká levnější cesta.
Pak jsme narazili na Cloudflare Workers AI. Věděli jsme, že Cloudflare se již dříve zabývá inferencí umělé inteligence, ale nebrali jsme to vážně, protože jsme předpokládali, že velké společnosti si za své produkty budou účtovat poplatky. Ukázalo se, že každý den rozdávají 10 000 neuronů zdarma.
Co znamená 10 000 neuronů? Je to zhruba několik stovek dialogů nebo několik stovek generování obrazu denně. To je pro jednoho člověka více než dost.
Opravdu jsem se nadchl a hned jsem to začal zkoumat.
Co je umělá inteligence v Cloudflare Workers?

Cloudflare Workers AI, no, myslím, že je to...PolohováníTo je docela zajímavé. Není to jen jednoduchý poskytovatel modelů; je to platforma pro inferenci s využitím umělé inteligence běžící na globální edge síti Cloudflare. S edge uzly ve více než 300 městech je neuvěřitelně blízko uživatelům.
Zamyslete se nad tím: když používáte API OpenAI, požadavek nejprve jde do USA, je zpracován a poté se vrátí, což trvá tři až čtyři sta milisekund. Cloudflare je naproti tomu poskytovatel CDN s uzly po celém světě. Ať už jste kdekoli, model spouští na nejbližším uzlu.
Typická doba odezvy je kratší než 100 milisekund. Tento rozdíl je pro uživatele znatelný.
Co je na něm opravdu skvělé, je to, že jeho studený start je na úrovni milisekund a automaticky se škáluje nahoru a dolů. Ani při náhlém nárůstu provozu se nezastaví, na rozdíl od některých platforem, které jsou neuvěřitelně rychlé, když je ve 3 hodiny ráno nikdo nepoužívá, ale pak se během denní špičky úplně zhroutí.
Více než 50 modelů, pokrývajících všechny scénáře
Existuje také mnoho podporovaných modelů; k červnu 2026 jich je již více než 50.
Pro textové dialogy jsou k dispozici programy Llama 3, Llama 4, Mistral, GLM, Qwen, Gemma a Deepseek-r1. Pro generování obrázků jsou k dispozici programy Stable Diffusion, FLUX a Pixverse. Pro řeč je k dispozici Whisper pro převod řeči na text, TTS pro převod textu na řeč a dokonce i generování videa.
Navíc je jeho API navrženo tak, aby bylo velmi čisté. Bez ohledu na použitý model používá jednotné rozhraní; stačí změnit pouze název modelu.
env.AI.run(„název modelu“, {…})
Změna modelu pouze jedním řádkem kódu je velmi pohodlná.
Extrémně nízká cena, štědrý bezplatný úvěrový limit
Také jsem stanovil ceny. Denní limit zdarma je 10 000 neuronů, což je pro osobní experimentování více než dost. Pokud chcete platit, je to 0.011 dolaru za 1 000 neuronů, což je o 60 % až 90 % levnější než OpenAI. Navíc je účtováno za neurony, nikoli za tokeny, takže je to pro menší konverzace cenově výhodnější.
Upřímně si myslím, že tato metoda fakturace je docela férová. Počet neuronů, které utratíte, se liší v závislosti na tom, zda vedete jednoduchý nebo velmi dlouhý rozhovor, ale rozdíl není tak propastný jako u fakturace založené na tokenech.
V tuto chvíli si možná říkáte, jak přesně ho používáte?
Sám jsem si tím procesem prošel, tak vám o tom povím.
Registrace a vytvoření tokenů API
Prvním krokem je registrace účtu Cloudflare. Pokud již účet máte, stačí se přihlásit. Pokud ne, registrace je snadná; stačí vyplnit e-mailovou adresu a nastavit heslo.
Po přihlášení klikněte v levém menu na AI a poté klikněte na Workers AI.

Uvnitř uvidíte tlačítko pro vytvoření tokenu API. Kliknutím na něj token vygenerujete.

Zde je třeba poznamenat detail: vygenerovaný token lze zobrazit pouze jednou během vytváření, proto si ho nezapomeňte uložit. Na stránce se vám také zobrazí ID účtu; obojí budete později potřebovat.

Po uložení se v dolní části stránky zobrazí příklad použití, kterým je příkaz curl. Stačí ho nahradit ID vašeho účtu a klíčem API. Příkaz vypadá takto:
curl \
https://api.cloudflare.com/client/v4/accounts/账户ID/ai/run/@cf/模型ID \
-H "Authorization: Bearer 刚才生成的APIKEY" \
-d '{"messages":[{"role":"system","content":"You are a friendly assistant that helps write stories"},{"role":"user","content":"Write a short story about a llama that goes on a journey to find an orange cloud"}]}'Zobrazit seznam dostupných modelů
Pak vyvstává otázka: kde najdete ID modelu?
Na pravé straně stránky Workers AI je tlačítko dokumentu.

Klikněte na kategorii „Modely“; tam najdete seznam všech modelů.

Vyberte si ten, který chcete použít, a kliknutím na něj zobrazíte ID modelu.

Testovací volání modelu Kimi 2.6
Pro testování použiji Kimi 2.6. Zkopíruji ID modelu a nahradím ho v příkazu curl, počínaje @cf.
Žádost byla odeslána a výsledek byl rychle vrácen.

Rychlost odezvy je opravdu velmi rychlá, plynulejší, než jsem očekával.
Abych byl upřímný, jen jsem chtěl zjistit, co tenhle kredit zdarma dokáže, a ukázalo se, že je docela výkonný. Je naprosto dostačující pro každodenní chatování, tvorbu obsahu, překlad a kódování.
A zamyslete se nad tím: tahle věc běží na okrajových uzlech. Nasadíte aplikaci s umělou inteligencí s uživateli po celé zemi nebo dokonce po celém světě a rychlost odezvy zůstává konzistentní, aniž byste se museli starat o problémy s regionálními nasazeními. To je neuvěřitelně atraktivní pro jednotlivé vývojáře a malé týmy.
Dříve, pokud jste chtěli spustit model, museli jste si buď koupit GPU a vytvořit si vlastní, což bylo neuvěřitelně drahé, nebo použít instanci GPU od cloudového poskytovatele, což bylo složité na konfiguraci. Cloudflare na druhou stranu to všechno zařídí za vás. Stačí napsat kód pro jeho volání a Cloudflare se postará o všechny ty nepříjemné věci za vás.
Myslím, že tento způsob uvažování je správný. Schopnosti umělé inteligence se budou stále více podobat infrastruktuře, jako je voda a elektřina; nemusíte vědět, jak se elektřina vyrábí, stačí ji zapojit a používat. Cloudflare Workers AI posouvá tento koncept „plug and play“ na ještě extrémnější úroveň.
Samozřejmě to není bez nevýhod. Bezplatná kvóta je pouze 10 000 neuronů, takže pokud chcete aplikaci nasadit v produkčním prostředí s vysokou návštěvností, budete muset stále platit. Ačkoli existuje více než 50 modelů, ve srovnání s komplexním ekosystémem OpenAI nejsou některé specializované nebo novější modely podporovány.
Ale pro osobní projekty, malé nástroje nebo jen experimenty ze zvědavosti si myslím, že je to více než dost.
To je moje upřímná zkušenost. Jelikož jste se dočetli až sem, pokud vám to pomohlo, dejte mi prosím like a sdílejte to. Pokud chcete dostávat novinky jako první, můžete mě také sledovat! ⭐
Děkuji za přečtení mého článku. Uvidíme se příště.
Blog Hope Chen Weiliang ( https://www.chenweiliang.com/ Článek „Cloudflare Workers AI Free API Call Process: Registration, Configuration, and Deployment in One Step“ sdílený zde by vám mohl být užitečný.
Vítejte u sdílení odkazu na tento článek:https://www.chenweiliang.com/cwl-34244.html
