Processus d'appel d'API gratuit Cloudflare Workers AI : inscription, configuration et déploiement en une seule étape

L'autre jour, je travaillais sur un projet personnel et je voulais construire un...AIL'assistant doit faire appel à des modèles complexes. Quand j'ai demandé le prix, j'ai été surpris : chaque appel à GPT-4 coûte quelques centimes. Si notre projet était mis en œuvre, les frais d'API à eux seuls s'élèveraient à plusieurs milliers d'euros par mois.

Nous nous demandions s'il existait une solution moins coûteuse.

Puis nous avons découvert Cloudflare Workers AI. Nous savions que Cloudflare travaillait déjà sur l'inférence par IA, mais nous n'y avions pas prêté attention, pensant que les grandes entreprises faisaient payer leurs produits. Et là, surprise ! Ils offrent 10 000 neurones gratuitement chaque jour.

Que représentent 10 000 neurones ? Cela correspond à environ quelques centaines de dialogues ou de sessions de génération d'images par jour. C'est largement suffisant pour s'amuser.

J'étais vraiment enthousiaste et j'ai immédiatement commencé à faire des recherches à ce sujet.

Qu'est-ce que Cloudflare Workers AI ?

Processus d'appel d'API gratuit Cloudflare Workers AI : inscription, configuration et déploiement en une seule étape

L'IA des travailleurs de Cloudflare, enfin, je pense que c'est...PositionnementC'est très intéressant. Il ne s'agit pas d'un simple fournisseur de modèles ; c'est une plateforme d'inférence IA déployée sur le réseau périphérique mondial de Cloudflare. Avec des nœuds périphériques dans plus de 300 villes, elle est incroyablement proche des utilisateurs.

Réfléchissez-y : lorsque vous utilisez l’API d’OpenAI, la requête est d’abord envoyée aux États-Unis, traitée, puis renvoyée, ce qui prend entre 300 et 400 millisecondes. Cloudflare, en revanche, est un fournisseur de CDN disposant de nœuds partout dans le monde. Où que vous soyez, il exécute le modèle sur le nœud le plus proche.

Le temps de réponse typique est inférieur à 100 millisecondes. Cette différence est perceptible pour l'utilisateur.

Ce qui est vraiment génial, c'est que son démarrage à froid est instantané (de l'ordre de la milliseconde) et qu'il s'adapte automatiquement aux variations de charge. Même en cas de pic de trafic soudain, il ne rame pas, contrairement à certaines plateformes qui sont incroyablement rapides quand personne ne les utilise à 3 h du matin, mais qui plantent complètement aux heures de pointe.

Plus de 50 modèles, couvrant tous les scénarios

De nombreux modèles sont également pris en charge ; en juin 2026, on en comptait déjà plus de 50.

Pour les dialogues textuels, Llama 3, Llama 4, Mistral, GLM, Qwen, Gemma et Deepseek-r1 sont disponibles. Pour la génération d'images, on trouve Stable Diffusion, FLUX et Pixverse. Enfin, pour la parole, Whisper permet la transcription vocale, TTS la synthèse vocale et il est même possible de générer des vidéos.

De plus, son API est conçue pour être très claire. Quel que soit le modèle utilisé, elle emploie une interface unifiée ; il suffit de modifier le nom du modèle.

env.AI.run(“nom du modèle”, {…})

Modifier le modèle avec une seule ligne de code, c'est tellement pratique.

Prix ​​extrêmement bas, limite de crédit gratuite généreuse

J'ai également établi les tarifs. L'allocation quotidienne gratuite est de 10 000 neurones, ce qui est largement suffisant pour des expérimentations personnelles. Si vous souhaitez payer, le tarif est de 0.011 $ pour 1 000 neurones, soit 60 % à 90 % moins cher qu'OpenAI. De plus, la facturation se fait au neurone et non au jeton, ce qui est plus avantageux pour les conversations de courte durée.

Honnêtement, je trouve ce mode de facturation plutôt équitable. Le nombre de Neurones dépensés varie selon la durée de la conversation, mais la différence est bien moins importante qu'avec la facturation par jetons.

À ce stade, vous vous demandez peut-être : comment l'utiliser exactement ?

J'ai moi-même suivi ce processus, laissez-moi vous en parler.

S'inscrire et créer des jetons API

La première étape consiste à créer un compte Cloudflare. Si vous en possédez déjà un, connectez-vous. Sinon, l'inscription est simple : il vous suffit de renseigner une adresse e-mail et de définir un mot de passe.

Après vous être connecté, cliquez sur IA dans le menu de gauche, puis sur IA des travailleurs.

Interface d'entrée IA des travailleurs de Cloudflare

 

Une fois connecté, vous verrez un bouton permettant de créer un jeton API. Cliquez dessus pour générer un jeton.

Jeton d'API Create Workers AI

Voici un détail important : le jeton généré n’est visible qu’une seule fois lors de la création du compte. Veillez donc à le sauvegarder. La page vous fournira également un identifiant de compte ; vous aurez besoin des deux ultérieurement.

Enregistrez le jeton API et l'identifiant du compte.

Après avoir enregistré, vous verrez un exemple d'utilisation en bas de la page : la commande curl. Remplacez-la simplement par votre ID de compte et votre clé API. La commande ressemble à ceci :

curl \
  https://api.cloudflare.com/client/v4/accounts/账户ID/ai/run/@cf/模型ID \
  -H "Authorization: Bearer 刚才生成的APIKEY" \
  -d '{"messages":[{"role":"system","content":"You are a friendly assistant that helps write stories"},{"role":"user","content":"Write a short story about a llama that goes on a journey to find an orange cloud"}]}'

Consultez la liste des modèles disponibles

La question se pose alors : où trouver l'identifiant du modèle ?

Un bouton « Document » se trouve sur le côté droit de la page Workers AI.

Cliquez sur le bouton du document

Cliquez sur la catégorie « Modèles » ; vous y trouverez la liste de tous les modèles.

Modèles (Liste des modèles)

Choisissez celui que vous souhaitez utiliser, et vous pourrez voir l'identifiant du modèle en cliquant dessus.

ID du modèle de vue

Test d'appel du modèle Kimi 2.6

我选择用kimi2.6来测试一下。把模型ID复制出来,替换到curl命令里,从@cf/开始替换。

La requête a été envoyée et le résultat a été rapidement obtenu.

Résultats du test d'appel de kimi2.6

La vitesse de réponse est effectivement très rapide, plus fluide que je ne l'imaginais.

Honnêtement, je voulais juste voir ce que ce crédit gratuit pouvait faire, et il s'avère qu'il est plutôt performant. Il est parfaitement suffisant pour les conversations quotidiennes, la création de contenu, la traduction et la programmation.

Imaginez : ce système fonctionne sur des nœuds périphériques. Vous déployez une application d'IA avec des utilisateurs répartis dans tout le pays, voire dans le monde entier, et la vitesse de réponse reste constante, sans vous soucier des problèmes de déploiement régionaux. C'est un atout considérable pour les développeurs indépendants et les petites équipes.

Auparavant, pour exécuter un modèle, il fallait soit acheter un GPU et le monter soi-même, ce qui était extrêmement coûteux, soit utiliser une instance GPU auprès d'un fournisseur cloud, ce qui était complexe à configurer. Cloudflare, en revanche, prend tout en charge. Il suffit d'écrire le code pour l'appeler, et il gère toute la partie technique.

Je pense que ce raisonnement est pertinent. Les capacités d'IA deviendront de plus en plus comparables aux infrastructures telles que l'eau et l'électricité : inutile de savoir comment l'électricité est produite, il suffit de la brancher et de l'utiliser. Cloudflare Workers AI pousse ce concept de « prêt à l'emploi » encore plus loin.

Bien sûr, cette solution présente des inconvénients. Le quota gratuit est limité à 10 000 neurones ; il faudra donc payer pour un déploiement en production avec un trafic important. De plus, malgré la présence de plus de 50 modèles, comparé à l'écosystème complet d'OpenAI, certains modèles de niche ou plus récents ne sont pas pris en charge.

Mais pour des projets personnels, des petits outils ou simplement des expériences motivées par la curiosité, je pense que c'est largement suffisant.

Voilà mon expérience, en toute honnêteté. Si vous avez lu jusqu'ici et que cela vous a été utile, n'hésitez pas à liker et à partager. Pour être informé(e) en avant-première des nouveautés, vous pouvez aussi me suivre ! ⭐

Merci d'avoir lu mon article. À bientôt !

发表 评论

Votre adresse email ne sera pas publiée. 项 已 用 * 标注

Répertoire d'articles
Remonter en haut