Directorio de artículos
El otro día estaba trabajando en un proyecto personal y quería construir un...AIEl asistente necesita llamar a modelos complejos. Cuando pregunté por el precio, me sorprendió que cada llamada a GPT-4o costara solo unos centavos. Si nuestro proyecto llegara a funcionar, las tarifas de la API por sí solas ascenderían a varios miles de dólares al mes.
Nos preguntábamos si habría alguna forma más económica.
Entonces nos topamos con Cloudflare Workers AI. Sabíamos que Cloudflare ya trabajaba con inferencia de IA, pero no lo habíamos tomado en serio, suponiendo que las grandes empresas cobrarían por sus productos. Resulta que, ¡guau!, están regalando 10 000 neuronas al día.
¿Qué significa 10 000 neuronas? Es aproximadamente lo mismo que unos cientos de diálogos o cientos de sesiones de generación de imágenes al día. Eso es más que suficiente para que una persona juegue.
Me emocioné mucho e inmediatamente comencé a investigar sobre ello.
¿Qué es Cloudflare Workers AI?

La IA de Cloudflare Workers, bueno, creo que es...PosicionamientoEso es bastante interesante. No se trata de un simple proveedor de modelos; es una plataforma de inferencia de IA que se ejecuta en la red global de Cloudflare. Con nodos perimetrales en más de 300 ciudades, está increíblemente cerca de los usuarios.
Piénsalo: cuando usas la API de OpenAI, la solicitud primero va a Estados Unidos, se procesa y luego regresa, tardando entre trescientos y cuatrocientos milisegundos. Cloudflare, en cambio, es un proveedor de CDN con nodos en todo el mundo. Estés donde estés, ejecuta el modelo en el nodo más cercano.
El tiempo de respuesta típico es inferior a 100 milisegundos. Esta diferencia es perceptible para el usuario.
Lo realmente genial es que su arranque en frío es instantáneo, a nivel de milisegundos, y se adapta automáticamente a las necesidades del usuario. Incluso ante un aumento repentino del tráfico, no se ralentiza, a diferencia de algunas plataformas que son increíblemente rápidas cuando nadie las usa a las 3 de la mañana, pero que luego colapsan por completo durante las horas pico del día.
Más de 50 modelos que cubren todos los escenarios.
También existen muchos modelos compatibles; a fecha de junio de 2026, ya hay más de 50.
Para diálogos basados en texto, están disponibles Llama 3, Llama 4, Mistral, GLM, Qwen, Gemma y Deepseek-r1. Para la generación de imágenes, se encuentran Stable Diffusion, FLUX y Pixverse. Para la generación de voz, está Whisper para la conversión de voz a texto, TTS para la conversión de texto a voz e incluso la generación de vídeo.
Además, su API está diseñada para ser muy limpia. Independientemente del modelo utilizado, emplea una interfaz unificada; solo es necesario cambiar el nombre del modelo.
env.AI.run(“nombre del modelo”, {…})
Cambiar el modelo con tan solo una línea de código es muy práctico.
Precio extremadamente económico, generoso límite de crédito gratuito.
También me encargué de los precios. El límite diario gratuito es de 10 000 Neurons, más que suficiente para experimentar personalmente. Si prefieres pagar, cuesta 0.011 $ por cada 1000 Neurons, lo que supone entre un 60 % y un 90 % más barato que OpenAI. Además, se factura por Neurons, no por tokens, lo que lo hace más rentable para conversaciones cortas.
Sinceramente, creo que este método de facturación es bastante justo. La cantidad de Neuronas que gastas varía según si la conversación es sencilla o muy larga, pero la diferencia no es tan abultada como con la facturación basada en fichas.
Llegado este punto, quizás te estés preguntando: ¿cómo se usa exactamente?
Yo mismo pasé por ese proceso, déjame contarte.
Regístrate y crea tokens de API.
El primer paso es registrar una cuenta de Cloudflare. Si ya tienes una cuenta, simplemente inicia sesión. Si no, registrarte es fácil: solo tienes que introducir tu dirección de correo electrónico y crear una contraseña.
Después de iniciar sesión, haga clic en IA en el menú de la izquierda y luego en IA de trabajadores.

Una vez dentro, verás un botón para crear un token de API. Haz clic en él para generarlo.

Un detalle importante: el token generado solo se puede ver una vez durante la creación, así que asegúrate de guardarlo. La página también te proporcionará un ID de cuenta; necesitarás ambos más adelante.

Tras guardar, verás un ejemplo de uso en la parte inferior de la página, que es el comando curl. Simplemente reemplázalo con tu ID de cuenta y APIKEY. El comando tiene este aspecto:
curl \
https://api.cloudflare.com/client/v4/accounts/账户ID/ai/run/@cf/模型ID \
-H "Authorization: Bearer 刚才生成的APIKEY" \
-d '{"messages":[{"role":"system","content":"You are a friendly assistant that helps write stories"},{"role":"user","content":"Write a short story about a llama that goes on a journey to find an orange cloud"}]}'Consulte la lista de modelos disponibles.
Entonces surge la pregunta: ¿dónde se encuentra el ID del modelo?
En la parte derecha de la página de Workers AI hay un botón para abrir documentos.

Haz clic en la categoría "Modelos"; allí encontrarás una lista de todos los modelos.

Elige el que quieras usar y podrás ver el ID del modelo haciendo clic sobre él.

Prueba de llamada al modelo Kimi 2.6
Usaré Kimi 2.6 para las pruebas. Copia el ID del modelo y reemplázalo en el comando curl, comenzando con @cf.
Se envió la solicitud y se obtuvo el resultado rápidamente.

La velocidad de respuesta es realmente muy rápida, más fluida de lo que esperaba.
Sinceramente, solo quería ver qué podía hacer este crédito gratuito, y resulta que es bastante potente. Es perfectamente adecuado para chatear a diario, generar contenido, traducir y programar.
Y piénsalo: esto funciona en nodos periféricos. Implementas una aplicación de IA con usuarios en todo el país o incluso en todo el mundo, y la velocidad de respuesta se mantiene constante, sin tener que preocuparte por problemas de implementación regional. Esto resulta increíblemente atractivo para desarrolladores individuales y equipos pequeños.
Antes, si querías ejecutar un modelo, tenías que comprar una GPU y montarla tú mismo, lo cual era increíblemente caro, o usar una instancia de GPU de un proveedor de nube, cuya configuración era complicada. Cloudflare, en cambio, lo tiene todo resuelto. Solo tienes que escribir el código para llamarlo y se encarga de todo lo demás.
Creo que esta línea de pensamiento es correcta. Las capacidades de la IA se asemejarán cada vez más a infraestructuras como el agua y la electricidad; no hace falta saber cómo se genera la electricidad, basta con enchufarla y usarla. Cloudflare Workers AI lleva este concepto de "conectar y usar" a un nivel aún más extremo.
Por supuesto, no está exento de inconvenientes. La cuota gratuita es de solo 10 000 neuronas, por lo que aún tendrás que pagar si quieres implementarlo en un entorno de producción con mucho tráfico. Además, si bien cuenta con más de 50 modelos, en comparación con el ecosistema integral de OpenAI, algunos modelos más específicos o recientes no son compatibles.
Pero para proyectos personales, herramientas pequeñas o simplemente experimentos motivados por la curiosidad, creo que es más que suficiente.
Esa es mi experiencia sincera. Ya que has leído hasta aquí, si te ha resultado útil, dale a "Me gusta" y compártelo. Si quieres recibir las últimas novedades antes que nadie, ¡también puedes seguirme! ⭐
Gracias por leer mi artículo. ¡Hasta la próxima!
Esperanza Chen Weiliang Blog ( https://www.chenweiliang.com/ El artículo "Proceso de llamada a la API gratuita de Cloudflare Workers AI: registro, configuración e implementación en un solo paso", que se comparte aquí, puede resultarle útil.
Bienvenido a compartir el enlace de este artículo:https://www.chenweiliang.com/cwl-34244.html
