Mchakato wa Simu ya API ya AI ya Wafanyakazi wa Cloudflare: Usajili, Usanidi, na Usambazaji katika Hatua Moja

Nilikuwa nikifanya kazi kwenye mradi wa kibinafsi siku nyingine, na nilitaka kujenga...AIMsaidizi anahitaji kupiga simu kwa mifumo mikubwa. Nilipouliza kuhusu bei, wow, kila simu kwa GPT-4o inagharimu senti chache. Kama mradi wetu ungeendeshwa kweli, ada za API pekee zingefikia elfu kadhaa kwa mwezi.

Tulijiuliza kama kuna njia yoyote ya bei nafuu.

Kisha tukakutana na Cloudflare Workers AI. Tulijua Cloudflare ilihusika katika utabiri wa AI hapo awali, lakini hatukuchukua kwa uzito, tukidhani makampuni makubwa yangetoza gharama kwa bidhaa zao. Ilibainika, wow, wanatoa Neuroni 10000 bure kila siku.

Niuroni 10000 zinamaanisha nini? Ni takriban mazungumzo mia chache au vipindi mia chache vya kutengeneza picha kwa siku. Hiyo inatosha kwa mtu mmoja kucheza nayo.

Nilifurahi sana na mara moja nikaanza kuifanyia utafiti.

AI ya Wafanyakazi wa Cloudflare ni nini?

Mchakato wa Simu ya API ya AI ya Wafanyakazi wa Cloudflare: Usajili, Usanidi, na Usambazaji katika Hatua Moja

AI ya Wafanyakazi wa Cloudflare, sawa, nadhani ni...Kuweka nafasiHilo linavutia sana. Sio tu mtoa huduma rahisi wa modeli; ni jukwaa la hitimisho la AI linaloendeshwa kwenye mtandao wa kimataifa wa ukingo wa Cloudflare. Likiwa na nodi za ukingo katika zaidi ya miji 300, liko karibu sana na watumiaji.

Fikiria kuhusu hilo: unapotumia API ya OpenAI, ombi hupelekwa Marekani kwanza, hushughulikiwa, na kisha hurudi, likichukua milisekunde mia tatu hadi nne. Cloudflare, kwa upande mwingine, ni mtoa huduma wa CDN mwenye nodi kote ulimwenguni. Popote ulipo, huendesha modeli kwenye nodi iliyo karibu zaidi.

Muda wa kawaida wa majibu ni chini ya milisekunde 100. Tofauti hii inaonekana kwa mtumiaji.

Kinachofurahisha sana ni kwamba mwanzo wake baridi ni wa kiwango cha milisekunde, na huongezeka na kushuka kiotomatiki. Hata kwa ongezeko la ghafla la trafiki, haitachelewa, tofauti na baadhi ya mifumo ambayo ni ya kasi sana wakati hakuna mtu anayeitumia saa 3 asubuhi, lakini kisha huanguka kabisa wakati wa saa za kazi mchana.

Mifumo zaidi ya 50, inayojumuisha matukio yote

Pia kuna mifumo mingi inayoungwa mkono; kufikia Juni 2026, tayari kuna zaidi ya 50.

Kwa mazungumzo yanayotegemea maandishi, Llama 3, Llama 4, Mistral, GLM, Qwen, Gemma, na Deepseek-r1 zote zinapatikana. Kwa ajili ya utengenezaji wa picha, kuna Stable Diffusion, FLUX, na Pixverse. Kwa ajili ya usemi, kuna Whisper kwa ajili ya usemi-kwa-maandishi, TTS kwa ajili ya usemi-kwa-maandishi, na hata utengenezaji wa video.

Zaidi ya hayo, API yake imeundwa kuwa safi sana. Bila kujali modeli inayotumika, hutumia kiolesura kilichounganishwa; unahitaji tu kubadilisha jina la modeli.

env.AI.run ("jina la modeli", {…})

Kubadilisha mfumo kwa kutumia mstari mmoja tu wa msimbo ni rahisi sana.

Bei nafuu sana, kikomo kikubwa cha mkopo bila malipo

Pia niliweka bei. Posho ya bure ya kila siku ni Neuroni 10000, ambayo inatosha kwa majaribio ya kibinafsi. Ukitaka kulipa, ni $0.011 kwa kila Neuroni 1000, ambayo ni nafuu kwa 60% hadi 90% kuliko OpenAI. Zaidi ya hayo, hutozwa na Neuroni, si kwa tokeni, na kuifanya iwe nafuu zaidi kwa mazungumzo madogo.

Kwa kweli, nadhani njia hii ya bili ni sawa kabisa. Idadi ya Neuroni unazotumia hutofautiana kulingana na kama una mazungumzo rahisi au marefu sana, lakini tofauti si kubwa kama ilivyo kwa bili inayotegemea tokeni.

Katika hatua hii, unaweza kujiuliza, unaitumiaje hasa?

Nilipitia mchakato huo mwenyewe, wacha nikuambie kuuhusu.

Sajili na uunde tokeni za API

Hatua ya kwanza ni kusajili akaunti ya Cloudflare. Ikiwa tayari una akaunti, ingia tu. Ikiwa sivyo, kujiandikisha ni rahisi; jaza tu anwani ya barua pepe na uweke nenosiri.

Baada ya kuingia, bofya AI kwenye menyu ya kushoto, kisha bofya AI ya Wafanyakazi.

Kiolesura cha Kuingia cha AI cha Wafanyakazi wa Cloudflare

Ukiwa ndani, utaona kitufe cha kuunda tokeni ya API. Kibofye ili kutengeneza tokeni.

Tokeni ya API ya AI ya Wafanyakazi

Hapa kuna maelezo ya kuzingatia: tokeni iliyozalishwa inaweza kuonekana mara moja tu wakati wa uundaji, kwa hivyo hakikisha umeihifadhi. Ukurasa pia utakupa kitambulisho cha akaunti; utahitaji zote mbili baadaye.

Hifadhi tokeni ya API na kitambulisho cha akaunti

Baada ya kuhifadhi, utaona mfano wa matumizi chini ya ukurasa, ambayo ni amri ya curl. Ibadilishe tu na Kitambulisho cha akaunti yako na APIKEY. Amri inaonekana kama hii:

curl \
  https://api.cloudflare.com/client/v4/accounts/账户ID/ai/run/@cf/模型ID \
  -H "Authorization: Bearer 刚才生成的APIKEY" \
  -d '{"messages":[{"role":"system","content":"You are a friendly assistant that helps write stories"},{"role":"user","content":"Write a short story about a llama that goes on a journey to find an orange cloud"}]}'

Tazama orodha ya mifano inayopatikana

Kisha swali linatokea: unapata wapi kitambulisho cha modeli?

Kuna kitufe cha hati upande wa kulia wa ukurasa wa Wafanyakazi wa AI.

Bonyeza kitufe cha hati

Bofya kwenye kategoria ya "Mifumo"; hapo ndipo utakapopata orodha ya mifumo yote.

Mifano (Orodha ya Mifano)

Chagua ile unayotaka kutumia, na unaweza kuona kitambulisho cha modeli kwa kubofya juu yake.

Tazama Kitambulisho cha Mfano

Jaribu kuiita modeli ya Kimi 2.6

Nitatumia Kimi 2.6 kwa majaribio. Nakili kitambulisho cha modeli na ukibadilishe katika amri ya curl, kuanzia na @cf.

Ombi lilitumwa, na matokeo yakarudishwa haraka.

Matokeo ya majaribio ya kupiga simu kimi2.6

Kasi ya majibu ni ya haraka sana, laini kuliko nilivyotarajia.

Kwa kweli, nilitaka tu kuona kile ambacho mkopo huu wa bure unaweza kufanya, na inageuka kuwa una nguvu sana. Unatosha kabisa kwa gumzo la kila siku, utengenezaji wa maudhui, tafsiri, na uandishi wa msimbo.

Na fikiria: kitu hiki kinaendeshwa kwenye nodi za ukingo. Unasambaza programu ya AI kwa watumiaji kote nchini au hata duniani kote, na kasi ya majibu inabaki kuwa thabiti, bila kuwa na wasiwasi kuhusu masuala ya upelekaji wa kikanda. Hii inavutia sana watengenezaji binafsi na timu ndogo.

Hapo awali, ikiwa ulitaka kuendesha modeli, ilibidi ununue GPU na ujenge yako mwenyewe, ambayo ilikuwa ghali sana, au utumie mfano wa GPU kutoka kwa mtoa huduma wa wingu, ambao ulikuwa mgumu kusanidi. Cloudflare, kwa upande mwingine, imekamilisha yote kwa ajili yako. Unaandika tu msimbo ili kuiita, na inashughulikia mambo yote machafu kwa ajili yako.

Nadhani mtazamo huu ni sahihi. Uwezo wa AI utazidi kuwa kama miundombinu kama vile maji na umeme; huhitaji kujua jinsi umeme unavyozalishwa, unaweza kuuunganisha na kuutumia. Cloudflare Workers AI inapeleka dhana hii ya "kuziba na kucheza" katika kiwango cha juu zaidi.

Bila shaka, si bila mapungufu yake. Mgao wa bure ni Neuroni 10000 pekee, kwa hivyo bado utahitaji kulipa ikiwa unataka kuipeleka katika mazingira ya uzalishaji yenye trafiki kubwa. Pia, ingawa kuna zaidi ya modeli 50, ikilinganishwa na mfumo ikolojia kamili wa OpenAI, baadhi ya modeli maalum au mpya hazitumiki.

Lakini kwa miradi ya kibinafsi, vifaa vidogo, au majaribio yanayotokana na udadisi tu, nadhani inatosha.

Huo ndio uzoefu wangu wa kweli. Kwa kuwa umesoma hadi sasa, ikiwa umeona kuwa muhimu, tafadhali penda na ushiriki. Ikiwa unataka kupokea masasisho kwanza, unaweza pia kunifuata! ⭐

Asante kwa kusoma makala yangu. Tutaonana wakati mwingine.

发表 评论

Barua pepe yako haitachapishwa. 必填 项 已 用 * 标注

Saraka ya Nakala
Kitabu ya Juu