OpenAI-ի տեքստի ստեղծման վիդեո մոդել Սորան ապշեցուցիչ դեբյուտ է ունենում. բացահայտվել են սովորական մարդկանց փող աշխատելու հնարավորությունները

Պատմության մեջ ամենաուժեղըAIՎիդեո սերնդի մոդել! Սորան եկել է ավանդական ստեղծագործական մոդելը տապալելու համար:

Ստեղծեք պրոֆեսիոնալ տեսանյութեր մեկ սեղմումով: OpenAI Sora, թույլ տվեք զվարճանալ AI ստեղծմամբ:

Կարո՞ղ եք ամսական ավելի քան 10,000 վաստակել՝ առանց խմբագրելու հնարավորության: AI վիդեո սերնդի մոդել Սորան պատմում է ձեզ.

2024 թվականի փետրվարի 2-ի գիշերը OpenAI-ն առանց նախազգուշացման գործարկեց Sora-ն, որը հանկարծակի խելագարություն առաջացրեց AI-ի ոլորտում:

Sora-ի տեքստային գեներացիայի վիդեո էֆեկտը զարմանալի է, ամբողջովին ջախջախող հարթակներ, ինչպիսիք են Pika-ն և Runway-ը:

OpenAI վիդեո սերնդի մոդել Սորան ցնցող դեբյուտ է ունենում

Եկեք նայենք Սորայի զարմանալի հմտություններին.

Սորայի մասին մեծ բանն այն է, որ թեբնավորությունՆրա աշակերտները, թարթիչները և մաշկի կառուցվածքը բոլորն էլ իրական են, բացարձակապես առանց թերությունների:

Հերոսների շարժումը չափազանց հարթ է: Ի տարբերություն այլ AI վիդեո ալիքների, որոնք պարզապես մեծացնում և փոքրացնում են կամ պարզապես տեղափոխում որոշակի մանրամասներ, Սորան իրականում ցուցադրում է իրական միջավայրի վերարտադրությունը:

Սորան բացում է մեր երևակայության դուռը։Քանի դեռ մենք համարձակվում ենք մտածել, այն կարող է իրականացվել մեզ համար։

Վիդեո հարթակները, ինչպիսիք են Pika-ն և Runway-ը, դեռևս պայքարում են 3-ից 5 վայրկյան տևողությամբ կարճ տեսանյութեր ստեղծելու համար, մինչդեռ Sora-ն կարող է հեշտությամբ ստեղծել մինչև 60 վայրկյան տևողությամբ տեսանյութեր, որոնք գրեթե նույնն են, ինչ իրական տեսարանները: Այն կարող է ազատորեն անցնել տարբեր ոսպնյակների միջև՝ հասնելու համար: այնպիսի բաներ, ինչպիսիք են Մետաքսյա սահուն անցումը: Ճիշտ այնպես, ինչպես տարրական դպրոցի աշակերտների և քոլեջի ուսանողների միջև տարբերությունն ընդհանուր առմամբ ակնհայտ է:

OpenAI-ը, կարելի է ասել, թաքնված վիշապ է և կռացող վագր: Հետաքրքիր է, որ այլ հզոր ապրանքներ դեռ պետք է հայտարարվեն:

Չինաստանի ներքին AI-ի և OpenAI-ի միջև բացը չի նեղացել, այլ դարձել է ավելի ակնհայտ:

Ինչ է նշանակում Սորա

  • Ի՞նչ է նշանակում Սորա անունը անգլերեն:
  • Դատելով ճապոնական «դատարկ» (սորա) կամ «Հաո» (սորա) բառերից, երկու բառերն էլ նշանակում են «երկինք»:
  • Իրականում կան ուրիշներՆույն ձայնով, բայց տարբեր նիշերով չինական նիշերը նույնպես կարող են ձևավորել այս անունը:.

Sora-ի պաշտոնական կայքը այստեղ է.https://openai.com/sora, որը ցուցադրում է մի քանի զարմանալի վիդեո էֆեկտներ, բայց, ցավոք, ներկայումս այն բաց չէ հանրության համար:

Sora-ն հիմնված է GPT-ի և Dalle3-ի վրա, ունի բնական լեզուն հասկանալու հնարավորություններ և կարող է նմանակել ֆիզիկական աշխարհը և տարբեր հույզեր:

Sora-ի ի հայտ գալն ամբողջությամբ կփոխի վիդեո ինդուստրիան: Կարճ տեսանյութերը, վիրտուալ նկարահանումները, հատուկ էֆեկտները, գովազդը, միկրոֆիլմերը և այլն, բոլորը կմտնեն նոր GPT դարաշրջան և կմտնեն Սորա աշխարհին: Տնօրեն կարող են դառնալ նաև սովորական մարդիկ։

Թեև Սորան ներկայումս չի կարողանում լեզվական խոսակցություններ վարել, արժե անհամբեր սպասել, Sora տեխնոլոգիայի արդիականացմամբ, ենթադրվում է, որ մոտ ապագայում կհայտնվեն խոսակցության գործառույթներով տեսանյութեր: Սպասենք ու տեսնենք։

  • Անկախ նրանից, թե դա տեսահոլովակի հավատարմության, երկարության, կայունության, հետևողականության, լուծման կամ տեքստի ըմբռնման առումով, Sora-ն հասել է SOTA (ներկայումս լավագույն) մակարդակին:
  • Ինչ վերաբերում է տեխնիկական մանրամասներին, պարզ ասած, այն օգտագործում է տեսողական բլոկային կոդավորում՝ տարբեր ձևաչափերի տեսանյութերը միատեսակ կոդավորելու համար ներկառուցված տվյալների մեջ, որոնք կարող են վերապատրաստվել տրանսֆորմատորի ճարտարապետության միջոցով, և այնուհետև ներկայացնում է դիֆուզիոն նման մի մեթոդ՝ չափերի կրճատման գործընթացում ավելացնելու համար: Աղմուկը և չափերի բարձրացումը, այնուհետև օգտագործելով բավականաչափ մեծ ցանցային ճարտարապետություն, բավականաչափ մեծ ուսուցման փաթեթ և հզոր հաշվողական հզորություն, որը թույլ կտա մոդելին գլոբալ կերպով տեղավորել բավականաչափ ուսումնական հավաքածուներ՝ դրանով իսկ ցույց տալով մանրամասները վերականգնելիս խելացիորեն առաջանալու ունակությունը: որպես իրական աշխարհի ֆիզիկական ազդեցությունների և պատճառահետևանքային հարաբերությունների որոշակի չափով ըմբռնում:
  • Ամենահուզիչն (և մի փոքր անհանգստացնողը) այն է, որ տեսահոլովակների սերնդի այս մոդելը կարծես թե պարզապես լուսավորում է OpenAI-ի համաշխարհային մոդելի ուղենիշը, այլ ոչ թե վերջը:

Բացահայտվեցին Sora-ի թողարկման հնարավոր ազդեցությունը և փող աշխատելու հնարավորությունները

OpenAI-ի տեքստի ստեղծման վիդեո մոդել Սորան ապշեցուցիչ դեբյուտ է ունենում. բացահայտվել են սովորական մարդկանց փող աշխատելու հնարավորությունները

▎ C-side/Վաստակելու հնարավորություններ սովորական մարդկանց համար

  • Սա կարող է լինել լավագույն ժամանակը անկախ ստեղծագործողների համար: Սորան ազատ արձակելուց հետո,Հեղինակային իրավունք, ձայնային էֆեկտներ և տեսահոլովակներ, որոնք ստեղծվել են AI-ի կողմիցառցանց գործիքներԵթե ​​ամեն ինչ իր տեղում է, մեկ մարդ կարող է հեշտությամբ ավարտել կարճամետրաժ ֆիլմը: Լավ պատմությունը կարժենա հազարավոր դոլարներ, իսկ տաղանդավոր մարդկանց ավելի դժվար կլինի թաղել: Բայց մյուս կողմից՝ ստեղծագործական շեմի իջեցումը կբերի պատմությունների աննախադեպ բուռն մրցակցության։
  • XR արդյունաբերությունը, որը ներկայացված է vision pro-ի կողմից, նորից կծաղկի. բովանդակության բացակայությունն այլևս խնդիր չի լինի:
  • Կարճ տեսանյութերի առաջարկի ներկայիս հայտնի ձևը կարող է փոխվել՝ օգտատերերի նախասիրությունների հիման վրա կարճ տեսանյութեր առաջարկող համակարգից մինչև կարճ տեսանյութերի նպատակային սերունդ: Այլ կերպ ասած, նույն կարճ տեսանյութը կարող է առաջացնել տարբեր (իրական ժամանակի) ճշգրտված տարբերակներ՝ ըստ տարբեր օգտատերերի տարբեր նախասիրությունների:

▎ B-side/Ազդեցություն առևտրային ընկերությունների վրա

  • Բոլոր ընկերությունները, որոնք զբաղված են AI տեսահոլովակների ստեղծմամբ, կբախվեն ճգնաժամի առաջին ալիքին, սակայն ճգնաժամը նաև հնարավորություններ է պարունակում։ Քանի որ OpenAI-ն ապացուցել է, որ հնարավոր է տեսահոլովակներ ստեղծել՝ օգտագործելով մեծ մոդելներ, այլ ընկերություններին միայն պետք է ապացուցեն, որ իրենք նույնպես կարող են դա անել: նմանԶրուցարան GPTՀանրաճանաչ դառնալուց հետո խոշոր լեզուների մոդելներով զբաղվող ընկերությունների թիվն ավելացել է, քան նվազել:
  • AI 3D սերնդով զբաղվող ընկերությունները կկանգնեն ազդեցության երկրորդ ալիքի առաջ, քանի որ տեսաստեղծման և 3D սերնդի միջև սահմանները մշուշոտ են դառնում բազմակի աչքերի վերակառուցման տեխնոլոգիայի առկայության պատճառով: Հետևաբար, XNUMXD սերնդի ոլորտը կարող է կարիք ունենալ վերանայելու ներկայիս տեխնիկական երթուղին և բիզնես պատմողական տրամաբանությունը:
  • Թեև OpenAI-ը հստակ չի նշել դա, Sora-ն պահանջում է շատ հաշվողական ռեսուրսներ, ուստի գրաֆիկական քարտերի ընկերությունները լավ նորությունների նոր ալիք կբերեն, բայց դա կարող է լավ չլինել Nvidia-ի համար: Քանի որ հաշվողական ռեսուրսներն ավելի ու ավելի են բնութագրվում որպես ենթակառուցվածք, երկրների կողմից հաշվողական ռեսուրսների անկախ վերահսկողությունը կդառնա միտում: Նույնիսկ եթե էմբարգոն չդիտարկվի, Չինաստանը չի լինի միակ երկիրը, որը հետամուտ է անկախ վերահսկելի հաշվողական ռեսուրսներին: Նույնիսկ յուրաքանչյուր խոշոր ընկերություն սկսել է մտածել սեփական գրաֆիկական քարտերի կամ AI-ին հատուկ հաշվողական քարտերի (օրինակ՝ Google, Tesla, OpenAI, Alibaba) արտադրության մասին: ), ուստի մրցակցությունը հաշվողական ռեսուրսների ոլորտում գնալով ավելի կատաղի կդառնա:

Ցանկանու՞մ եք ավելին իմանալ OpenAI Sora փակ բետա հավելվածի մասին: Կտտացրեք ստորև նշված հղումը կարդալը շարունակելու համար:

Հույս Chen Weiliang բլոգ ( https://www.chenweiliang.com/ ) կիսվել է «OpenAI տեքստի ստեղծման վիդեո մոդել Սորան ապշեցուցիչ դեբյուտ է անում. բացահայտվել են սովորական մարդկանց փող աշխատելու հնարավորությունները», որն օգտակար է ձեզ համար:

Բարի գալուստ՝ կիսելու այս հոդվածի հղումը.https://www.chenweiliang.com/cwl-31424.html

Բարի գալուստ Chen Weiliang-ի բլոգի Telegram ալիք՝ վերջին թարմացումները ստանալու համար:

🔔 Եղեք առաջինը, ով կստանա արժեքավոր «ChatGPT բովանդակության շուկայավարման AI գործիքի օգտագործման ուղեցույցը» ալիքի վերին գրացուցակում: 🌟
📚 Այս ուղեցույցը պարունակում է հսկայական արժեք, 🌟Սա հազվագյուտ հնարավորություն է, բաց մի՛ թողեք այն։ ⏰⌛💨
Տարածեք և հավանեք, եթե հավանեցիք:
Ձեր տարածումը և հավանումները մեր շարունակական շարժառիթն են:

 

发表 评论

Ձեր էլ. Փոստի հասցեն չի հրապարակվի: Օգտագործվում են պահանջվող դաշտերը * Պիտակ

ոլորել դեպի վերև