Հոդվածների տեղեկատու
Պատմության մեջ ամենաուժեղըAIՎիդեո սերնդի մոդել! Սորան եկել է ավանդական ստեղծագործական մոդելը տապալելու համար:
Ստեղծեք պրոֆեսիոնալ տեսանյութեր մեկ սեղմումով: OpenAI Sora, թույլ տվեք զվարճանալ AI ստեղծմամբ:
Կարո՞ղ եք ամսական ավելի քան 10,000 վաստակել՝ առանց խմբագրելու հնարավորության: AI վիդեո սերնդի մոդել Սորան պատմում է ձեզ.
2024 թվականի փետրվարի 2-ի գիշերը OpenAI-ն առանց նախազգուշացման գործարկեց Sora-ն, որը հանկարծակի խելագարություն առաջացրեց AI-ի ոլորտում:
Sora-ի տեքստային գեներացիայի վիդեո էֆեկտը զարմանալի է, ամբողջովին ջախջախող հարթակներ, ինչպիսիք են Pika-ն և Runway-ը:
OpenAI վիդեո սերնդի մոդել Սորան ցնցող դեբյուտ է ունենում
Եկեք նայենք Սորայի զարմանալի հմտություններին.
Սորայի մասին մեծ բանն այն է, որ թեբնավորությունՆրա աշակերտները, թարթիչները և մաշկի կառուցվածքը բոլորն էլ իրական են, բացարձակապես առանց թերությունների:
Հերոսների շարժումը չափազանց հարթ է: Ի տարբերություն այլ AI վիդեո ալիքների, որոնք պարզապես մեծացնում և փոքրացնում են կամ պարզապես տեղափոխում որոշակի մանրամասներ, Սորան իրականում ցուցադրում է իրական միջավայրի վերարտադրությունը:
Սորան բացում է մեր երևակայության դուռը։Քանի դեռ մենք համարձակվում ենք մտածել, այն կարող է իրականացվել մեզ համար։
Վիդեո հարթակները, ինչպիսիք են Pika-ն և Runway-ը, դեռևս պայքարում են 3-ից 5 վայրկյան տևողությամբ կարճ տեսանյութեր ստեղծելու համար, մինչդեռ Sora-ն կարող է հեշտությամբ ստեղծել մինչև 60 վայրկյան տևողությամբ տեսանյութեր, որոնք գրեթե նույնն են, ինչ իրական տեսարանները: Այն կարող է ազատորեն անցնել տարբեր ոսպնյակների միջև՝ հասնելու համար: այնպիսի բաներ, ինչպիսիք են Մետաքսյա սահուն անցումը: Ճիշտ այնպես, ինչպես տարրական դպրոցի աշակերտների և քոլեջի ուսանողների միջև տարբերությունն ընդհանուր առմամբ ակնհայտ է:
OpenAI-ը, կարելի է ասել, թաքնված վիշապ է և կռացող վագր: Հետաքրքիր է, որ այլ հզոր ապրանքներ դեռ պետք է հայտարարվեն:
Չինաստանի ներքին AI-ի և OpenAI-ի միջև բացը չի նեղացել, այլ դարձել է ավելի ակնհայտ:
Ինչ է նշանակում Սորա
- Ի՞նչ է նշանակում Սորա անունը անգլերեն:
- Դատելով ճապոնական «դատարկ» (սորա) կամ «Հաո» (սորա) բառերից, երկու բառերն էլ նշանակում են «երկինք»:
- Իրականում կան ուրիշներՆույն ձայնով, բայց տարբեր նիշերով չինական նիշերը նույնպես կարող են ձևավորել այս անունը:.
Sora-ի պաշտոնական կայքը այստեղ է.https://openai.com/sora, որը ցուցադրում է մի քանի զարմանալի վիդեո էֆեկտներ, բայց, ցավոք, ներկայումս այն բաց չէ հանրության համար:
Sora-ն հիմնված է GPT-ի և Dalle3-ի վրա, ունի բնական լեզուն հասկանալու հնարավորություններ և կարող է նմանակել ֆիզիկական աշխարհը և տարբեր հույզեր:
Sora-ի ի հայտ գալն ամբողջությամբ կփոխի վիդեո ինդուստրիան: Կարճ տեսանյութերը, վիրտուալ նկարահանումները, հատուկ էֆեկտները, գովազդը, միկրոֆիլմերը և այլն, բոլորը կմտնեն նոր GPT դարաշրջան և կմտնեն Սորա աշխարհին: Տնօրեն կարող են դառնալ նաև սովորական մարդիկ։
Թեև Սորան ներկայումս չի կարողանում լեզվական խոսակցություններ վարել, արժե անհամբեր սպասել, Sora տեխնոլոգիայի արդիականացմամբ, ենթադրվում է, որ մոտ ապագայում կհայտնվեն խոսակցության գործառույթներով տեսանյութեր: Սպասենք ու տեսնենք։
- Անկախ նրանից, թե դա տեսահոլովակի հավատարմության, երկարության, կայունության, հետևողականության, լուծման կամ տեքստի ըմբռնման առումով, Sora-ն հասել է SOTA (ներկայումս լավագույն) մակարդակին:
- Ինչ վերաբերում է տեխնիկական մանրամասներին, պարզ ասած, այն օգտագործում է տեսողական բլոկային կոդավորում՝ տարբեր ձևաչափերի տեսանյութերը միատեսակ կոդավորելու համար ներկառուցված տվյալների մեջ, որոնք կարող են վերապատրաստվել տրանսֆորմատորի ճարտարապետության միջոցով, և այնուհետև ներկայացնում է դիֆուզիոն նման մի մեթոդ՝ չափերի կրճատման գործընթացում ավելացնելու համար: Աղմուկը և չափերի բարձրացումը, այնուհետև օգտագործելով բավականաչափ մեծ ցանցային ճարտարապետություն, բավականաչափ մեծ ուսուցման փաթեթ և հզոր հաշվողական հզորություն, որը թույլ կտա մոդելին գլոբալ կերպով տեղավորել բավականաչափ ուսումնական հավաքածուներ՝ դրանով իսկ ցույց տալով մանրամասները վերականգնելիս խելացիորեն առաջանալու ունակությունը: որպես իրական աշխարհի ֆիզիկական ազդեցությունների և պատճառահետևանքային հարաբերությունների որոշակի չափով ըմբռնում:
- Ամենահուզիչն (և մի փոքր անհանգստացնողը) այն է, որ տեսահոլովակների սերնդի այս մոդելը կարծես թե պարզապես լուսավորում է OpenAI-ի համաշխարհային մոդելի ուղենիշը, այլ ոչ թե վերջը:
Բացահայտվեցին Sora-ի թողարկման հնարավոր ազդեցությունը և փող աշխատելու հնարավորությունները
▎ C-side/Վաստակելու հնարավորություններ սովորական մարդկանց համար
- Սա կարող է լինել լավագույն ժամանակը անկախ ստեղծագործողների համար: Սորան ազատ արձակելուց հետո,Հեղինակային իրավունք, ձայնային էֆեկտներ և տեսահոլովակներ, որոնք ստեղծվել են AI-ի կողմիցառցանց գործիքներԵթե ամեն ինչ իր տեղում է, մեկ մարդ կարող է հեշտությամբ ավարտել կարճամետրաժ ֆիլմը: Լավ պատմությունը կարժենա հազարավոր դոլարներ, իսկ տաղանդավոր մարդկանց ավելի դժվար կլինի թաղել: Բայց մյուս կողմից՝ ստեղծագործական շեմի իջեցումը կբերի պատմությունների աննախադեպ բուռն մրցակցության։
- XR արդյունաբերությունը, որը ներկայացված է vision pro-ի կողմից, նորից կծաղկի. բովանդակության բացակայությունն այլևս խնդիր չի լինի:
- Կարճ տեսանյութերի առաջարկի ներկայիս հայտնի ձևը կարող է փոխվել՝ օգտատերերի նախասիրությունների հիման վրա կարճ տեսանյութեր առաջարկող համակարգից մինչև կարճ տեսանյութերի նպատակային սերունդ: Այլ կերպ ասած, նույն կարճ տեսանյութը կարող է առաջացնել տարբեր (իրական ժամանակի) ճշգրտված տարբերակներ՝ ըստ տարբեր օգտատերերի տարբեր նախասիրությունների:
▎ B-side/Ազդեցություն առևտրային ընկերությունների վրա
- Բոլոր ընկերությունները, որոնք զբաղված են AI տեսահոլովակների ստեղծմամբ, կբախվեն ճգնաժամի առաջին ալիքին, սակայն ճգնաժամը նաև հնարավորություններ է պարունակում։ Քանի որ OpenAI-ն ապացուցել է, որ հնարավոր է տեսահոլովակներ ստեղծել՝ օգտագործելով մեծ մոդելներ, այլ ընկերություններին միայն պետք է ապացուցեն, որ իրենք նույնպես կարող են դա անել: նմանԶրուցարան GPTՀանրաճանաչ դառնալուց հետո խոշոր լեզուների մոդելներով զբաղվող ընկերությունների թիվն ավելացել է, քան նվազել:
- AI 3D սերնդով զբաղվող ընկերությունները կկանգնեն ազդեցության երկրորդ ալիքի առաջ, քանի որ տեսաստեղծման և 3D սերնդի միջև սահմանները մշուշոտ են դառնում բազմակի աչքերի վերակառուցման տեխնոլոգիայի առկայության պատճառով: Հետևաբար, XNUMXD սերնդի ոլորտը կարող է կարիք ունենալ վերանայելու ներկայիս տեխնիկական երթուղին և բիզնես պատմողական տրամաբանությունը:
- Թեև OpenAI-ը հստակ չի նշել դա, Sora-ն պահանջում է շատ հաշվողական ռեսուրսներ, ուստի գրաֆիկական քարտերի ընկերությունները լավ նորությունների նոր ալիք կբերեն, բայց դա կարող է լավ չլինել Nvidia-ի համար: Քանի որ հաշվողական ռեսուրսներն ավելի ու ավելի են բնութագրվում որպես ենթակառուցվածք, երկրների կողմից հաշվողական ռեսուրսների անկախ վերահսկողությունը կդառնա միտում: Նույնիսկ եթե էմբարգոն չդիտարկվի, Չինաստանը չի լինի միակ երկիրը, որը հետամուտ է անկախ վերահսկելի հաշվողական ռեսուրսներին: Նույնիսկ յուրաքանչյուր խոշոր ընկերություն սկսել է մտածել սեփական գրաֆիկական քարտերի կամ AI-ին հատուկ հաշվողական քարտերի (օրինակ՝ Google, Tesla, OpenAI, Alibaba) արտադրության մասին: ), ուստի մրցակցությունը հաշվողական ռեսուրսների ոլորտում գնալով ավելի կատաղի կդառնա:
Ցանկանու՞մ եք ավելին իմանալ OpenAI Sora փակ բետա հավելվածի մասին: Կտտացրեք ստորև նշված հղումը կարդալը շարունակելու համար:
Հույս Chen Weiliang բլոգ ( https://www.chenweiliang.com/ ) կիսվել է «OpenAI տեքստի ստեղծման վիդեո մոդել Սորան ապշեցուցիչ դեբյուտ է անում. բացահայտվել են սովորական մարդկանց փող աշխատելու հնարավորությունները», որն օգտակար է ձեզ համար:
Բարի գալուստ՝ կիսելու այս հոդվածի հղումը.https://www.chenweiliang.com/cwl-31424.html
Բարի գալուստ Chen Weiliang-ի բլոգի Telegram ալիք՝ վերջին թարմացումները ստանալու համար:
📚 Այս ուղեցույցը պարունակում է հսկայական արժեք, 🌟Սա հազվագյուտ հնարավորություն է, բաց մի՛ թողեք այն։ ⏰⌛💨
Տարածեք և հավանեք, եթե հավանեցիք:
Ձեր տարածումը և հավանումները մեր շարունակական շարժառիթն են: