របៀបបង្កើតរូបភាពដោយប្រើ DALL-E? អត្ថបទ AI បង្កើតរូបគំនូរ និយាយថាលាហើយការគូររូបដែលបោកប្រាស់!

✨បញ្ចេញការស្រមើលស្រមៃរបស់អ្នកជាមួយ DALL-E🚀! បដិវត្តន៍នេះ។ AI ឧបករណ៍បង្កើតរូបភាពអនុញ្ញាតឱ្យអ្នកបង្កើតរូបភាពគួរឱ្យភ្ញាក់ផ្អើលជាមួយនឹងអត្ថបទ🎨។

គ្រាន់តែបញ្ចូលគំនិតរបស់អ្នក ហើយ DALL-E នឹងប្រែក្លាយវាទៅជាស្នាដៃសិល្បៈដូចជីវិត!

ពីទេសភាពសុបិន្តទៅគួរឱ្យភ្ញាក់ផ្អើលតួអក្សរបញ្ឈរ, លទ្ធភាពគឺគ្មានដែនកំណត់នៃ។

ចូលរួមជាមួយរង្វង់វេទមន្តគំនូរ DALL-E ហើយចាប់ផ្តើមដំណើរសិល្បៈរបស់អ្នក!

របៀបបង្កើតរូបភាពដោយប្រើ DALL-E? អត្ថបទ AI បង្កើតរូបគំនូរ និយាយថាលាហើយការគូររូបដែលបោកប្រាស់!

ថ្មីៗនេះ វិស័យបញ្ញាសិប្បនិមិត្ត (AI) មានការរីកចម្រើនគួរឲ្យកត់សម្គាល់។ជជែក GPT វាមិនត្រឹមតែពូកែក្នុងការបង្កើតអត្ថបទប៉ុណ្ណោះទេ ប៉ុន្តែដំណាក់កាល AI របស់យើងពង្រីកបន្តិចម្តងៗលើសពីអត្ថបទសុទ្ធ។

តើ DALL-E ជាអ្វី?

DALL-E គឺជាប្រព័ន្ធ AI បដិវត្តន៍ដែលបង្កើតរូបភាពដោយផ្អែកលើការពិពណ៌នាអត្ថបទ។

DALL-E គឺជាព្រឹត្តិការណ៍ដ៏សំខាន់មួយក្នុងការច្នៃប្រឌិតបញ្ញាសិប្បនិមិត្ត ហើយកំណែចុងក្រោយបង្អស់ DALL-E 3 កាន់តែមានថាមពលខ្លាំងជាងមុន។

នៅក្នុងការណែនាំនេះ យើងនឹងពិនិត្យមើលឱ្យបានដិតដល់នូវអ្វីដែល DALL-E ជាអ្វី របៀបដែលវាដំណើរការ តំបន់នៃកម្មវិធីរបស់វា និងការណែនាំសម្រាប់ការប្រើប្រាស់វាដើម្បីបង្កើតមាតិកាដែលមើលឃើញដ៏អស្ចារ្យ។

គំនិតនេះស្តាប់ទៅសាមញ្ញ ប៉ុន្តែដើម្បីទទួលបានលទ្ធផលល្អបំផុត អ្នកត្រូវអនុវត្តតាមគន្លឹះទាំងនេះសម្រាប់លទ្ធផលស្វែងរកពិតប្រាកដ និងត្រឹមត្រូវ! ដើម្បីធានាថាអ្នកទទួលបានលទ្ធផលស្វែងរកពិតប្រាកដ និងត្រឹមត្រូវបំផុត យើងផ្តល់ឱ្យអ្នកនូវគន្លឹះ និងល្បិចដូចខាងក្រោម។

មុនពេលប្រើ DALL-E មានច្បាប់ថែរក្សាផ្ទះបីដែលអ្នកត្រូវយល់៖

ចាប់តាំងពីអ្នកបានបង្កើតគំនិតបច្ចេកទេសសម្រាប់ស្នាដៃសិល្បៈរបស់អ្នក អ្នកគឺជាសិល្បករតាមលំនាំដើម ទោះបីជារូបភាពនឹងត្រូវបានទាញយកដោយប្រើពណ៌ទឹករបស់ DALL-E 2 ក៏ដោយ។

មានដែនកំណត់ចំពោះអ្វីដែលអ្នកអាចបង្កើតបាន។ ឧទាហរណ៍ គោលនយោបាយខ្លឹមសាររបស់ DALL-E 2 ហាមឃាត់ខ្លឹមសារដែលបង្កគ្រោះថ្នាក់ បោកបញ្ឆោត ឬនយោបាយ។ ដើម្បីទប់ស្កាត់ការរំលោភបំពាន ពាក្យស្វែងរកមួយចំនួនសម្រាប់បុគ្គលសាធារណៈ ដូចជា Taylor Swift ត្រូវបានបិទ។ ខណៈពេលដែលមិនមែនតារាល្បីទាំងអស់បំពានគោលការណ៍ខ្លឹមសារ មុខរបស់ពួកគេជារឿយៗត្រូវបានបង្ខូចទ្រង់ទ្រាយដើម្បីសុវត្ថិភាព។

ដែនកំណត់ឥណទានសម្រាប់ DALL-E 2៖ អ្នកប្រើប្រាស់ដែលចុះឈ្មោះ និងបង្កើតគណនីតាមរយៈអ៊ីមែលមុនថ្ងៃទី 2023 ខែមេសា ឆ្នាំ 4 អាចទទួលបាន 6 ក្រេឌីតឥតគិតថ្លៃ ផុតកំណត់ និងបន្តជារៀងរាល់ខែ។ ឧទាហរណ៍ ខ្ញុំបានចុះឈ្មោះនៅថ្ងៃទី 15 ខែកញ្ញា ឆ្នាំ 2022 ដូច្នេះខ្ញុំទទួលបាន 9 ក្រេឌីតឥតគិតថ្លៃរៀងរាល់ខែ ដែលបន្តដោយស្វ័យប្រវត្តិ។ សូមចំណាំថា ក្រេឌីតឥតគិតថ្លៃមិនអាចបង្វិលបានទេ ដូច្នេះទោះបីជាខ្ញុំមិនបង្កើតសិល្បៈរយៈពេលបីខែក៏ដោយ ក៏ខ្ញុំមិនអាចប្រមូលបាន 25 ក្រេឌីតដែរ។ អ្នក​ប្រើ​ថ្មី​ដែល​ទើប​បង្កើត​គណនី​លែង​ទទួល​បាន​អត្ថប្រយោជន៍​ឥណទាន​ឥត​គិត​ថ្លៃ​ដូច​គ្នា​ហើយ​ត្រូវ​តែ​ទិញ​ឥណទាន​យ៉ាង​ហោច​ណាស់ 15 សម្រាប់​តម្លៃ 60 ដុល្លារ។ អ្នកប្រើប្រាស់អាចទិញក្រេឌីត DALL-E ដាច់ដោយឡែកតាមរយៈ labs.openai.com ដែលត្រូវបានចេញវិក្កយបត្រដាច់ដោយឡែកពី DALL-E API។

ក្រេឌីតអាចលោះបានតែបន្ទាប់ពីពួកវាត្រូវបានបញ្ចូល និងបង្កើត ការស្វែងរកដែលនៅទីបំផុតមិនត្រូវបានបង្កើតដោយសារតែការបំពានគោលការណ៍ខ្លឹមសារនឹងមិនត្រូវបានកាត់ចេញពីឥណទានឥតគិតថ្លៃនោះទេ។ អ្នកអាចចុចលើរូបតំណាងប្រវត្តិរូបរបស់អ្នកនៅជ្រុងខាងស្តាំខាងលើនៃចំណុចប្រទាក់ស្វែងរក ដើម្បីមើលថាតើឥណទានដែលអ្នកបានចាកចេញជារៀងរាល់ខែ ហើយអ្នកអាចជ្រើសរើសទិញបន្ថែមទៀត ដោយចាប់ផ្តើមពី $115 សម្រាប់ 15 ក្រេឌីត។

របៀបប្រើ DALL-E ដើម្បីបង្កើតរូបភាព?

DALL-E គឺជាឧបករណ៍ឆ្លាតវៃសិប្បនិម្មិតដ៏មានឥទ្ធិពលបំផុតមួយនៅលើទីផ្សារនាពេលបច្ចុប្បន្ន។

នេះគឺជាម៉ាស៊ីនបង្កើតរូបភាពឆ្លាតវៃសិប្បនិម្មិតដែលបង្កើតឡើងដោយក្រុម OpenAI នៅពីក្រោយ ChatGPT ។ វាប្រើបច្ចេកវិទ្យាមួយហៅថា "បញ្ញាសិប្បនិម្មិតជំនាន់" ដើម្បីបង្កើតរូបភាពដើមពីទទេដោយផ្អែកលើការជម្រុញអត្ថបទ។

ឧទាហរណ៍ប្រសិនបើអ្នកបញ្ចូលអត្ថបទ "an avocado chair with a red colored monkey”, DALL-E នឹងបង្កើតរូបភាពថ្មីនៃវត្ថុចម្លែកនេះ។

កៅអីផ្លែបឺរ និងរូបស្វាក្រហម ២

ជាជាងគ្រាន់តែកាត់ និងបង្រួមផ្នែកនៃរូបភាព វាពិតជា "ស្រមៃ" នូវអ្វីដែលអ្នកកំពុងពណ៌នា។ ការពិពណ៌នារបស់អ្នកកាន់តែលម្អិត នោះរូបភាពលទ្ធផលនឹងមានភាពចម្រាញ់កាន់តែច្រើន។

គួរកត់សម្គាល់ថាឈ្មោះ "DALL-E" គឺជាការស្រមើស្រមៃរបស់វិចិត្រករ surrealist Salvador Dali និងតួអង្គមនុស្សយន្តដែលរួសរាយរាក់ទាក់របស់ Pixar WALL-E ។ នេះបង្ហាញពីរបៀបដែល DALL-E រួមបញ្ចូលគ្នានូវសិល្បៈ និងបច្ចេកវិទ្យា ដើម្បីបង្កើតបែបផែនរូបភាពដ៏អស្ចារ្យដោយផ្ទាល់ពីការពិពណ៌នាអត្ថបទ។

នេះគឺជាភាពអស្ចារ្យរបស់ DALL-E ដែលតំណាងឱ្យការលោតផ្លោះនៃការច្នៃប្រឌិតបញ្ញាសិប្បនិម្មិត។

ខណៈពេលដែលមនុស្សអាចស្រមើស្រមៃបានយ៉ាងងាយស្រួលតាមរយៈពាក្យសម្ដី កុំព្យូទ័រធ្លាប់មិនអាចធ្វើដូច្នេះបាន ជាពិសេសមិនមានលក្ខណៈរស់រវើកនោះទេ។ DALL-E ដឹងពីការស្រមើលស្រមៃជាក់ស្តែង និងសមត្ថភាពដោះស្រាយបញ្ហាដែលមាននៅក្នុងកុំព្យូទ័រ បើកលទ្ធភាពដ៏គួរឱ្យរំភើបសម្រាប់ការរចនាក្រាហ្វិក គំរូរូបភាព ប្លង់គេហទំព័រ និងច្រើនទៀត។

តើ DALL-E ដំណើរការយ៉ាងដូចម្តេច?

តើ DALL-E បញ្ចេញវេទមន្តដោយរបៀបណា? ដូចដែលបានរៀបរាប់ខាងលើ វាប្រើបច្ចេកវិទ្យាមួយហៅថា "បញ្ញាសិប្បនិម្មិតជំនាន់"។ សូម​ពិនិត្យ​មើល​ឲ្យ​កាន់​តែ​ជិត។

ម៉ូដែល AI ជំនាន់

រូបភាពគំរូ AI ជំនាន់ទី 3

មិនដូច AI ជាក់លាក់សម្រាប់កិច្ចការភាគច្រើនទេ ម៉ូដែល AI ជំនាន់ថ្មីមិនមានឯកទេសដើម្បីអនុវត្តកិច្ចការជាក់លាក់ណាមួយឡើយ។

ផ្ទុយទៅវិញ ពួកគេត្រូវបានបណ្តុះបណ្តាលលើសំណុំដ៏ធំនៃរូបភាព អត្ថបទ និងទិន្នន័យផ្សេងទៀត ដើម្បីបង្កើតការយល់ដឹងយ៉ាងស៊ីជម្រៅអំពីទំនាក់ទំនងរវាងគំនិតផ្សេងៗ។

នេះអនុញ្ញាតឱ្យពួកគេបង្កើតលទ្ធផលថ្មីដែលមានភាពប្រាកដនិយមខ្ពស់ និងត្រូវគ្នានឹងការជំរុញឱ្យត្រឹមត្រូវ។

ឧទាហរណ៍ AI ដែល​បាន​ហ្វឹកហាត់​តែ​លើ​រូបថត​សត្វ​ឆ្មា​នឹង​មិន​អាច​ស្រមៃ​ឃើញ​សត្វ​ប្រលោមលោក​ដូច​ជា "flamingo-lion" ទេ។ ដោយបានបណ្តុះបណ្តាលលើរូបភាពរាប់លាននៃប្រភេទសត្វ សត្វ មនុស្ស ប្រដាប់ប្រដាក្មេងលេង និងច្រើនទៀត គំរូជំនាន់អាចរួមបញ្ចូលគ្នានូវចំណេះដឹងនេះដើម្បីបង្កើតជាកូនកាត់ flamingo-lion ដោយផ្អែកលើការជម្រុញឱ្យជឿជាក់។

នៅក្នុងកំណែចុងក្រោយរបស់ DALL-E 3 សមត្ថភាពបង្កើតរបស់ថ្មីទាំងស្រុងត្រូវបានបង្ហាញឱ្យឃើញបន្ថែមទៀត។ កំណែ​ថ្មី​នេះ​បង្ហាញ​ពី​កម្រិត​កាន់តែ​ខ្ពស់​នៃ​ភាពត្រឹមត្រូវ​ក្នុង​ការ​បក​ស្រាយ​សញ្ញា ចាប់​យក​ភាព​ខុស​គ្នា​និង​ព័ត៌មាន​លម្អិត​ដែល​ម៉ូដែល​មុន​មិន​អាច​ចាប់​យក​បាន។

បើប្រៀបធៀបជាមួយម៉ាស៊ីនបង្កើតបញ្ញាសិប្បនិម្មិតពីមុន DALL-E 3 លែងងាយទទួលបានលទ្ធផលដែលមិននឹកស្មានដល់នៅពេលទទួលបានការណែនាំស្មុគស្មាញ។ ផ្ទុយទៅវិញ វាបង្ហាញពីការយល់ដឹងដ៏ប្រសើរនៃភាសាដែលអាចឱ្យវាស្រមៃអំពីសេណារីយ៉ូប្រលោមលោក និងតួអក្សរដែលលើសពីការរំពឹងទុកពីគំរូបង្កើតអត្ថបទទៅរូបភាព។

ជាមួយនឹង DALL-E 3 ការតភ្ជាប់រវាងភាសា និងរូបភាពគឺកាន់តែជិតស្និទ្ធ ជាមួយនឹងសមត្ថភាពក្នុងការបកស្រាយបរិបទនៃសញ្ញាជាជាងបង្កើតរូបភាពដោយមេកានិច។ នេះធ្វើឱ្យរូបភាពដែលបានបង្កើតកាន់តែជិតទៅនឹងការរំពឹងទុករបស់អ្នកប្រើប្រាស់។

បន្ទាប់មក សូមពិនិត្យមើលឱ្យកាន់តែស៊ីជម្រៅអំពីរបៀបដែលស្ថាបត្យកម្មជំនាន់របស់ DALL-E ដំណើរការ។

តើស្ថាបត្យកម្មជំនាន់របស់ DALL-E ដំណើរការយ៉ាងដូចម្តេច?

គន្លឹះក្នុងការបើក DALL-E ដើម្បីបង្កើតរូបភាពពីអត្ថបទស្ថិតនៅក្នុងស្ថាបត្យកម្មបណ្តាញសរសៃប្រសាទដែលបានរចនាយ៉ាងពិសេសរបស់វា៖

សំណុំទិន្នន័យធំ៖

DALL-E ត្រូវ​បាន​បណ្តុះបណ្តាល​លើ​គូ​អត្ថបទ​រូបភាព​រាប់​ពាន់​លាន ដែល​អាច​ឱ្យ​វា​រៀន​ពី​គំនិត​ដែល​មើល​ឃើញ និង​ទំនាក់ទំនង​របស់​ពួកគេ​ចំពោះ​ខ្លឹមសារ​អត្ថបទ ឬ​ភាសា​និយាយ។ សំណុំទិន្នន័យដ៏ធំនេះផ្តល់ឱ្យវានូវការយល់ដឹងទូលំទូលាយអំពីចំណេះដឹងរបស់ពិភពលោក។

រចនាសម្ព័ន្ធឋានានុក្រម៖

បណ្តាញមានការតំណាងតាមឋានានុក្រមពីគោលគំនិតកម្រិតខ្ពស់រហូតដល់ព័ត៌មានលម្អិត។ ស្រទាប់ខាងលើយល់អំពីប្រភេទធំទូលាយ (ដូចជាសត្វស្លាប) ខណៈពេលដែលស្រទាប់ខាងក្រោមស្គាល់គុណលក្ខណៈតូចៗ (ដូចជារាងចំពុះ ពណ៌ និងទីតាំងនៅលើមុខ)។

ការអ៊ិនកូដអត្ថបទ៖

ដោយប្រើចំណេះដឹងនេះ DALL-E អាចបំប្លែងពាក្យដែលសរសេរទៅជាតំណាងគណិតវិទ្យានៃអត្ថបទ។ ឧទាហរណ៍ នៅពេលដែលយើងវាយអក្សរ "Flamingo-lion" វាដឹងថា flamingo ជាអ្វី សត្វតោជាអ្វី ហើយអាចបញ្ចូលគ្នានូវលក្ខណៈផ្សេងគ្នានៃសត្វទាំងពីរ។ តាមរយៈការបកប្រែនេះ ការបញ្ចូលអត្ថបទអាចបង្កើតលទ្ធផលដែលមើលឃើញ។

ស្ថាបត្យកម្មកម្រិតខ្ពស់នេះអនុញ្ញាតឱ្យ DALL-E បង្កើតរូបភាពប្រកបដោយភាពច្នៃប្រឌិត និងមានភាពស៊ីសង្វាក់គ្នាយ៉ាងត្រឹមត្រូវតាមគំរូអត្ថបទ។

ឥឡូវនេះ យើងយល់ពីភាពស្មុគស្មាញនៃបច្ចេកទេស ប៉ុន្តែសម្រាប់អ្នកប្រើប្រាស់ចុងក្រោយ ការប្រើប្រាស់ DALL-E គឺសាមញ្ញណាស់។

គ្រាន់តែបញ្ចូលប្រអប់បញ្ចូល និងបង្កើតរូបភាពគួរឱ្យភ្ញាក់ផ្អើល។

ម៉ូដែលភាសា និង DALL-E

ធាតុផ្សំសំខាន់នៃស្ថាបត្យកម្ម DALL-E គឺគំរូភាសា GPT (Generative Pretrained Transformer)។ គំរូទាំងនេះដើរតួនាទីយ៉ាងសំខាន់ក្នុងការបកស្រាយ និងកែលម្អគន្លឹះ។

គំរូ GPT គឺល្អក្នុងការចាប់យកបរិបទ និងភាពខុសគ្នាតិចតួចនៃភាសា។ នៅពេលដែលការបញ្ចូលត្រូវបានបញ្ចូល គំរូ GPT មិនត្រឹមតែអានពាក្យប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងយល់ពីចេតនា និងអត្ថន័យដ៏ស្រទន់នៅពីក្រោយពួកគេ។ ការយល់ដឹងនេះគឺមានសារៈសំខាន់សម្រាប់ការបកប្រែគំនិតអរូបី ឬស្មុគស្មាញទៅជាធាតុដែលមើលឃើញ ដែលផ្នែកបង្កើតរូបភាពរបស់ DALL-E អាចទាញយកប្រយោជន៍បាន។

ប្រសិនបើព័ត៌មានជំនួយដំបូងមិនច្បាស់លាស់ ឬទូលំទូលាយពេក គំរូ GPT អាចជួយកែលម្អ ឬពង្រីកព័ត៌មានជំនួយ។ តាមរយៈការបណ្ដុះបណ្ដាលយ៉ាងទូលំទូលាយលើភាសា និងប្រធានបទផ្សេងៗ វាអាចសន្និដ្ឋានថាព័ត៌មានលម្អិតណាមួយអាចពាក់ព័ន្ធ ឬគួរឱ្យចាប់អារម្មណ៍ចំពោះរូបភាព បើទោះបីជាមិនបានរៀបរាប់ឱ្យច្បាស់លាស់នៅក្នុងប្រអប់បញ្ចូលដើមក៏ដោយ។

គំរូ GPT ក៏អាចកំណត់អត្តសញ្ញាណកំហុសដែលអាចកើតមាន ឬភាពមិនច្បាស់លាស់នៅក្នុងព័ត៌មានជំនួយផងដែរ។ ឧទាហរណ៍ ប្រសិនបើប្រអប់បញ្ចូលមានភាពមិនស៊ីសង្វាក់គ្នានៃការពិត ឬភាសាដែលច្របូកច្របល់ គំរូអាចកែកំហុស ឬស្វែងរកការបំភ្លឺ ដោយធានាថាការបញ្ចូលចុងក្រោយទៅកាន់ម៉ាស៊ីនបង្កើតរូបភាពមានភាពច្បាស់លាស់ និងត្រឹមត្រូវតាមដែលអាចធ្វើទៅបាន។

គួរឱ្យចាប់អារម្មណ៍ តួនាទីរបស់ GPT មិនត្រូវបានកំណត់ចំពោះការយល់ដឹង និងការកែលម្អនោះទេ វាក៏អាចបន្ថែមស្រទាប់នៃភាពច្នៃប្រឌិតផងដែរ។ ជាមួយនឹងការបណ្តុះបណ្តាលយ៉ាងទូលំទូលាយ វាអាចនាំមកនូវការបកស្រាយប្លែកៗ ឬការស្រមើលស្រមៃនៃសញ្ញា ដែលជំរុញឱ្យមានដែនកំណត់នៃការបង្កើតរូបភាព។

នៅក្នុងខ្លឹមសារ គំរូភាសា GPT គឺជាអន្តរការីដ៏ឆ្លាតវៃរវាងការបញ្ចូលរបស់អ្នកប្រើប្រាស់ និងសមត្ថភាពបង្កើតរូបភាពរបស់ DALL-E ។ ពួកគេមិនត្រឹមតែធានាថាការបំផុសគំនិតត្រូវបានយល់យ៉ាងត្រឹមត្រូវប៉ុណ្ណោះទេ ពួកវាក៏ត្រូវបានពង្រឹង និងបង្កើនប្រសិទ្ធភាពដើម្បីបង្កើតលទ្ធផលដែលមើលឃើញពាក់ព័ន្ធ និងប្រកបដោយភាពច្នៃប្រឌិតបំផុត។

តើ DALL-E ប្រើសម្រាប់អ្វី?

វាលកម្មវិធីរបស់ DALL-E មានភាពចម្រុះ។ វាអាចត្រូវបានប្រើដើម្បីបង្កើតភាពខុសគ្នានៃធាតុដែលមើលឃើញដោយផ្តល់នូវការគាំទ្រផ្នែកច្នៃប្រឌិតនិងការរចនាសម្រាប់ឧស្សាហកម្មនិងការប្រើប្រាស់ផ្សេងៗគ្នា។

រចនា​ក្រាហ្វិក:

DALL-E អាចបង្កើតការហ្វឹកហ្វឺនដ៏ពិសេស និងគួរឱ្យទាក់ទាញលើរូបភាព អត្ថបទ និងសំណុំទិន្នន័យផ្សេងទៀត ដើម្បីទទួលបានការយល់ដឹងស៊ីជម្រៅអំពីទំនាក់ទំនងរវាងគំនិតផ្សេងៗ។

តាមរបៀបនេះ ពួកគេអាចបង្កើតលទ្ធផលប្រលោមលោក ដែលមានភាពប្រាកដនិយមខ្ពស់ និងត្រូវគ្នានឹងសញ្ញាដែលបានផ្តល់ឱ្យយ៉ាងត្រឹមត្រូវ។

ជាឧទាហរណ៍ AI ដែលបានទទួលការបណ្តុះបណ្តាលតែលើរូបថតសត្វឆ្មានឹងមិនអាចស្រមៃមើលប្រភេទសត្វប្រលោមលោកដូចជា "សត្វរុយ និងសត្វតោ" បានទេ។

ហើយតាមរយៈការបណ្តុះបណ្តាលលើរូបភាព អត្ថបទ និងអូឌីយ៉ូរាប់លាននៃសត្វ មនុស្ស ប្រដាប់ប្រដាក្មេងលេង និងអ្វីៗជាច្រើនទៀត គំរូជំនាន់អាចរួមបញ្ចូលគ្នានូវលទ្ធផលសិក្សាទាំងនេះដើម្បីបង្កើតជាកូនកាត់ដូចជា "flamingos និងតោ"។

នៅក្នុងកំណែចុងក្រោយរបស់ DALL-E 3 សមត្ថភាពបង្កើតរបស់ថ្មីនេះ កាន់តែមានថាមពលខ្លាំង។ វាបង្ហាញពីភាពប៉ិនប្រសប់ថ្មីក្នុងការបកស្រាយយ៉ាងត្រឹមត្រូវ និងចាប់យកភាពខុសគ្នា និងព័ត៌មានលម្អិតដែលម៉ូដែលមុនៗមិនអាចចាប់យកបាន។

បើប្រៀបធៀបជាមួយនឹងម៉ាស៊ីនបង្កើតបញ្ញាសិប្បនិម្មិតពីមុន DALL-E 3 បង្ហាញពីសមត្ថភាពយល់ដឹងកាន់តែប្រសើរឡើងនៅពេលទទួលបានការណែនាំដ៏ស្មុគស្មាញ។ ខណៈពេលដែលម៉ាស៊ីនភ្លើងមុនៗមានទំនោរបង្កើតលទ្ធផលដែលមិននឹកស្មានដល់នៅពេលដំណើរការការជម្រុញដ៏ស្មុគស្មាញ DALL-E 3 បង្ហាញពីការយល់ដឹងដ៏ល្អឥតខ្ចោះនៃភាសា ដែលអនុញ្ញាតឱ្យវាស្រមៃអំពីសេណារីយ៉ូប្រលោមលោក និងតួអក្សរលើសពីគំរូជំនាន់អត្ថបទទៅរូបភាពតាមការរំពឹងទុក។

ជាមួយនឹង DALL-E 3 ការតភ្ជាប់រវាងភាសា និងរូបភាពគឺកាន់តែរឹងមាំ ដូច្នេះវាអាចបកស្រាយបរិបទនៃប្រអប់បញ្ចូលជាជាងគ្រាន់តែអានវាពីស្គ្រីប។ លទ្ធផលដែលបានបង្កើតអាចមានភាពជិតស្និទ្ធនឹងតម្រូវការរបស់អ្នកប្រើប្រាស់។

នេះគឺជាឧទាហរណ៍នៃប្រអប់បញ្ចូលដ៏សាមញ្ញមួយ: "ស្រមៃមើលសត្វតោ flamingo" ។

លទ្ធផលរូបភាព៖

រូបភាព Flamingo-Lion ៤

ដូច្នេះតើវាសម្រេចបានដោយរបៀបណា? សមត្ថភាពក្នុងការ "ស្រមៃ" អត្ថបទនេះកើតចេញពីសមាសធាតុសំខាន់ពីរនៃគំរូ AI ជំនាន់៖

បណ្តាញសរសៃប្រសាទ៖

បណ្តាញសរសៃប្រសាទគឺជាបណ្តាញក្បួនដោះស្រាយឋានានុក្រមដែលក្លែងធ្វើគោលការណ៍ការងាររបស់ណឺរ៉ូននៅក្នុងខួរក្បាលមនុស្ស។ វាអនុញ្ញាតឱ្យបញ្ញាសិប្បនិមិត្តកំណត់អត្តសញ្ញាណគំរូ និងគំនិតនៅក្នុងសំណុំទិន្នន័យធំ។

ក្បួនដោះស្រាយការរៀនម៉ាស៊ីន៖

ក្បួនដោះស្រាយទាំងនេះ ដូចជាការសិក្សាស៊ីជម្រៅ បន្តកែលម្អការយល់ដឹងរបស់បណ្តាញសរសៃប្រសាទអំពីទំនាក់ទំនងទិន្នន័យ។

គំរូទូទៅបង្កើតការយល់ដឹងដ៏សម្បូរបែបអំពីពិភពលោកដោយការបណ្តុះបណ្តាលលើសំណុំទិន្នន័យដ៏ធំ។ ការជម្រុញដ៏ត្រឹមត្រូវអាចចម្លងលទ្ធផលសិក្សាទាំងនេះ ដើម្បីបង្កើតលទ្ធផលដែលមិនធ្លាប់មានពីមុនមក។

របៀបដែលស្ថាបត្យកម្មជំនាន់របស់ DALL-E ដំណើរការ

DALL-E អាចបង្កើតរូបភាពពីអត្ថបទ ដោយសារស្ថាបត្យកម្មបណ្តាញសរសៃប្រសាទដែលបានរចនាយ៉ាងពិសេសរបស់វា៖

សំណុំទិន្នន័យធំ៖

DALL-E ត្រូវបានបណ្តុះបណ្តាលលើគូរូបភាព-អត្ថបទរាប់ពាន់លាន ដែលអនុញ្ញាតឱ្យវារៀនគំនិតដែលមើលឃើញ និងការផ្សារភ្ជាប់គ្នារបស់ពួកគេជាមួយនឹងខ្លឹមសារអត្ថបទ ឬភាសានិយាយ។ សំណុំទិន្នន័យដ៏ធំនេះផ្តល់ឱ្យវានូវចំណេះដឹងទូលំទូលាយអំពីពិភពលោក។

រចនាសម្ព័ន្ធឋានានុក្រម៖

បណ្តាញនេះត្រូវបានតំណាងតាមឋានានុក្រម ចាប់ពីគោលគំនិតកម្រិតខ្ពស់ រហូតដល់ព័ត៌មានលម្អិត។ ស្រទាប់ខាងលើយល់អំពីប្រភេទធំទូលាយ (ដូចជាសត្វស្លាប) ខណៈពេលដែលស្រទាប់ខាងក្រោមស្គាល់គុណលក្ខណៈតូចៗ (ដូចជារាងចំពុះ ពណ៌ និងទីតាំងនៅលើមុខ)។

ការអ៊ិនកូដអត្ថបទ៖

ជាមួយនឹងចំណេះដឹងនេះ DALL-E អាចបំប្លែងពាក្យសរសេរទៅជាតំណាងគណិតវិទ្យា។ ឧទាហរណ៍ នៅពេលដែលយើងវាយអក្សរ "flamingo lion" វាដឹងថា flamingo និង lion ជាអ្វី ហើយអាចបញ្ចូលគ្នានូវលក្ខណៈផ្សេងគ្នានៃសត្វទាំងពីរ។ តាមរយៈការបកប្រែប្រភេទនេះ ការបញ្ចូលអត្ថបទអាចបង្កើតលទ្ធផលដែលមើលឃើញ។

ស្ថាបត្យកម្មកម្រិតខ្ពស់នេះជួយ DALL-E បង្កើតរូបភាពប្រកបដោយភាពច្នៃប្រឌិត និងស៊ីសង្វាក់គ្នា ដោយផ្អែកលើសញ្ញាអត្ថបទច្បាស់លាស់។

ឥឡូវនេះ យើងដឹងថាបញ្ហាបច្ចេកទេសអាចស្មុគស្មាញ ប៉ុន្តែសម្រាប់អ្នកប្រើប្រាស់ចុងក្រោយ ប្រតិបត្តិការគឺសាមញ្ញណាស់។

គ្រាន់តែផ្តល់គន្លឹះ និងបង្កើតរូបភាពគួរឱ្យភ្ញាក់ផ្អើល។

ម៉ូដែលភាសា និង DALL-E

ធាតុផ្សំសំខាន់នៃស្ថាបត្យកម្មរបស់ DALL-E គឺគំរូភាសា GPT (Generative Pretrained Transformer)។ ម៉ូដែលទាំងនេះដើរតួនាទីយ៉ាងសំខាន់ក្នុងការបកស្រាយ និងកែលម្អគន្លឹះ ដើម្បីបង្កើនប្រសិទ្ធភាពការបង្កើតរូបភាព។

ម៉ូដែល GPT គឺល្អក្នុងការយល់ដឹងអំពីបរិបទ និងភាពខុសគ្នានៃភាសា។ នៅពេលមានការជម្រុញ គំរូ GPT មិនត្រឹមតែអាចស្គាល់ពាក្យប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងយល់ពីចេតនា និងអត្ថន័យដ៏ស្រទន់នៅពីក្រោយពួកវាផងដែរ។ ការយល់ដឹងនេះគឺមានសារៈសំខាន់សម្រាប់ការបកប្រែគំនិតអរូបី ឬស្មុគស្មាញទៅជាធាតុដែលមើលឃើញ ដែលផ្នែកបង្កើតរូបភាពរបស់ DALL-E អាចទាញយកប្រយោជន៍បាន។

ប្រសិនបើការជម្រុញដំបូងអាចមានភាពមិនច្បាស់លាស់ ឬទូលំទូលាយពេកនោះ គំរូ GPT អាចជួយកែលម្អ ឬពង្រីកប្រអប់បញ្ចូល។ តាមរយៈការបណ្ដុះបណ្ដាលយ៉ាងទូលំទូលាយលើភាសា និងប្រធានបទផ្សេងៗ វាអាចសន្និដ្ឋានថាព័ត៌មានលម្អិតអាចពាក់ព័ន្ធ ឬគួរឱ្យចាប់អារម្មណ៍ចំពោះរូបភាពមួយណា បើទោះបីជាពួកគេមិនត្រូវបានរៀបរាប់ឱ្យច្បាស់លាស់នៅក្នុងប្រអប់បញ្ចូលដើមក៏ដោយ។

គំរូ GPT ក៏អាចកំណត់អត្តសញ្ញាណកំហុសដែលអាចកើតមាន ឬភាពមិនច្បាស់លាស់នៅក្នុងព័ត៌មានជំនួយផងដែរ។ ឧទាហរណ៍ ប្រសិនបើប្រអប់បញ្ចូលមានភាពមិនស៊ីសង្វាក់គ្នានៃការពិត ឬភាសាដែលច្របូកច្របល់ គំរូអាចកែកំហុស ឬស្វែងរកការបំភ្លឺ ដោយធានាថាលទ្ធផលចុងក្រោយនៃម៉ាស៊ីនបង្កើតរូបភាពមានភាពច្បាស់លាស់ និងត្រឹមត្រូវតាមដែលអាចធ្វើទៅបាន។

គួរឱ្យចាប់អារម្មណ៍ តួនាទីរបស់ GPT មិនត្រូវបានកំណត់ចំពោះការយល់ដឹង និងការកែលម្អនោះទេ វាក៏អាចបន្ថែមស្រទាប់នៃភាពច្នៃប្រឌិតផងដែរ។ ជាមួយនឹងការបណ្តុះបណ្តាលយ៉ាងទូលំទូលាយ វាអាចនាំមកនូវការបកស្រាយប្លែកៗ ឬការស្រមើស្រមៃនៃសញ្ញា ដែលជំរុញឱ្យមានដែនកំណត់ច្នៃប្រឌិតនៃការបង្កើតរូបភាព។

នៅក្នុងខ្លឹមសារ គំរូភាសា GPT គឺជាអន្តរការីដ៏ឆ្លាតវៃរវាងការបញ្ចូលរបស់អ្នកប្រើប្រាស់ និងសមត្ថភាពបង្កើតរូបភាពរបស់ DALL-E ។ វាមិនត្រឹមតែធានាថាការជម្រុញត្រូវបានយល់យ៉ាងត្រឹមត្រូវប៉ុណ្ណោះទេ ប៉ុន្តែវាក៏ត្រូវបានពង្រឹង និងធ្វើឱ្យប្រសើរផងដែរ ដើម្បីបង្កើតលទ្ធផលដែលពាក់ព័ន្ធ និងប្រកបដោយភាពច្នៃប្រឌិតបំផុត។

ការអនុវត្ត DALL-E

DALL-E មិនត្រឹមតែជាការបង្ហាញពីបច្ចេកវិទ្យាត្រជាក់ប៉ុណ្ណោះទេ វាមានកម្មវិធីជាក់ស្តែងជាច្រើន។

1. ការរចនាច្នៃប្រឌិត៖

អ្នករចនាអាចដឹងពីគំនិតច្នៃប្រឌិតរបស់ពួកគេយ៉ាងងាយស្រួលជាមួយ DALL-E ។ មិនថាវាជាគំនិតផលិតផលតែមួយគត់ រូបភាពផ្សាយពាណិជ្ជកម្ម ឬការងារសិល្បៈ DALL-E អាចបញ្ចូលការបំផុសគំនិតថ្មីទៅក្នុងវិស័យរចនា។

2. ការបង្កើតខ្លឹមសារ៖

អ្នកនិពន្ធ និងអ្នកបង្កើតអាចប្រើ DALL-E ដើម្បីបង្កើតធាតុដែលមើលឃើញសម្រាប់រឿង អត្ថបទ ឬរឿងកំប្លែងរបស់ពួកគេ។ នេះជួយបង្កើនការបង្កើតរបស់ពួកគេ និងធ្វើឱ្យពួកគេកាន់តែទាក់ទាញ។

3. ការលក់ទំនិញដែលមើលឃើញ៖

ក្រុមម៉ាក និងទីផ្សារអាចប្រើ DALL-E ដើម្បីបង្កើតការផ្សាយពាណិជ្ជកម្ម ផ្ទាំងរូបភាព និងសម្ភារៈផ្សព្វផ្សាយផ្សេងៗទៀតដែលទាក់ទាញភ្នែក។ វាជួយបង្កើនការយល់ដឹងអំពីម៉ាកយីហោ និងទាក់ទាញទស្សនិកជនគោលដៅកាន់តែច្រើន។

4. ជំនួយផ្នែកអប់រំ៖

អ្នកអប់រំអាចប្រើ DALL-E ដើម្បីបង្កើតរូបភាពដើម្បីធ្វើឱ្យឯកសារបង្រៀនកាន់តែរស់រវើក និងគួរឱ្យចាប់អារម្មណ៍។ សិស្សអាចយល់កាន់តែច្បាស់អំពីគំនិតស្មុគស្មាញតាមរយៈធាតុដែលមើលឃើញ។

5. ការបង្កើតឈុតនិម្មិត៖

ផលិតករភាពយន្ត និងទូរទស្សន៍ និងអ្នកបង្កើតហ្គេមអាចប្រើ DALL-E ដើម្បីបង្កើតឈុតឆាក តួអង្គ និងឈុតប្លែកៗ ដើម្បីបន្ថែមពណ៌ដល់ស្នាដៃរបស់ពួកគេ។

នេះគ្រាន់តែជាចុងផ្ទាំងទឹកកកនៃ DALL-E ហើយតំបន់កម្មវិធីរបស់វានៅតែពង្រីក។ វានាំមកនូវភាពច្នៃប្រឌិត និងប្រសិទ្ធភាពដែលមិនធ្លាប់មានពីមុនមកដល់គ្រប់មជ្ឈដ្ឋាន។

នៅក្នុងសេចក្តីសន្និដ្ឋាន

នៅក្នុងរលកនៃបញ្ញាសិប្បនិម្មិត DALL-E គឺពិតជាសេះងងឹត។ វាបង្ហាញពីសមត្ថភាពមិនធម្មតានៃបញ្ញាសិប្បនិម្មិតក្នុងការបង្កើតរូបភាព ដោយផ្តល់នូវឧបករណ៍ដ៏មានឥទ្ធិពលសម្រាប់អ្នកបង្កើត អ្នករចនា និងអ្នកជំនាញផ្នែកទីផ្សារ។

តាមរយៈការសិក្សាជ្រៅជ្រះ និងបណ្តាញសរសៃប្រសាទកម្រិតខ្ពស់ DALL-E មិនត្រឹមតែអាចយល់ពីការបំផុសគំនិតតាមអត្ថបទប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងអាចបំប្លែងពួកវាទៅជាខ្លឹមសារដែលមើលឃើញគួរឱ្យភ្ញាក់ផ្អើលទៀតផង។ ដំណើរការបង្កើតរបស់វារួមបញ្ចូលគ្នានូវបញ្ញាសិប្បនិម្មិត និងគំរូភាសា ដើម្បីផ្តល់ឱ្យអ្នកប្រើប្រាស់នូវបទពិសោធន៍ដ៏សាមញ្ញ និងមានឥទ្ធិពល។

មិនថាវាជាការរចនាប្រកបដោយភាពច្នៃប្រឌិត ការបង្កើតមាតិកា ឬទីផ្សារនោះទេ DALL-E បានចាក់បញ្ចូលភាពរឹងមាំថ្មីទៅក្នុងឧស្សាហកម្មផ្សេងៗ។ វាមិនត្រឹមតែជាកំពូលនៃបច្ចេកវិទ្យាប៉ុណ្ណោះទេ ប៉ុន្តែក៏ជាប្រភពនៃការច្នៃប្រឌិតគ្មានដែនកំណត់ផងដែរ។

នៅពេលដែលបច្ចេកវិទ្យាបន្តវិវឌ្ឍ យើងអាចរំពឹងថាកំណែអនាគតរបស់ DALL-E នឹងនាំមកនូវការភ្ញាក់ផ្អើលកាន់តែច្រើន និងបញ្ចូលភាពរឹងមាំបន្ថែមទៀតទៅក្នុងវិស័យបញ្ញាសិប្បនិមិត្ត។

Hope Chen Weiliang Blog ( https://www.chenweiliang.com/ ) បានចែករំលែក ការប្រកាស របស់ "How to use DALL-E to create images?" អត្ថបទ AI បង្កើតរូបគំនូរ និយាយថាលាហើយការគូររូបដែលបោកប្រាស់! 》 មានប្រយោជន៍សម្រាប់អ្នក។

សូមស្វាគមន៍ចំពោះការចែករំលែកតំណភ្ជាប់នៃអត្ថបទនេះ៖https://www.chenweiliang.com/cwl-31503.html

សូមស្វាគមន៍មកកាន់ឆានែល Telegram នៃប្លុករបស់ Chen Weiliang ដើម្បីទទួលបានព័ត៌មានថ្មីៗចុងក្រោយបង្អស់!

🔔 ក្លាយជាអ្នកដំបូងដែលទទួលបាន "ការណែនាំអំពីការប្រើប្រាស់ឧបករណ៍ AI ទីផ្សារមាតិកា ChatGPT" ដ៏មានតម្លៃនៅក្នុងបញ្ជីកំពូលរបស់ប៉ុស្តិ៍! 🌟
📚 មគ្គុទ្ទេសក៍នេះមានតម្លៃមហាសាល 🌟នេះជាឱកាសដ៏កម្រ សូមកុំអូសរំលង! ⏰⌛💨
Share និង Like ប្រសិនបើអ្នកចូលចិត្ត!
ការចែករំលែក និងការចូលចិត្តរបស់អ្នកគឺជាការលើកទឹកចិត្តបន្តរបស់យើង!

 

发表评论។

អាសយដ្ឋានអ៊ីមែលរបស់អ្នកនឹងមិនត្រូវបានផ្សព្វផ្សាយទេ។ 必填项已用។ * 标注។

រំកិលទៅកំពូល