បញ្ជីអត្ថបទ
✨បញ្ចេញការស្រមើលស្រមៃរបស់អ្នកជាមួយ DALL-E🚀! បដិវត្តន៍នេះ។ AI ឧបករណ៍បង្កើតរូបភាពអនុញ្ញាតឱ្យអ្នកបង្កើតរូបភាពគួរឱ្យភ្ញាក់ផ្អើលជាមួយនឹងអត្ថបទ🎨។
គ្រាន់តែបញ្ចូលគំនិតរបស់អ្នក ហើយ DALL-E នឹងប្រែក្លាយវាទៅជាស្នាដៃសិល្បៈដូចជីវិត!
ពីទេសភាពសុបិន្តទៅគួរឱ្យភ្ញាក់ផ្អើលតួអក្សរបញ្ឈរ, លទ្ធភាពគឺគ្មានដែនកំណត់នៃ។
ចូលរួមជាមួយរង្វង់វេទមន្តគំនូរ DALL-E ហើយចាប់ផ្តើមដំណើរសិល្បៈរបស់អ្នក!
ថ្មីៗនេះ វិស័យបញ្ញាសិប្បនិមិត្ត (AI) មានការរីកចម្រើនគួរឲ្យកត់សម្គាល់។ជជែក GPT វាមិនត្រឹមតែពូកែក្នុងការបង្កើតអត្ថបទប៉ុណ្ណោះទេ ប៉ុន្តែដំណាក់កាល AI របស់យើងពង្រីកបន្តិចម្តងៗលើសពីអត្ថបទសុទ្ធ។
តើ DALL-E ជាអ្វី?
DALL-E គឺជាប្រព័ន្ធ AI បដិវត្តន៍ដែលបង្កើតរូបភាពដោយផ្អែកលើការពិពណ៌នាអត្ថបទ។
DALL-E គឺជាព្រឹត្តិការណ៍ដ៏សំខាន់មួយក្នុងការច្នៃប្រឌិតបញ្ញាសិប្បនិមិត្ត ហើយកំណែចុងក្រោយបង្អស់ DALL-E 3 កាន់តែមានថាមពលខ្លាំងជាងមុន។
នៅក្នុងការណែនាំនេះ យើងនឹងពិនិត្យមើលឱ្យបានដិតដល់នូវអ្វីដែល DALL-E ជាអ្វី របៀបដែលវាដំណើរការ តំបន់នៃកម្មវិធីរបស់វា និងការណែនាំសម្រាប់ការប្រើប្រាស់វាដើម្បីបង្កើតមាតិកាដែលមើលឃើញដ៏អស្ចារ្យ។
គំនិតនេះស្តាប់ទៅសាមញ្ញ ប៉ុន្តែដើម្បីទទួលបានលទ្ធផលល្អបំផុត អ្នកត្រូវអនុវត្តតាមគន្លឹះទាំងនេះសម្រាប់លទ្ធផលស្វែងរកពិតប្រាកដ និងត្រឹមត្រូវ! ដើម្បីធានាថាអ្នកទទួលបានលទ្ធផលស្វែងរកពិតប្រាកដ និងត្រឹមត្រូវបំផុត យើងផ្តល់ឱ្យអ្នកនូវគន្លឹះ និងល្បិចដូចខាងក្រោម។
មុនពេលប្រើ DALL-E មានច្បាប់ថែរក្សាផ្ទះបីដែលអ្នកត្រូវយល់៖
ចាប់តាំងពីអ្នកបានបង្កើតគំនិតបច្ចេកទេសសម្រាប់ស្នាដៃសិល្បៈរបស់អ្នក អ្នកគឺជាសិល្បករតាមលំនាំដើម ទោះបីជារូបភាពនឹងត្រូវបានទាញយកដោយប្រើពណ៌ទឹករបស់ DALL-E 2 ក៏ដោយ។
មានដែនកំណត់ចំពោះអ្វីដែលអ្នកអាចបង្កើតបាន។ ឧទាហរណ៍ គោលនយោបាយខ្លឹមសាររបស់ DALL-E 2 ហាមឃាត់ខ្លឹមសារដែលបង្កគ្រោះថ្នាក់ បោកបញ្ឆោត ឬនយោបាយ។ ដើម្បីទប់ស្កាត់ការរំលោភបំពាន ពាក្យស្វែងរកមួយចំនួនសម្រាប់បុគ្គលសាធារណៈ ដូចជា Taylor Swift ត្រូវបានបិទ។ ខណៈពេលដែលមិនមែនតារាល្បីទាំងអស់បំពានគោលការណ៍ខ្លឹមសារ មុខរបស់ពួកគេជារឿយៗត្រូវបានបង្ខូចទ្រង់ទ្រាយដើម្បីសុវត្ថិភាព។
ដែនកំណត់ឥណទានសម្រាប់ DALL-E 2៖ អ្នកប្រើប្រាស់ដែលចុះឈ្មោះ និងបង្កើតគណនីតាមរយៈអ៊ីមែលមុនថ្ងៃទី 2023 ខែមេសា ឆ្នាំ 4 អាចទទួលបាន 6 ក្រេឌីតឥតគិតថ្លៃ ផុតកំណត់ និងបន្តជារៀងរាល់ខែ។ ឧទាហរណ៍ ខ្ញុំបានចុះឈ្មោះនៅថ្ងៃទី 15 ខែកញ្ញា ឆ្នាំ 2022 ដូច្នេះខ្ញុំទទួលបាន 9 ក្រេឌីតឥតគិតថ្លៃរៀងរាល់ខែ ដែលបន្តដោយស្វ័យប្រវត្តិ។ សូមចំណាំថា ក្រេឌីតឥតគិតថ្លៃមិនអាចបង្វិលបានទេ ដូច្នេះទោះបីជាខ្ញុំមិនបង្កើតសិល្បៈរយៈពេលបីខែក៏ដោយ ក៏ខ្ញុំមិនអាចប្រមូលបាន 25 ក្រេឌីតដែរ។ អ្នកប្រើថ្មីដែលទើបបង្កើតគណនីលែងទទួលបានអត្ថប្រយោជន៍ឥណទានឥតគិតថ្លៃដូចគ្នាហើយត្រូវតែទិញឥណទានយ៉ាងហោចណាស់ 15 សម្រាប់តម្លៃ 60 ដុល្លារ។ អ្នកប្រើប្រាស់អាចទិញក្រេឌីត DALL-E ដាច់ដោយឡែកតាមរយៈ labs.openai.com ដែលត្រូវបានចេញវិក្កយបត្រដាច់ដោយឡែកពី DALL-E API។
ក្រេឌីតអាចលោះបានតែបន្ទាប់ពីពួកវាត្រូវបានបញ្ចូល និងបង្កើត ការស្វែងរកដែលនៅទីបំផុតមិនត្រូវបានបង្កើតដោយសារតែការបំពានគោលការណ៍ខ្លឹមសារនឹងមិនត្រូវបានកាត់ចេញពីឥណទានឥតគិតថ្លៃនោះទេ។ អ្នកអាចចុចលើរូបតំណាងប្រវត្តិរូបរបស់អ្នកនៅជ្រុងខាងស្តាំខាងលើនៃចំណុចប្រទាក់ស្វែងរក ដើម្បីមើលថាតើឥណទានដែលអ្នកបានចាកចេញជារៀងរាល់ខែ ហើយអ្នកអាចជ្រើសរើសទិញបន្ថែមទៀត ដោយចាប់ផ្តើមពី $115 សម្រាប់ 15 ក្រេឌីត។
របៀបប្រើ DALL-E ដើម្បីបង្កើតរូបភាព?
DALL-E គឺជាឧបករណ៍ឆ្លាតវៃសិប្បនិម្មិតដ៏មានឥទ្ធិពលបំផុតមួយនៅលើទីផ្សារនាពេលបច្ចុប្បន្ន។
នេះគឺជាម៉ាស៊ីនបង្កើតរូបភាពឆ្លាតវៃសិប្បនិម្មិតដែលបង្កើតឡើងដោយក្រុម OpenAI នៅពីក្រោយ ChatGPT ។ វាប្រើបច្ចេកវិទ្យាមួយហៅថា "បញ្ញាសិប្បនិម្មិតជំនាន់" ដើម្បីបង្កើតរូបភាពដើមពីទទេដោយផ្អែកលើការជម្រុញអត្ថបទ។
ឧទាហរណ៍ប្រសិនបើអ្នកបញ្ចូលអត្ថបទ "an avocado chair with a red colored monkey
”, DALL-E នឹងបង្កើតរូបភាពថ្មីនៃវត្ថុចម្លែកនេះ។
ជាជាងគ្រាន់តែកាត់ និងបង្រួមផ្នែកនៃរូបភាព វាពិតជា "ស្រមៃ" នូវអ្វីដែលអ្នកកំពុងពណ៌នា។ ការពិពណ៌នារបស់អ្នកកាន់តែលម្អិត នោះរូបភាពលទ្ធផលនឹងមានភាពចម្រាញ់កាន់តែច្រើន។
គួរកត់សម្គាល់ថាឈ្មោះ "DALL-E" គឺជាការស្រមើស្រមៃរបស់វិចិត្រករ surrealist Salvador Dali និងតួអង្គមនុស្សយន្តដែលរួសរាយរាក់ទាក់របស់ Pixar WALL-E ។ នេះបង្ហាញពីរបៀបដែល DALL-E រួមបញ្ចូលគ្នានូវសិល្បៈ និងបច្ចេកវិទ្យា ដើម្បីបង្កើតបែបផែនរូបភាពដ៏អស្ចារ្យដោយផ្ទាល់ពីការពិពណ៌នាអត្ថបទ។
នេះគឺជាភាពអស្ចារ្យរបស់ DALL-E ដែលតំណាងឱ្យការលោតផ្លោះនៃការច្នៃប្រឌិតបញ្ញាសិប្បនិម្មិត។
ខណៈពេលដែលមនុស្សអាចស្រមើស្រមៃបានយ៉ាងងាយស្រួលតាមរយៈពាក្យសម្ដី កុំព្យូទ័រធ្លាប់មិនអាចធ្វើដូច្នេះបាន ជាពិសេសមិនមានលក្ខណៈរស់រវើកនោះទេ។ DALL-E ដឹងពីការស្រមើលស្រមៃជាក់ស្តែង និងសមត្ថភាពដោះស្រាយបញ្ហាដែលមាននៅក្នុងកុំព្យូទ័រ បើកលទ្ធភាពដ៏គួរឱ្យរំភើបសម្រាប់ការរចនាក្រាហ្វិក គំរូរូបភាព ប្លង់គេហទំព័រ និងច្រើនទៀត។
តើ DALL-E ដំណើរការយ៉ាងដូចម្តេច?
តើ DALL-E បញ្ចេញវេទមន្តដោយរបៀបណា? ដូចដែលបានរៀបរាប់ខាងលើ វាប្រើបច្ចេកវិទ្យាមួយហៅថា "បញ្ញាសិប្បនិម្មិតជំនាន់"។ សូមពិនិត្យមើលឲ្យកាន់តែជិត។
ម៉ូដែល AI ជំនាន់
មិនដូច AI ជាក់លាក់សម្រាប់កិច្ចការភាគច្រើនទេ ម៉ូដែល AI ជំនាន់ថ្មីមិនមានឯកទេសដើម្បីអនុវត្តកិច្ចការជាក់លាក់ណាមួយឡើយ។
ផ្ទុយទៅវិញ ពួកគេត្រូវបានបណ្តុះបណ្តាលលើសំណុំដ៏ធំនៃរូបភាព អត្ថបទ និងទិន្នន័យផ្សេងទៀត ដើម្បីបង្កើតការយល់ដឹងយ៉ាងស៊ីជម្រៅអំពីទំនាក់ទំនងរវាងគំនិតផ្សេងៗ។
នេះអនុញ្ញាតឱ្យពួកគេបង្កើតលទ្ធផលថ្មីដែលមានភាពប្រាកដនិយមខ្ពស់ និងត្រូវគ្នានឹងការជំរុញឱ្យត្រឹមត្រូវ។
ឧទាហរណ៍ AI ដែលបានហ្វឹកហាត់តែលើរូបថតសត្វឆ្មានឹងមិនអាចស្រមៃឃើញសត្វប្រលោមលោកដូចជា "flamingo-lion" ទេ។ ដោយបានបណ្តុះបណ្តាលលើរូបភាពរាប់លាននៃប្រភេទសត្វ សត្វ មនុស្ស ប្រដាប់ប្រដាក្មេងលេង និងច្រើនទៀត គំរូជំនាន់អាចរួមបញ្ចូលគ្នានូវចំណេះដឹងនេះដើម្បីបង្កើតជាកូនកាត់ flamingo-lion ដោយផ្អែកលើការជម្រុញឱ្យជឿជាក់។
នៅក្នុងកំណែចុងក្រោយរបស់ DALL-E 3 សមត្ថភាពបង្កើតរបស់ថ្មីទាំងស្រុងត្រូវបានបង្ហាញឱ្យឃើញបន្ថែមទៀត។ កំណែថ្មីនេះបង្ហាញពីកម្រិតកាន់តែខ្ពស់នៃភាពត្រឹមត្រូវក្នុងការបកស្រាយសញ្ញា ចាប់យកភាពខុសគ្នានិងព័ត៌មានលម្អិតដែលម៉ូដែលមុនមិនអាចចាប់យកបាន។
បើប្រៀបធៀបជាមួយម៉ាស៊ីនបង្កើតបញ្ញាសិប្បនិម្មិតពីមុន DALL-E 3 លែងងាយទទួលបានលទ្ធផលដែលមិននឹកស្មានដល់នៅពេលទទួលបានការណែនាំស្មុគស្មាញ។ ផ្ទុយទៅវិញ វាបង្ហាញពីការយល់ដឹងដ៏ប្រសើរនៃភាសាដែលអាចឱ្យវាស្រមៃអំពីសេណារីយ៉ូប្រលោមលោក និងតួអក្សរដែលលើសពីការរំពឹងទុកពីគំរូបង្កើតអត្ថបទទៅរូបភាព។
ជាមួយនឹង DALL-E 3 ការតភ្ជាប់រវាងភាសា និងរូបភាពគឺកាន់តែជិតស្និទ្ធ ជាមួយនឹងសមត្ថភាពក្នុងការបកស្រាយបរិបទនៃសញ្ញាជាជាងបង្កើតរូបភាពដោយមេកានិច។ នេះធ្វើឱ្យរូបភាពដែលបានបង្កើតកាន់តែជិតទៅនឹងការរំពឹងទុករបស់អ្នកប្រើប្រាស់។
បន្ទាប់មក សូមពិនិត្យមើលឱ្យកាន់តែស៊ីជម្រៅអំពីរបៀបដែលស្ថាបត្យកម្មជំនាន់របស់ DALL-E ដំណើរការ។
តើស្ថាបត្យកម្មជំនាន់របស់ DALL-E ដំណើរការយ៉ាងដូចម្តេច?
គន្លឹះក្នុងការបើក DALL-E ដើម្បីបង្កើតរូបភាពពីអត្ថបទស្ថិតនៅក្នុងស្ថាបត្យកម្មបណ្តាញសរសៃប្រសាទដែលបានរចនាយ៉ាងពិសេសរបស់វា៖
សំណុំទិន្នន័យធំ៖
DALL-E ត្រូវបានបណ្តុះបណ្តាលលើគូអត្ថបទរូបភាពរាប់ពាន់លាន ដែលអាចឱ្យវារៀនពីគំនិតដែលមើលឃើញ និងទំនាក់ទំនងរបស់ពួកគេចំពោះខ្លឹមសារអត្ថបទ ឬភាសានិយាយ។ សំណុំទិន្នន័យដ៏ធំនេះផ្តល់ឱ្យវានូវការយល់ដឹងទូលំទូលាយអំពីចំណេះដឹងរបស់ពិភពលោក។
រចនាសម្ព័ន្ធឋានានុក្រម៖
បណ្តាញមានការតំណាងតាមឋានានុក្រមពីគោលគំនិតកម្រិតខ្ពស់រហូតដល់ព័ត៌មានលម្អិត។ ស្រទាប់ខាងលើយល់អំពីប្រភេទធំទូលាយ (ដូចជាសត្វស្លាប) ខណៈពេលដែលស្រទាប់ខាងក្រោមស្គាល់គុណលក្ខណៈតូចៗ (ដូចជារាងចំពុះ ពណ៌ និងទីតាំងនៅលើមុខ)។
ការអ៊ិនកូដអត្ថបទ៖
ដោយប្រើចំណេះដឹងនេះ DALL-E អាចបំប្លែងពាក្យដែលសរសេរទៅជាតំណាងគណិតវិទ្យានៃអត្ថបទ។ ឧទាហរណ៍ នៅពេលដែលយើងវាយអក្សរ "Flamingo-lion" វាដឹងថា flamingo ជាអ្វី សត្វតោជាអ្វី ហើយអាចបញ្ចូលគ្នានូវលក្ខណៈផ្សេងគ្នានៃសត្វទាំងពីរ។ តាមរយៈការបកប្រែនេះ ការបញ្ចូលអត្ថបទអាចបង្កើតលទ្ធផលដែលមើលឃើញ។
ស្ថាបត្យកម្មកម្រិតខ្ពស់នេះអនុញ្ញាតឱ្យ DALL-E បង្កើតរូបភាពប្រកបដោយភាពច្នៃប្រឌិត និងមានភាពស៊ីសង្វាក់គ្នាយ៉ាងត្រឹមត្រូវតាមគំរូអត្ថបទ។
ឥឡូវនេះ យើងយល់ពីភាពស្មុគស្មាញនៃបច្ចេកទេស ប៉ុន្តែសម្រាប់អ្នកប្រើប្រាស់ចុងក្រោយ ការប្រើប្រាស់ DALL-E គឺសាមញ្ញណាស់។
គ្រាន់តែបញ្ចូលប្រអប់បញ្ចូល និងបង្កើតរូបភាពគួរឱ្យភ្ញាក់ផ្អើល។
ម៉ូដែលភាសា និង DALL-E
ធាតុផ្សំសំខាន់នៃស្ថាបត្យកម្ម DALL-E គឺគំរូភាសា GPT (Generative Pretrained Transformer)។ គំរូទាំងនេះដើរតួនាទីយ៉ាងសំខាន់ក្នុងការបកស្រាយ និងកែលម្អគន្លឹះ។
គំរូ GPT គឺល្អក្នុងការចាប់យកបរិបទ និងភាពខុសគ្នាតិចតួចនៃភាសា។ នៅពេលដែលការបញ្ចូលត្រូវបានបញ្ចូល គំរូ GPT មិនត្រឹមតែអានពាក្យប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងយល់ពីចេតនា និងអត្ថន័យដ៏ស្រទន់នៅពីក្រោយពួកគេ។ ការយល់ដឹងនេះគឺមានសារៈសំខាន់សម្រាប់ការបកប្រែគំនិតអរូបី ឬស្មុគស្មាញទៅជាធាតុដែលមើលឃើញ ដែលផ្នែកបង្កើតរូបភាពរបស់ DALL-E អាចទាញយកប្រយោជន៍បាន។
ប្រសិនបើព័ត៌មានជំនួយដំបូងមិនច្បាស់លាស់ ឬទូលំទូលាយពេក គំរូ GPT អាចជួយកែលម្អ ឬពង្រីកព័ត៌មានជំនួយ។ តាមរយៈការបណ្ដុះបណ្ដាលយ៉ាងទូលំទូលាយលើភាសា និងប្រធានបទផ្សេងៗ វាអាចសន្និដ្ឋានថាព័ត៌មានលម្អិតណាមួយអាចពាក់ព័ន្ធ ឬគួរឱ្យចាប់អារម្មណ៍ចំពោះរូបភាព បើទោះបីជាមិនបានរៀបរាប់ឱ្យច្បាស់លាស់នៅក្នុងប្រអប់បញ្ចូលដើមក៏ដោយ។
គំរូ GPT ក៏អាចកំណត់អត្តសញ្ញាណកំហុសដែលអាចកើតមាន ឬភាពមិនច្បាស់លាស់នៅក្នុងព័ត៌មានជំនួយផងដែរ។ ឧទាហរណ៍ ប្រសិនបើប្រអប់បញ្ចូលមានភាពមិនស៊ីសង្វាក់គ្នានៃការពិត ឬភាសាដែលច្របូកច្របល់ គំរូអាចកែកំហុស ឬស្វែងរកការបំភ្លឺ ដោយធានាថាការបញ្ចូលចុងក្រោយទៅកាន់ម៉ាស៊ីនបង្កើតរូបភាពមានភាពច្បាស់លាស់ និងត្រឹមត្រូវតាមដែលអាចធ្វើទៅបាន។
គួរឱ្យចាប់អារម្មណ៍ តួនាទីរបស់ GPT មិនត្រូវបានកំណត់ចំពោះការយល់ដឹង និងការកែលម្អនោះទេ វាក៏អាចបន្ថែមស្រទាប់នៃភាពច្នៃប្រឌិតផងដែរ។ ជាមួយនឹងការបណ្តុះបណ្តាលយ៉ាងទូលំទូលាយ វាអាចនាំមកនូវការបកស្រាយប្លែកៗ ឬការស្រមើលស្រមៃនៃសញ្ញា ដែលជំរុញឱ្យមានដែនកំណត់នៃការបង្កើតរូបភាព។
នៅក្នុងខ្លឹមសារ គំរូភាសា GPT គឺជាអន្តរការីដ៏ឆ្លាតវៃរវាងការបញ្ចូលរបស់អ្នកប្រើប្រាស់ និងសមត្ថភាពបង្កើតរូបភាពរបស់ DALL-E ។ ពួកគេមិនត្រឹមតែធានាថាការបំផុសគំនិតត្រូវបានយល់យ៉ាងត្រឹមត្រូវប៉ុណ្ណោះទេ ពួកវាក៏ត្រូវបានពង្រឹង និងបង្កើនប្រសិទ្ធភាពដើម្បីបង្កើតលទ្ធផលដែលមើលឃើញពាក់ព័ន្ធ និងប្រកបដោយភាពច្នៃប្រឌិតបំផុត។
តើ DALL-E ប្រើសម្រាប់អ្វី?
វាលកម្មវិធីរបស់ DALL-E មានភាពចម្រុះ។ វាអាចត្រូវបានប្រើដើម្បីបង្កើតភាពខុសគ្នានៃធាតុដែលមើលឃើញដោយផ្តល់នូវការគាំទ្រផ្នែកច្នៃប្រឌិតនិងការរចនាសម្រាប់ឧស្សាហកម្មនិងការប្រើប្រាស់ផ្សេងៗគ្នា។
រចនាក្រាហ្វិក:
DALL-E អាចបង្កើតការហ្វឹកហ្វឺនដ៏ពិសេស និងគួរឱ្យទាក់ទាញលើរូបភាព អត្ថបទ និងសំណុំទិន្នន័យផ្សេងទៀត ដើម្បីទទួលបានការយល់ដឹងស៊ីជម្រៅអំពីទំនាក់ទំនងរវាងគំនិតផ្សេងៗ។
តាមរបៀបនេះ ពួកគេអាចបង្កើតលទ្ធផលប្រលោមលោក ដែលមានភាពប្រាកដនិយមខ្ពស់ និងត្រូវគ្នានឹងសញ្ញាដែលបានផ្តល់ឱ្យយ៉ាងត្រឹមត្រូវ។
ជាឧទាហរណ៍ AI ដែលបានទទួលការបណ្តុះបណ្តាលតែលើរូបថតសត្វឆ្មានឹងមិនអាចស្រមៃមើលប្រភេទសត្វប្រលោមលោកដូចជា "សត្វរុយ និងសត្វតោ" បានទេ។
ហើយតាមរយៈការបណ្តុះបណ្តាលលើរូបភាព អត្ថបទ និងអូឌីយ៉ូរាប់លាននៃសត្វ មនុស្ស ប្រដាប់ប្រដាក្មេងលេង និងអ្វីៗជាច្រើនទៀត គំរូជំនាន់អាចរួមបញ្ចូលគ្នានូវលទ្ធផលសិក្សាទាំងនេះដើម្បីបង្កើតជាកូនកាត់ដូចជា "flamingos និងតោ"។
នៅក្នុងកំណែចុងក្រោយរបស់ DALL-E 3 សមត្ថភាពបង្កើតរបស់ថ្មីនេះ កាន់តែមានថាមពលខ្លាំង។ វាបង្ហាញពីភាពប៉ិនប្រសប់ថ្មីក្នុងការបកស្រាយយ៉ាងត្រឹមត្រូវ និងចាប់យកភាពខុសគ្នា និងព័ត៌មានលម្អិតដែលម៉ូដែលមុនៗមិនអាចចាប់យកបាន។
បើប្រៀបធៀបជាមួយនឹងម៉ាស៊ីនបង្កើតបញ្ញាសិប្បនិម្មិតពីមុន DALL-E 3 បង្ហាញពីសមត្ថភាពយល់ដឹងកាន់តែប្រសើរឡើងនៅពេលទទួលបានការណែនាំដ៏ស្មុគស្មាញ។ ខណៈពេលដែលម៉ាស៊ីនភ្លើងមុនៗមានទំនោរបង្កើតលទ្ធផលដែលមិននឹកស្មានដល់នៅពេលដំណើរការការជម្រុញដ៏ស្មុគស្មាញ DALL-E 3 បង្ហាញពីការយល់ដឹងដ៏ល្អឥតខ្ចោះនៃភាសា ដែលអនុញ្ញាតឱ្យវាស្រមៃអំពីសេណារីយ៉ូប្រលោមលោក និងតួអក្សរលើសពីគំរូជំនាន់អត្ថបទទៅរូបភាពតាមការរំពឹងទុក។
ជាមួយនឹង DALL-E 3 ការតភ្ជាប់រវាងភាសា និងរូបភាពគឺកាន់តែរឹងមាំ ដូច្នេះវាអាចបកស្រាយបរិបទនៃប្រអប់បញ្ចូលជាជាងគ្រាន់តែអានវាពីស្គ្រីប។ លទ្ធផលដែលបានបង្កើតអាចមានភាពជិតស្និទ្ធនឹងតម្រូវការរបស់អ្នកប្រើប្រាស់។
នេះគឺជាឧទាហរណ៍នៃប្រអប់បញ្ចូលដ៏សាមញ្ញមួយ: "ស្រមៃមើលសត្វតោ flamingo" ។
លទ្ធផលរូបភាព៖
ដូច្នេះតើវាសម្រេចបានដោយរបៀបណា? សមត្ថភាពក្នុងការ "ស្រមៃ" អត្ថបទនេះកើតចេញពីសមាសធាតុសំខាន់ពីរនៃគំរូ AI ជំនាន់៖
បណ្តាញសរសៃប្រសាទ៖
បណ្តាញសរសៃប្រសាទគឺជាបណ្តាញក្បួនដោះស្រាយឋានានុក្រមដែលក្លែងធ្វើគោលការណ៍ការងាររបស់ណឺរ៉ូននៅក្នុងខួរក្បាលមនុស្ស។ វាអនុញ្ញាតឱ្យបញ្ញាសិប្បនិមិត្តកំណត់អត្តសញ្ញាណគំរូ និងគំនិតនៅក្នុងសំណុំទិន្នន័យធំ។
ក្បួនដោះស្រាយការរៀនម៉ាស៊ីន៖
ក្បួនដោះស្រាយទាំងនេះ ដូចជាការសិក្សាស៊ីជម្រៅ បន្តកែលម្អការយល់ដឹងរបស់បណ្តាញសរសៃប្រសាទអំពីទំនាក់ទំនងទិន្នន័យ។
គំរូទូទៅបង្កើតការយល់ដឹងដ៏សម្បូរបែបអំពីពិភពលោកដោយការបណ្តុះបណ្តាលលើសំណុំទិន្នន័យដ៏ធំ។ ការជម្រុញដ៏ត្រឹមត្រូវអាចចម្លងលទ្ធផលសិក្សាទាំងនេះ ដើម្បីបង្កើតលទ្ធផលដែលមិនធ្លាប់មានពីមុនមក។
របៀបដែលស្ថាបត្យកម្មជំនាន់របស់ DALL-E ដំណើរការ
DALL-E អាចបង្កើតរូបភាពពីអត្ថបទ ដោយសារស្ថាបត្យកម្មបណ្តាញសរសៃប្រសាទដែលបានរចនាយ៉ាងពិសេសរបស់វា៖
សំណុំទិន្នន័យធំ៖
DALL-E ត្រូវបានបណ្តុះបណ្តាលលើគូរូបភាព-អត្ថបទរាប់ពាន់លាន ដែលអនុញ្ញាតឱ្យវារៀនគំនិតដែលមើលឃើញ និងការផ្សារភ្ជាប់គ្នារបស់ពួកគេជាមួយនឹងខ្លឹមសារអត្ថបទ ឬភាសានិយាយ។ សំណុំទិន្នន័យដ៏ធំនេះផ្តល់ឱ្យវានូវចំណេះដឹងទូលំទូលាយអំពីពិភពលោក។
រចនាសម្ព័ន្ធឋានានុក្រម៖
បណ្តាញនេះត្រូវបានតំណាងតាមឋានានុក្រម ចាប់ពីគោលគំនិតកម្រិតខ្ពស់ រហូតដល់ព័ត៌មានលម្អិត។ ស្រទាប់ខាងលើយល់អំពីប្រភេទធំទូលាយ (ដូចជាសត្វស្លាប) ខណៈពេលដែលស្រទាប់ខាងក្រោមស្គាល់គុណលក្ខណៈតូចៗ (ដូចជារាងចំពុះ ពណ៌ និងទីតាំងនៅលើមុខ)។
ការអ៊ិនកូដអត្ថបទ៖
ជាមួយនឹងចំណេះដឹងនេះ DALL-E អាចបំប្លែងពាក្យសរសេរទៅជាតំណាងគណិតវិទ្យា។ ឧទាហរណ៍ នៅពេលដែលយើងវាយអក្សរ "flamingo lion" វាដឹងថា flamingo និង lion ជាអ្វី ហើយអាចបញ្ចូលគ្នានូវលក្ខណៈផ្សេងគ្នានៃសត្វទាំងពីរ។ តាមរយៈការបកប្រែប្រភេទនេះ ការបញ្ចូលអត្ថបទអាចបង្កើតលទ្ធផលដែលមើលឃើញ។
ស្ថាបត្យកម្មកម្រិតខ្ពស់នេះជួយ DALL-E បង្កើតរូបភាពប្រកបដោយភាពច្នៃប្រឌិត និងស៊ីសង្វាក់គ្នា ដោយផ្អែកលើសញ្ញាអត្ថបទច្បាស់លាស់។
ឥឡូវនេះ យើងដឹងថាបញ្ហាបច្ចេកទេសអាចស្មុគស្មាញ ប៉ុន្តែសម្រាប់អ្នកប្រើប្រាស់ចុងក្រោយ ប្រតិបត្តិការគឺសាមញ្ញណាស់។
គ្រាន់តែផ្តល់គន្លឹះ និងបង្កើតរូបភាពគួរឱ្យភ្ញាក់ផ្អើល។
ម៉ូដែលភាសា និង DALL-E
ធាតុផ្សំសំខាន់នៃស្ថាបត្យកម្មរបស់ DALL-E គឺគំរូភាសា GPT (Generative Pretrained Transformer)។ ម៉ូដែលទាំងនេះដើរតួនាទីយ៉ាងសំខាន់ក្នុងការបកស្រាយ និងកែលម្អគន្លឹះ ដើម្បីបង្កើនប្រសិទ្ធភាពការបង្កើតរូបភាព។
ម៉ូដែល GPT គឺល្អក្នុងការយល់ដឹងអំពីបរិបទ និងភាពខុសគ្នានៃភាសា។ នៅពេលមានការជម្រុញ គំរូ GPT មិនត្រឹមតែអាចស្គាល់ពាក្យប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងយល់ពីចេតនា និងអត្ថន័យដ៏ស្រទន់នៅពីក្រោយពួកវាផងដែរ។ ការយល់ដឹងនេះគឺមានសារៈសំខាន់សម្រាប់ការបកប្រែគំនិតអរូបី ឬស្មុគស្មាញទៅជាធាតុដែលមើលឃើញ ដែលផ្នែកបង្កើតរូបភាពរបស់ DALL-E អាចទាញយកប្រយោជន៍បាន។
ប្រសិនបើការជម្រុញដំបូងអាចមានភាពមិនច្បាស់លាស់ ឬទូលំទូលាយពេកនោះ គំរូ GPT អាចជួយកែលម្អ ឬពង្រីកប្រអប់បញ្ចូល។ តាមរយៈការបណ្ដុះបណ្ដាលយ៉ាងទូលំទូលាយលើភាសា និងប្រធានបទផ្សេងៗ វាអាចសន្និដ្ឋានថាព័ត៌មានលម្អិតអាចពាក់ព័ន្ធ ឬគួរឱ្យចាប់អារម្មណ៍ចំពោះរូបភាពមួយណា បើទោះបីជាពួកគេមិនត្រូវបានរៀបរាប់ឱ្យច្បាស់លាស់នៅក្នុងប្រអប់បញ្ចូលដើមក៏ដោយ។
គំរូ GPT ក៏អាចកំណត់អត្តសញ្ញាណកំហុសដែលអាចកើតមាន ឬភាពមិនច្បាស់លាស់នៅក្នុងព័ត៌មានជំនួយផងដែរ។ ឧទាហរណ៍ ប្រសិនបើប្រអប់បញ្ចូលមានភាពមិនស៊ីសង្វាក់គ្នានៃការពិត ឬភាសាដែលច្របូកច្របល់ គំរូអាចកែកំហុស ឬស្វែងរកការបំភ្លឺ ដោយធានាថាលទ្ធផលចុងក្រោយនៃម៉ាស៊ីនបង្កើតរូបភាពមានភាពច្បាស់លាស់ និងត្រឹមត្រូវតាមដែលអាចធ្វើទៅបាន។
គួរឱ្យចាប់អារម្មណ៍ តួនាទីរបស់ GPT មិនត្រូវបានកំណត់ចំពោះការយល់ដឹង និងការកែលម្អនោះទេ វាក៏អាចបន្ថែមស្រទាប់នៃភាពច្នៃប្រឌិតផងដែរ។ ជាមួយនឹងការបណ្តុះបណ្តាលយ៉ាងទូលំទូលាយ វាអាចនាំមកនូវការបកស្រាយប្លែកៗ ឬការស្រមើស្រមៃនៃសញ្ញា ដែលជំរុញឱ្យមានដែនកំណត់ច្នៃប្រឌិតនៃការបង្កើតរូបភាព។
នៅក្នុងខ្លឹមសារ គំរូភាសា GPT គឺជាអន្តរការីដ៏ឆ្លាតវៃរវាងការបញ្ចូលរបស់អ្នកប្រើប្រាស់ និងសមត្ថភាពបង្កើតរូបភាពរបស់ DALL-E ។ វាមិនត្រឹមតែធានាថាការជម្រុញត្រូវបានយល់យ៉ាងត្រឹមត្រូវប៉ុណ្ណោះទេ ប៉ុន្តែវាក៏ត្រូវបានពង្រឹង និងធ្វើឱ្យប្រសើរផងដែរ ដើម្បីបង្កើតលទ្ធផលដែលពាក់ព័ន្ធ និងប្រកបដោយភាពច្នៃប្រឌិតបំផុត។
ការអនុវត្ត DALL-E
DALL-E មិនត្រឹមតែជាការបង្ហាញពីបច្ចេកវិទ្យាត្រជាក់ប៉ុណ្ណោះទេ វាមានកម្មវិធីជាក់ស្តែងជាច្រើន។
1. ការរចនាច្នៃប្រឌិត៖
អ្នករចនាអាចដឹងពីគំនិតច្នៃប្រឌិតរបស់ពួកគេយ៉ាងងាយស្រួលជាមួយ DALL-E ។ មិនថាវាជាគំនិតផលិតផលតែមួយគត់ រូបភាពផ្សាយពាណិជ្ជកម្ម ឬការងារសិល្បៈ DALL-E អាចបញ្ចូលការបំផុសគំនិតថ្មីទៅក្នុងវិស័យរចនា។
2. ការបង្កើតខ្លឹមសារ៖
អ្នកនិពន្ធ និងអ្នកបង្កើតអាចប្រើ DALL-E ដើម្បីបង្កើតធាតុដែលមើលឃើញសម្រាប់រឿង អត្ថបទ ឬរឿងកំប្លែងរបស់ពួកគេ។ នេះជួយបង្កើនការបង្កើតរបស់ពួកគេ និងធ្វើឱ្យពួកគេកាន់តែទាក់ទាញ។
3. ការលក់ទំនិញដែលមើលឃើញ៖
ក្រុមម៉ាក និងទីផ្សារអាចប្រើ DALL-E ដើម្បីបង្កើតការផ្សាយពាណិជ្ជកម្ម ផ្ទាំងរូបភាព និងសម្ភារៈផ្សព្វផ្សាយផ្សេងៗទៀតដែលទាក់ទាញភ្នែក។ វាជួយបង្កើនការយល់ដឹងអំពីម៉ាកយីហោ និងទាក់ទាញទស្សនិកជនគោលដៅកាន់តែច្រើន។
4. ជំនួយផ្នែកអប់រំ៖
អ្នកអប់រំអាចប្រើ DALL-E ដើម្បីបង្កើតរូបភាពដើម្បីធ្វើឱ្យឯកសារបង្រៀនកាន់តែរស់រវើក និងគួរឱ្យចាប់អារម្មណ៍។ សិស្សអាចយល់កាន់តែច្បាស់អំពីគំនិតស្មុគស្មាញតាមរយៈធាតុដែលមើលឃើញ។
5. ការបង្កើតឈុតនិម្មិត៖
ផលិតករភាពយន្ត និងទូរទស្សន៍ និងអ្នកបង្កើតហ្គេមអាចប្រើ DALL-E ដើម្បីបង្កើតឈុតឆាក តួអង្គ និងឈុតប្លែកៗ ដើម្បីបន្ថែមពណ៌ដល់ស្នាដៃរបស់ពួកគេ។
នេះគ្រាន់តែជាចុងផ្ទាំងទឹកកកនៃ DALL-E ហើយតំបន់កម្មវិធីរបស់វានៅតែពង្រីក។ វានាំមកនូវភាពច្នៃប្រឌិត និងប្រសិទ្ធភាពដែលមិនធ្លាប់មានពីមុនមកដល់គ្រប់មជ្ឈដ្ឋាន។
នៅក្នុងសេចក្តីសន្និដ្ឋាន
នៅក្នុងរលកនៃបញ្ញាសិប្បនិម្មិត DALL-E គឺពិតជាសេះងងឹត។ វាបង្ហាញពីសមត្ថភាពមិនធម្មតានៃបញ្ញាសិប្បនិម្មិតក្នុងការបង្កើតរូបភាព ដោយផ្តល់នូវឧបករណ៍ដ៏មានឥទ្ធិពលសម្រាប់អ្នកបង្កើត អ្នករចនា និងអ្នកជំនាញផ្នែកទីផ្សារ។
តាមរយៈការសិក្សាជ្រៅជ្រះ និងបណ្តាញសរសៃប្រសាទកម្រិតខ្ពស់ DALL-E មិនត្រឹមតែអាចយល់ពីការបំផុសគំនិតតាមអត្ថបទប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងអាចបំប្លែងពួកវាទៅជាខ្លឹមសារដែលមើលឃើញគួរឱ្យភ្ញាក់ផ្អើលទៀតផង។ ដំណើរការបង្កើតរបស់វារួមបញ្ចូលគ្នានូវបញ្ញាសិប្បនិម្មិត និងគំរូភាសា ដើម្បីផ្តល់ឱ្យអ្នកប្រើប្រាស់នូវបទពិសោធន៍ដ៏សាមញ្ញ និងមានឥទ្ធិពល។
មិនថាវាជាការរចនាប្រកបដោយភាពច្នៃប្រឌិត ការបង្កើតមាតិកា ឬទីផ្សារនោះទេ DALL-E បានចាក់បញ្ចូលភាពរឹងមាំថ្មីទៅក្នុងឧស្សាហកម្មផ្សេងៗ។ វាមិនត្រឹមតែជាកំពូលនៃបច្ចេកវិទ្យាប៉ុណ្ណោះទេ ប៉ុន្តែក៏ជាប្រភពនៃការច្នៃប្រឌិតគ្មានដែនកំណត់ផងដែរ។
នៅពេលដែលបច្ចេកវិទ្យាបន្តវិវឌ្ឍ យើងអាចរំពឹងថាកំណែអនាគតរបស់ DALL-E នឹងនាំមកនូវការភ្ញាក់ផ្អើលកាន់តែច្រើន និងបញ្ចូលភាពរឹងមាំបន្ថែមទៀតទៅក្នុងវិស័យបញ្ញាសិប្បនិមិត្ត។
Hope Chen Weiliang Blog ( https://www.chenweiliang.com/ ) បានចែករំលែក ការប្រកាស របស់ "How to use DALL-E to create images?" អត្ថបទ AI បង្កើតរូបគំនូរ និយាយថាលាហើយការគូររូបដែលបោកប្រាស់! 》 មានប្រយោជន៍សម្រាប់អ្នក។
សូមស្វាគមន៍ចំពោះការចែករំលែកតំណភ្ជាប់នៃអត្ថបទនេះ៖https://www.chenweiliang.com/cwl-31503.html
សូមស្វាគមន៍មកកាន់ឆានែល Telegram នៃប្លុករបស់ Chen Weiliang ដើម្បីទទួលបានព័ត៌មានថ្មីៗចុងក្រោយបង្អស់!
📚 មគ្គុទ្ទេសក៍នេះមានតម្លៃមហាសាល 🌟នេះជាឱកាសដ៏កម្រ សូមកុំអូសរំលង! ⏰⌛💨
Share និង Like ប្រសិនបើអ្នកចូលចិត្ត!
ការចែករំលែក និងការចូលចិត្តរបស់អ្នកគឺជាការលើកទឹកចិត្តបន្តរបស់យើង!