DALL-E භාවිතයෙන් පින්තූර නිර්මාණය කරන්නේ කෙසේද? AI පෙළ සිතුවම් ජනනය කරයි, ජරා චිත්‍ර ඇඳීමට ආයුබෝවන්!

✨DALL-E🚀 සමඟින් ඔබේ පරිකල්පනය මුදාහරින්න! මෙම විප්ලවවාදී AI රූප උත්පාදන මෙවලම ඔබට පෙළ සමඟ සිත් ඇදගන්නාසුළු රූප නිර්මාණය කිරීමට ඉඩ සලසයි.

ඔබේ අදහස් ඇතුළත් කරන්න, DALL-E ඒවා ජීවය වැනි කලා කෘති බවට පත් කරයි!

සිහින භූ දර්ශන සිට විස්මිත දක්වාපුද්ගලයාportrait, හැකියාවයිඅසීමිත

DALL-E සිතුවම් මැජික් කවයට සම්බන්ධ වී ඔබේ කලාත්මක ගමන ආරම්භ කරන්න!

DALL-E භාවිතයෙන් පින්තූර නිර්මාණය කරන්නේ කෙසේද? AI පෙළ සිතුවම් ජනනය කරයි, ජරා චිත්‍ර ඇඳීමට ආයුබෝවන්!

මෑතකදී, කෘතිම බුද්ධිය (AI) ක්ෂේත්රයේ කැපී පෙනෙන ප්රගතියක් ලබා ඇත.කතාබස් GPT එය පෙළ නිර්මාණයේ විශිෂ්ටත්වයට පත්වනවා පමණක් නොව, අපගේ AI අදියර ක්‍රමයෙන් පිරිසිදු පාඨයෙන් ඔබ්බට පුළුල් වේ.

DALL-E යනු කුමක්ද?

DALL-E යනු පෙළ විස්තර මත පදනම්ව රූප ජනනය කරන විප්ලවීය AI පද්ධතියකි.

DALL-E යනු කෘතිම බුද්ධි නිර්මාණශීලීත්වයේ වැදගත් සන්ධිස්ථානයක් වන අතර නවතම අනුවාදය වන DALL-E 3 වඩාත් බලවත් වේ.

මෙම මාර්ගෝපදේශය තුළ, අපි DALL-E යනු කුමක්ද, එය ක්‍රියා කරන ආකාරය, එහි යෙදුම් ක්ෂේත්‍ර සහ විශිෂ්ට දෘශ්‍ය අන්තර්ගතයක් උත්පාදනය කිරීම සඳහා එය භාවිතා කිරීම සඳහා උපදෙස් දෙස සමීපව බලන්නෙමු.

සංකල්පය සරල බව පෙනේ, නමුත් හොඳම ප්‍රතිඵල සඳහා, ඔබ සත්‍ය සහ නිවැරදි සෙවුම් ප්‍රතිඵල සඳහා මෙම ඉඟි අනුගමනය කළ යුතුය! ඔබට වඩාත් අව්‍යාජ සහ නිවැරදි සෙවුම් ප්‍රතිඵල ලබා ගැනීම සහතික කිරීම සඳහා, අපි ඔබට පහත ඉඟි සහ උපක්‍රම සපයන්නෙමු.

DALL-E භාවිතා කිරීමට පෙර, ඔබ තේරුම් ගත යුතු ගෘහ පාලන නීති තුනක් තිබේ:

ඔබ ඔබේ කලා කෘති සඳහා අදහස තාක්ෂණිකව නිර්මාණය කර ඇති බැවින්, ඔබ පෙරනිමියෙන් කලාකරුවා වේ, නමුත් රූපය DALL-E 2 හි වර්ණ දිය සලකුණ සමඟ බාගත කෙරේ.

ඔබට නිර්මාණය කළ හැකි දේ සඳහා සීමාවන් තිබේ. උදාහරණයක් ලෙස, DALL-E 2 හි අන්තර්ගත ප්‍රතිපත්තිය හානිකර, රැවටිලිකාර හෝ දේශපාලන අන්තර්ගතයන් තහනම් කරයි. අපයෝජනය වැලැක්වීම සඳහා, Taylor Swift වැනි පොදු පුද්ගලයින් සඳහා සමහර සෙවුම් පද අබල කර ඇත. සියලුම ප්‍රසිද්ධ පුද්ගලයන් අන්තර්ගත ප්‍රතිපත්ති උල්ලංඝනය නොකරන අතර, ඔවුන්ගේ මුහුණු බොහෝ විට ආරක්ෂාව සඳහා විකෘති කර ඇත.

DALL-E 2 සඳහා ණය සීමාව: 2023 අප්‍රේල් 4 ට පෙර විද්‍යුත් තැපෑල හරහා ලියාපදිංචි වී ගිණුමක් සාදන පරිශීලකයින්ට සෑම මසකම කල් ඉකුත් වන සහ අලුත් කරමින් නොමිලේ බැර 6ක් ලබා ගත හැක. උදාහරණයක් ලෙස, මම 15 සැප්තැම්බර් 2022 දින ලියාපදිංචි වූවෙමි, එබැවින් මට සෑම මසකම නොමිලේ බැර 9ක් ලැබේ, එය ස්වයංක්‍රීයව අලුත් වේ. නොමිලේ ලැබෙන ක්‍රෙඩිට් රෝල් කළ නොහැකි බව සලකන්න, ඒ නිසා මම මාස තුනක් චිත්‍ර නිර්මාණය නොකළත්, මට ක්‍රෙඩිට් 25 ක් රැස් කළ නොහැක. දැන් ගිණුමක් සාදා ඇති නව පරිශීලකයින් තවදුරටත් එම නොමිලේ ණය ප්‍රතිලාභය භුක්ති නොවිඳින අතර අවම වශයෙන් $15 සඳහා බැර 60 ක් මිලදී ගත යුතුය. DALL-E API වෙතින් වෙන වෙනම බිල්පත් කරනු ලබන labs.openai.com හරහා පරිශීලකයින්ට DALL-E බැර වෙන වෙනම මිලදී ගත හැක.

ණය මුදාගත හැක්කේ ඒවා ඇතුළත් කර උත්පාදනය කිරීමෙන් පසුව පමණි, අන්තර්ගත ප්‍රතිපත්ති උල්ලංඝනය කිරීම් හේතුවෙන් අවසානයේ උත්පාදනය නොවන සෙවීම් නොමිලේ ණයෙන් අඩු නොකෙරේ. ඔබට සෙවුම් අතුරුමුහුණතේ ඉහළ දකුණු කෙළවරේ ඇති ඔබේ පැතිකඩ නිරූපකය මත ක්ලික් කිරීමෙන් ඔබට සෑම මසකම කොපමණ ණය ප්‍රමාණයක් ඉතිරි වී ඇත්දැයි බැලීමට සහ ඔබට ණය 115ක් සඳහා ඩොලර් 15 සිට තවත් මිලදී ගැනීමට තෝරා ගත හැකිය.

පින්තූර ජනනය කිරීමට DALL-E භාවිතා කරන්නේ කෙසේද?

DALL-E යනු දැනට වෙළඳපොලේ ඇති බලවත්ම කෘත්‍රිම බුද්ධි මෙවලමකි.

මෙය ChatGPT පිටුපස ඇති OpenAI කණ්ඩායම විසින් නිර්මාණය කරන ලද කෘතිම බුද්ධි රූප උත්පාදක යන්ත්‍රයකි. එය පෙළ විමසුම් මත පදනම්ව මුල සිටම මුල් රූප නිර්මාණය කිරීමට "ජනක කෘතිම බුද්ධිය" නම් තාක්ෂණය භාවිතා කරයි.

උදාහරණයක් ලෙස, ඔබ පෙළ ඇතුළත් කළහොත් "an avocado chair with a red colored monkey”, DALL-E මෙම අමුතු වස්තුවේ නව රූප ජනනය කරනු ඇත.

අලිගැට පේර පුටුවක් සහ රතු වඳුරු පින්තූරයක් 2

රූපයක කොටස් සරලව කපා කොටා ගැනීම වෙනුවට, එය ඇත්ත වශයෙන්ම ඔබ විස්තර කරන දේ "මනකල්පනය කිරීම" වේ. ඔබේ විස්තරය වඩාත් සවිස්තරාත්මක වන තරමට, ලැබෙන රූපය වඩාත් ශෝධිත වනු ඇත.

"DALL-E" යන නම අධියථාර්ථවාදී චිත්‍ර ශිල්පී සැල්වදෝර් ඩාලිගේ සහ පික්සාර්ගේ මිත්‍රශීලී රොබෝ චරිතයක් වන WALL-E ගේ සමජාතීය භාවයක් බව සඳහන් කිරීම වටී. DALL-E පෙළ විස්තර වලින් කෙලින්ම අපූරු දෘශ්‍ය ප්‍රයෝග නිර්මාණය කිරීමට කලාව සහ තාක්‍ෂණය ඒකාබද්ධ කරන ආකාරය මෙය ඉඟි කරයි.

කෘතිම බුද්ධියේ නිර්මාණශීලීත්වයේ පිම්මක් නියෝජනය කරන DALL-E හි ආශ්චර්යය මෙයයි.

මිනිසුන්ට වචන වලින් දේවල් පහසුවෙන් සිතාගත හැකි වුවද, පරිගණකවලට එසේ කිරීමට නොහැකි විය, විශේෂයෙන් එතරම් විචිත්‍රවත් ආකාරයකින් නොවේ. DALL-E පරිගණකවලට ආවේණික වූ ප්‍රායෝගික පරිකල්පනය සහ ගැටළු විසඳීමේ හැකියාවන් අවබෝධ කර ගනී, ග්‍රැෆික් නිර්මාණය, රූප සැකිලි, වෙබ් පිටු පිරිසැලසුම් සහ තවත් බොහෝ දේ සඳහා ආකර්ෂණීය හැකියාවන් විවෘත කරයි.

DALL-E වැඩ කරන්නේ කෙසේද?

DALL-E එහි මැජික් කරන්නේ කෙසේද? කලින් සඳහන් කළ පරිදි, එය "ජනක කෘතිම බුද්ධිය" නම් තාක්ෂණය භාවිතා කරයි. අපි සමීපව බලමු.

උත්පාදක AI ආකෘති

උත්පාදක AI ආකෘති පින්තූරය 3

බොහෝ කාර්ය-විශේෂිත AI මෙන් නොව, ජනක AI ආකෘති විශේෂිත කාර්යයක් ඉටු කිරීමට විශේෂිත නොවේ.

ඒ වෙනුවට, ඔවුන් විවිධ සංකල්ප අතර සම්බන්ධතා පිළිබඳ ගැඹුරු අවබෝධයක් වර්ධනය කිරීම සඳහා දැවැන්ත රූප, පෙළ සහ වෙනත් දත්ත කට්ටල මත පුහුණු කරනු ලැබේ.

මෙය ඔවුන්ට ඉතා තාත්වික සහ නිවැරදිව විමසුම්වලට ගැලපෙන නව නිමැවුම් උත්පාදනය කිරීමට හැකියාව ලබා දෙයි.

නිදසුනක් වශයෙන්, බළලුන්ගේ ඡායාරූප මත පමණක් පුහුණු කරන ලද AI හට "ෆ්ලමින්ගෝ-සිංහයා" වැනි නව සතෙකු ගැන සිතාගත නොහැකි වනු ඇත. විවිධ සතුන්, මිනිසුන්, සෙල්ලම් බඩු සහ තවත් බොහෝ රූප මිලියන ගණනක් මත පුහුණු කරන ලද, උත්පාදක ආකෘතියට මෙම දැනුම ඒකාබද්ධ කර ප්‍රේරක මත පදනම්ව ෆ්ලෙමින්ගෝ-සිංහ දෙමුහුන් වර්ගයක් ඒත්තු ගැන්විය හැකිය.

DALL-E 3 හි නවතම අනුවාදයේ, සම්පූර්ණයෙන්ම නව දේවල් නිර්මාණය කිරීමේ මෙම හැකියාව තවදුරටත් පෙන්නුම් කර ඇත. නව අනුවාදය පෙර මාදිලිවලට ග්‍රහණය කර ගැනීමට නොහැකි වූ ඉඟි අර්ථ දැක්වීමේදී, සියුම් වෙනස්කම් සහ විස්තර ග්‍රහණය කර ගැනීමේදී ඉහළ මට්ටමේ නිරවද්‍යතාවයක් පෙන්නුම් කරයි.

පෙර කෘත්‍රිම බුද්ධි උත්පාදක යන්ත්‍ර සමඟ සසඳන විට, DALL-E 3 තවදුරටත් සංකීර්ණ උපදෙස් ලබා ගැනීමේදී අනපේක්ෂිත ප්‍රතිඵලවලට ගොදුරු නොවේ. ඒ වෙනුවට, එය භාෂාව පිළිබඳ උසස් අවබෝධයක් පෙන්නුම් කරන අතර එමඟින් නව අවස්ථා සහ පෙළ සිට රූපය උත්පාදන ආකෘතිවලින් අපේක්ෂාවන් ඉක්මවා යන චරිත පරිකල්පනය කිරීමට හැකි වේ.

DALL-E 3 සමඟින්, භාෂාව සහ රූපය අතර සම්බන්ධය වඩාත් සමීප වන අතර, හුදෙක් යාන්ත්‍රිකව රූප ජනනය කරනවාට වඩා ඉඟි වල සන්දර්භය අර්ථකථනය කිරීමේ හැකියාව ඇත. මෙය ජනනය කරන ලද පින්තූර පරිශීලකයාගේ අපේක්ෂාවන්ට සමීප කරයි.

ඊළඟට, DALL-E හි පරම්පරාවේ ගෘහ නිර්මාණ ශිල්පය ක්‍රියා කරන ආකාරය දෙස ගැඹුරින් බලමු.

DALL-E හි උත්පාදක ගෘහ නිර්මාණ ශිල්පය ක්‍රියා කරන්නේ කෙසේද?

DALL-E හට පෙළෙන් රූප ජනනය කිරීමට සබල කිරීමේ යතුර එහි විශේෂයෙන් නිර්මාණය කර ඇති ස්නායුක ජාල ගෘහ නිර්මාණ ශිල්පය තුළ පවතී:

විශාල දත්ත කට්ටල:

DALL-E රූප-පෙළ යුගල බිලියන ගණනක් මත පුහුණු කර ඇති අතර, එමඟින් දෘශ්‍ය සංකල්ප සහ ඒවායේ පාඨමය අන්තර්ගතයට හෝ කථන භාෂාවට ඇති සම්බන්ධය ඉගෙන ගැනීමට හැකි වේ. මෙම දැවැන්ත දත්ත කට්ටලය ලෝකයේ දැනුම පිළිබඳ පුළුල් අවබෝධයක් ලබා දෙයි.

ධූරාවලි ව්යුහය:

ජාලයට ඉහළ මට්ටමේ සංකල්පවල සිට විස්තර දක්වා ධූරාවලි නියෝජනයක් ඇත. ඉහළ ස්ථර පුළුල් කාණ්ඩ (කුරුල්ලන් වැනි) තේරුම් ගන්නා අතර, පහළ ස්ථර සියුම් ගුණාංග හඳුනා ගනී (හොට හැඩය, වර්ණය සහ මුහුණේ පිහිටීම වැනි).

පෙළ කේතනය:

මෙම දැනුම භාවිතා කරමින්, ලිඛිත වචන පෙළෙහි ගණිතමය නිරූපණයක් බවට පරිවර්තනය කිරීමට DALL-E සමත් වේ. උදාහරණයක් ලෙස, අපි "Flamingo-lion" ලෙස ටයිප් කරන විට, එය ෆ්ලෙමින්ගෝ යනු කුමක්ද, සිංහයා යනු කුමක්ද යන්න දන්නා අතර සතුන් දෙදෙනාගේ විවිධ ලක්ෂණ ඒකාබද්ධ කිරීමට සමත් වේ. මෙම පරිවර්තනය හරහා පාඨමය ආදානයට දෘශ්‍ය ප්‍රතිදානය නිපදවිය හැක.

මෙම උසස් ගෘහනිර්මාණ ශිල්පය DALL-E හට පාඨමය ඉඟි අනුගමනය කරමින් නිර්මාණාත්මක සහ සුසංයෝගී රූප නිවැරදිව ජනනය කිරීමට හැකියාව ලබා දෙයි.

දැන්, අපි තාක්ෂණික සංකීර්ණතා තේරුම් ගනිමු, නමුත් අවසාන පරිශීලකයා සඳහා, DALL-E භාවිතා කිරීම ඉතා සරල ය.

විමසුම් ඇතුළත් කර සිත් ඇදගන්නාසුළු රූප ජනනය කරන්න.

භාෂා ආකෘති සහ DALL-E

DALL-E ගෘහ නිර්මාණ ශිල්පයේ වැදගත් අංගයක් වන්නේ GPT (Generative Pretrained Transformer) භාෂා ආකෘතියයි. මෙම ආකෘතීන් ඉඟි පරිවර්ථනය කිරීම සහ පිරිපහදු කිරීම සඳහා ප්රධාන කාර්යභාරයක් ඉටු කරයි.

GPT ආකෘතිය භාෂාවේ සන්දර්භය සහ සියුම් වෙනස්කම් ග්‍රහණය කර ගැනීමට දක්ෂයි. ප්‍රේරකයක් ඇතුළත් කළ විට, GPT ආකෘතිය වචන කියවීම පමණක් නොව ඒවා පිටුපස ඇති අභිප්‍රාය සහ සියුම් අර්ථය ද තේරුම් ගනී. මෙම අවබෝධය DALL-E හි රූප උත්පාදන කොටසට ප්‍රයෝජන ගත හැකි දෘශ්‍ය මූලද්‍රව්‍ය බවට වියුක්ත හෝ සංකීර්ණ අදහස් පරිවර්තනය කිරීම සඳහා ඉතා වැදගත් වේ.

ආරම්භක ඉඟිය අපැහැදිලි හෝ ඉතා පුළුල් නම්, GPT ආකෘතිය ඉඟිය පිරිපහදු කිරීමට හෝ පුළුල් කිරීමට උපකාරී වේ. භාෂාව සහ විවිධ මාතෘකා පිළිබඳ පුළුල් පුහුණුවක් තුළින්, මුල් විමසුමේ පැහැදිලිව සඳහන් නොකළත්, රූපයකට අදාළ හෝ රසවත් විය හැකි තොරතුරු එයට අනුමාන කළ හැකිය.

GPT ආකෘතියට ඉඟිවල ඇති විය හැකි දෝෂ හෝ අපැහැදිලිතා හඳුනා ගත හැක. උදාහරණයක් ලෙස, ප්‍රේරකයක සත්‍ය නොගැලපීම් හෝ ව්‍යාකූල භාෂාවක් තිබේ නම්, ආකෘතියට දෝෂය නිවැරදි කිරීමට හෝ පැහැදිලි කිරීමක් ලබා ගැනීමට හැකිය, රූප උත්පාදක යන්ත්‍රයට අවසන් ආදානය හැකිතාක් පැහැදිලි සහ නිවැරදි බව සහතික කිරීම.

සිත්ගන්නා කරුණ නම්, GPT හි කාර්යභාරය අවබෝධය සහ ශෝධනයට පමණක් සීමා නොවේ, එය නිර්මාණශීලීත්වයේ තට්ටුවක් ද එකතු කළ හැකිය. පුළුල් පුහුණුවක් සමඟින්, රූප උත්පාදනයේ සීමාවන් තල්ලු කරමින්, ඉඟි පිළිබඳ අද්විතීය හෝ පරිකල්පනීය අර්ථකථන ඉදිරිපත් කළ හැකිය.

සාරය වශයෙන්, GPT භාෂා ආකෘතිය පරිශීලක ආදානය සහ DALL-E හි රූප උත්පාදන හැකියාවන් අතර බුද්ධිමත් අතරමැදියෙකි. ඔවුන් විමසුම් නිවැරදිව අවබෝධ කර ගැනීම සහතික කරනවා පමණක් නොව, වඩාත් අදාළ සහ නිර්මාණාත්මක දෘශ්‍ය ප්‍රතිදානය නිපදවීමට ඒවා පොහොසත් කර ප්‍රශස්ත කර ඇත.

DALL-E භාවිතා කරන්නේ කුමක් සඳහාද?

DALL-E හි යෙදුම් ක්ෂේත්‍ර විවිධ වේ. විවිධ කර්මාන්ත සහ භාවිතයන් සඳහා නිර්මාණාත්මක සහ නිර්මාණ සහාය ලබා දෙමින් විවිධ දෘශ්‍ය අංග නිර්මාණය කිරීමට එය භාවිතා කළ හැකිය.

ආලේඛ සැලසුම:

DALL-E හට විවිධ සංකල්ප අතර සම්බන්ධතා පිළිබඳ ගැඹුරු අවබෝධයක් ලබා ගැනීම සඳහා රූප, පෙළ සහ අනෙකුත් දත්ත කට්ටල පිළිබඳ අද්විතීය සහ බලගතු පුහුණුවක් ජනනය කළ හැකිය.

මේ ආකාරයෙන්, ඔවුන්ට ඉතා යථාර්ථවාදී සහ සපයා ඇති ඉඟි වලට නිවැරදිව ගැලපෙන නව නිමැවුම් ජනනය කිරීමට හැකි වේ.

නිදසුනක් වශයෙන්, බළලුන්ගේ ඡායාරූප මත පමණක් පුහුණු කරන ලද AI හට "ෆ්ලමින්ගෝ සහ සිංහයන්" වැනි නව සත්ව විශේෂ ගැන සිතාගත නොහැකි වනු ඇත.

විවිධ සතුන්, මිනිසුන්, සෙල්ලම් බඩු සහ තවත් දේවල මිලියන ගණනක රූප, පෙළ සහ ශ්‍රව්‍ය පිළිබඳ පුහුණුව තුළින්, උත්පාදක ආකෘතියට මෙම ඉගෙනීමේ ප්‍රතිඵල ඒකාබද්ධ කර "ෆ්ලමින්ගෝ සහ සිංහයන්" වැනි දෙමුහුන් ඒත්තු ගැන්විය හැකිය.

DALL-E 3 හි නවතම අනුවාදයේ, නව දේවල් නිර්මාණය කිරීමේ මෙම හැකියාව වඩාත් බලවත් වේ. ඉඟි නිවැරදිව අර්ථකථනය කිරීමට සහ පෙර මාදිලිවලට ග්‍රහණය කර ගැනීමට නොහැකි වූ සියුම් වෙනස්කම් සහ විස්තර ග්‍රහණය කර ගැනීමට එය නව කුසලතා පෙන්නුම් කරයි.

පෙර කෘත්‍රිම බුද්ධි උත්පාදක යන්ත්‍ර සමඟ සසඳන විට, DALL-E 3 සංකීර්ණ උපදෙස් ලබා ගැනීමේදී වඩා හොඳින් අවබෝධ කර ගැනීමේ හැකියාව පෙන්වයි. පෙර උත්පාදක යන්ත්‍ර සංකීර්ණ ප්‍රේරක සැකසීමේදී අනපේක්ෂිත ප්‍රතිඵල ලබා දීමට නැඹුරු වූ අතර, DALL-E 3 භාෂාව පිළිබඳ විශිෂ්ට අවබෝධයක් පෙන්නුම් කරයි, එය පෙළ-සිට-රූපය උත්පාදන ආකෘති අපේක්ෂාවන් ඉක්මවා නව අවස්ථා සහ චරිත පරිකල්පනය කිරීමට ඉඩ සලසයි.

DALL-E 3 සමඟ, භාෂාව සහ රූපය අතර සම්බන්ධය ඊටත් වඩා ශක්තිමත් වේ, එබැවින් එය ස්ක්‍රිප්ට් එකෙන් කියවීමට වඩා විමසුමේ සන්දර්භය අර්ථ නිරූපණය කළ හැකිය. ජනනය කරන ලද ප්‍රතිඵල පරිශීලකයාගේ අවශ්‍යතාවලට ඉතා සමීප විය හැකිය.

මෙන්න සරල විමසුමක උදාහරණයක්: "ෆ්ලමින්ගෝ සිංහයෙකු සිතන්න."

රූප ප්‍රතිදානය:

ෆ්ලෙමින්ගෝ-සිංහ පින්තූරය 4

ඉතින්, එය සාක්ෂාත් කර ගන්නේ කෙසේද? පෙළ “මනකල්පනය” කිරීමේ මෙම හැකියාව උත්පාදක AI මාදිලිවල ප්‍රධාන කොටස් දෙකකින් පැන නගී:

ස්නායු ජාල:

ස්නායු ජාලය යනු මිනිස් මොළයේ නියුරෝන වල ක්‍රියාකාරී මූලධර්මය අනුකරණය කරන ධූරාවලි ඇල්ගොරිතම ජාලයකි. එය විශාල දත්ත කට්ටලවල රටා සහ සංකල්ප හඳුනා ගැනීමට කෘතිම බුද්ධිය සක්‍රීය කරයි.

යන්ත්‍ර ඉගෙනීමේ ඇල්ගොරිතම:

ගැඹුරු ඉගෙනීම වැනි මෙම ඇල්ගොරිතම, දත්ත සම්බන්ධතා පිළිබඳ ස්නායුක ජාලවල අවබෝධය වැඩිදියුණු කිරීම දිගටම කරගෙන යයි.

උත්පාදක ආකෘතීන් විශාල දත්ත කට්ටල පිළිබඳ පුහුණුව මගින් ලෝකය පිළිබඳ පොහොසත් සංකල්පීය අවබෝධයක් ගොඩනඟයි. නිරවද්‍ය ප්‍රේරකවලට මෙම ඉගෙනුම් ප්‍රතිඵල නැවත මිශ්‍ර කර පෙර නොවූ විරූ ප්‍රතිදානයක් නිපදවිය හැක.

DALL-E's Generative Architecture ක්‍රියා කරන ආකාරය

DALL-E හට එහි විෙශේෂෙයන් නිර්මාණය කර ඇති ස්නායුක ජාල ගෘහ නිර්මාණ ශිල්පයට ස්තූතිවන්ත වන පරිදි අකුරු වලින් රූප ජනනය කිරීමට හැකි වේ:

විශාල දත්ත කට්ටල:

DALL-E රූප-පෙළ යුගල බිලියන ගණනක් මත පුහුණු කර ඇති අතර, එමඟින් දෘශ්‍ය සංකල්ප සහ ඒවායේ පාඨමය අන්තර්ගතය හෝ කථන භාෂාව සමඟ සම්බන්ධ වීමට ඉඩ සලසයි. මෙම දැවැන්ත දත්ත කට්ටලය ලෝකය පිළිබඳ පුළුල් දැනුමක් ලබා දෙයි.

ධූරාවලි ව්යුහය:

ජාලය ඉහළ මට්ටමේ සංකල්පවල සිට විස්තර දක්වා ධුරාවලියෙන් නිරූපණය කෙරේ. ඉහළ ස්ථර පුළුල් කාණ්ඩ (කුරුල්ලන් වැනි) තේරුම් ගන්නා අතර, පහළ ස්ථර සියුම් ගුණාංග හඳුනා ගනී (හොට හැඩය, වර්ණය සහ මුහුණේ පිහිටීම වැනි).

පෙළ කේතනය:

මෙම දැනුම සමඟින්, ලිඛිත වචන ගණිතමය නිරූපණයන් බවට පරිවර්තනය කිරීමට DALL-E සමත් වේ. උදාහරණයක් ලෙස, අපි "ෆ්ලමින්ගෝ සිංහයා" යනුවෙන් ටයිප් කරන විට, එය ෆ්ලෙමින්ගෝ සහ සිංහයා යනු කුමක්දැයි දන්නා අතර සතුන් දෙදෙනාගේ විවිධ ලක්ෂණ ඒකාබද්ධ කිරීමට සමත් වේ. මෙම ආකාරයේ පරිවර්තනයක් හරහා, පාඨමය ආදානයට දෘශ්‍ය ප්‍රතිදානය නිපදවිය හැක.

මෙම උසස් ගෘහනිර්මාණ ශිල්පය DALL-E හට නිශ්චිත පෙළ ඉඟි මත පදනම්ව නිර්මාණාත්මක සහ සුසංයෝගී රූප ජනනය කිරීමට උපකාරී වේ.

දැන්, තාක්ෂණික ගැටළු තරමක් සංකීර්ණ විය හැකි බව අපි දනිමු, නමුත් අවසාන පරිශීලකයා සඳහා, මෙහෙයුම ඉතා සරල ය.

ඉඟි සපයා විශ්මිත රූප ජනනය කරන්න.

භාෂා ආකෘති සහ DALL-E

DALL-E හි ගෘහ නිර්මාණ ශිල්පයේ වැදගත් අංගයක් වන්නේ GPT (Generative Pretrained Transformer) භාෂා ආකෘතියයි. රූප උත්පාදනය ප්‍රශස්ත කිරීම සඳහා ඉඟි පරිවර්ථනය කිරීම සහ ශෝධනය කිරීම සඳහා මෙම ආකෘති ප්‍රධාන භූමිකාවක් ඉටු කරයි.

GPT මාදිලි භාෂාවේ සන්දර්භය සහ සූක්ෂ්මතා අවබෝධ කර ගැනීමට දක්ෂයි. විමසූ විට, GPT ආකෘතියට වචන හඳුනා ගැනීමට පමණක් නොව ඒවා පිටුපස ඇති අභිප්‍රාය සහ සියුම් අර්ථය තේරුම් ගැනීමටද හැකි වේ. මෙම අවබෝධය DALL-E හි රූප උත්පාදන කොටසට ප්‍රයෝජන ගත හැකි දෘශ්‍ය මූලද්‍රව්‍ය බවට වියුක්ත හෝ සංකීර්ණ අදහස් පරිවර්තනය කිරීම සඳහා ඉතා වැදගත් වේ.

ආරම්භක විමසුම නොපැහැදිලි හෝ ඉතා පුළුල් විය හැකි නම්, GPT ආකෘතිය මඟින් විමසුම පිරිපහදු කිරීමට හෝ පුළුල් කිරීමට උපකාරී වේ. භාෂාව සහ විවිධ මාතෘකා පිළිබඳ පුළුල් පුහුණුවක් තුළින්, මුල් විමසුමේ පැහැදිලිව සඳහන් කර නොතිබුණද, රූපයකට අදාළ හෝ රසවත් විය හැකි තොරතුරු එයට අනුමාන කළ හැකිය.

ඉඟි වල ඇති විය හැකි දෝෂ හෝ අපැහැදිලි හඳුනා ගැනීමට GPT ආකෘතියට හැකි වේ. උදාහරණයක් ලෙස, ප්‍රේරකයක සත්‍ය නොගැලපීම් හෝ ව්‍යාකූල භාෂාවක් තිබේ නම්, ආකෘතියට දෝෂය නිවැරදි කිරීමට හෝ පැහැදිලි කිරීමක් ලබා ගැනීමට හැකිය, රූප උත්පාදකයේ අවසාන ප්‍රතිදානය හැකි තරම් පැහැදිලි සහ නිවැරදි බව සහතික කිරීම.

සිත්ගන්නා කරුණ නම්, GPT හි කාර්යභාරය අවබෝධය සහ ශෝධනයට පමණක් සීමා නොවේ, එය නිර්මාණශීලීත්වයේ තට්ටුවක් ද එකතු කළ හැකිය. පුළුල් පුහුණුවක් සමඟින්, රූප උත්පාදනයේ නිර්මාණාත්මක සීමාවන් තල්ලු කරමින්, ඉඟිවල අද්විතීය හෝ මනඃකල්පිත අර්ථකථන ඉදිරිපත් කළ හැකිය.

සාරය වශයෙන්, GPT භාෂා ආකෘතිය යනු පරිශීලක ආදානය සහ DALL-E හි රූප උත්පාදන හැකියාවන් අතර බුද්ධිමත් අතරමැදියෙකි. එය විමසීම් නිවැරදිව අවබෝධ කර ගැනීම සහතික කරනවා පමණක් නොව, වඩාත් අදාළ සහ නිර්මාණාත්මක දෘශ්‍ය ප්‍රතිදානය නිපදවීමට ඒවා පොහොසත් කර ප්‍රශස්ත කර ඇත.

DALL-E හි යෙදුම

DALL-E යනු සිසිල් තාක්‍ෂණ ප්‍රදර්ශනයකට වඩා වැඩි ප්‍රායෝගික යෙදුම් ඇත.

1. නිර්මාණාත්මක නිර්මාණය:

DALL-E සමඟ නිර්මාණකරුවන්ට ඔවුන්ගේ නිර්මාණාත්මක අදහස් පහසුවෙන් අවබෝධ කර ගත හැකිය. එය අද්විතීය නිෂ්පාදන සංකල්පයක්, වෙළඳ ප්‍රචාරණ රූපයක් හෝ කලාත්මක කාර්යයක් වේවා, DALL-E හට නිර්මාණ ක්ෂේත්‍රයට නව ආශ්වාදයක් ලබා දිය හැකිය.

2. අන්තර්ගත නිර්මාණය:

ලේඛකයින්ට සහ නිර්මාණකරුවන්ට ඔවුන්ගේ කථා, ලිපි හෝ විකට සඳහා දෘශ්‍ය අංග උත්පාදනය කිරීමට DALL-E භාවිතා කළ හැක. මෙය ඔවුන්ගේ නිර්මාණ පොහොසත් කිරීමට සහ ඔවුන් වඩාත් ආකර්ෂණීය කිරීමට උපකාරී වේ.

3. දෘශ්‍ය වෙළඳ භාණ්ඩකරණය:

සන්නාම සහ අලෙවි කණ්ඩායම්වලට නෙත් සිත් ඇදගන්නා දැන්වීම්, පෝස්ටර් සහ අනෙකුත් ප්‍රවර්ධන ද්‍රව්‍ය නිර්මාණය කිරීමට DALL-E භාවිතා කළ හැක. මෙය සන්නාම දැනුවත්භාවය වැඩි කිරීමට සහ වැඩි ඉලක්කගත ප්‍රේක්ෂකයින් ආකර්ෂණය කර ගැනීමට උපකාරී වේ.

4. අධ්‍යාපනික ආධාර:

ඉගැන්වීම් ද්‍රව්‍ය වඩාත් සජීවී සහ සිත්ගන්නාසුළු කිරීමට අධ්‍යාපනඥයින්ට රූප ජනනය කිරීමට DALL-E භාවිතා කළ හැක. දෘශ්‍ය මූලද්‍රව්‍ය හරහා සිසුන්ට සංකීර්ණ සංකල්ප වඩා හොඳින් අවබෝධ කර ගත හැක.

5. අතථ්‍ය දර්ශන නිර්මාණය:

චිත්‍රපට සහ රූපවාහිනී නිෂ්පාදකයින්ට සහ ක්‍රීඩා සංවර්ධකයින්ට ඔවුන්ගේ කෘතිවලට වර්ණ එකතු කිරීම සඳහා අද්විතීය දර්ශන, චරිත සහ මුක්කු උත්පාදනය කිරීමට DALL-E භාවිතා කළ හැකිය.

මෙය DALL-E හි අයිස් කුට්ටියේ කෙළවර පමණක් වන අතර එහි යෙදුම් ප්‍රදේශ තවමත් පුළුල් වෙමින් පවතී. එය ජීවිතයේ සෑම තරාතිරමකම පෙර නොවූ විරූ නිර්මාණශීලීත්වයක් සහ කාර්යක්ෂමතාවයක් ගෙන එයි.

අවසන් තීරණයේ දී

කෘතිම බුද්ධියේ රැල්ල තුළ, DALL-E නිසැකවම අඳුරු අශ්වයෙක්. එය නිර්මාණකරුවන්, නිර්මාණකරුවන් සහ අලෙවිකරණ වෘත්තිකයන් සඳහා ප්‍රබල මෙවලම් සපයමින් රූප උත්පාදනයේ කෘතිම බුද්ධියේ අසාමාන්‍ය හැකියාවන් පෙන්නුම් කරයි.

ගැඹුරු ඉගෙනීම සහ උසස් ස්නායුක ජාල හරහා, DALL-E පාඨමය විමසීම් තේරුම් ගැනීමට පමණක් නොව, නිර්මාණාත්මකව ඒවා සිත් ඇදගන්නාසුළු දෘශ්‍ය අන්තර්ගතයන් බවට පරිවර්තනය කරයි. එහි උත්පාදන ක්‍රියාවලිය පරිශීලකයින්ට සරල සහ බලවත් අත්දැකීමක් ලබා දීම සඳහා උත්පාදක කෘතිම බුද්ධිය සහ භාෂා ආකෘති ඒකාබද්ධ කරයි.

එය නිර්මාණාත්මක නිර්මාණය, අන්තර්ගත නිර්මාණය හෝ අලෙවිකරණය වේවා, DALL-E විවිධ කර්මාන්තවලට නව ජීව ශක්තියක් ලබා දී ඇත. එය තාක්ෂණයේ උච්චතම අවස්ථාව පමණක් නොව, අසීමිත නිර්මාණශීලීත්වයේ මූලාශ්රය ද වේ.

තාක්‍ෂණය අඛණ්ඩව විකාශනය වන විට, DALL-E හි අනාගත අනුවාදයන් තවත් විස්මයන් ගෙන එන අතර කෘතිම බුද්ධි ක්ෂේත්‍රයට වැඩි ජීව ශක්තියක් ලබා දෙනු ඇතැයි අපට අපේක්ෂා කළ හැකිය.

Hope Chen Weiliang බ්ලොග් ( https://www.chenweiliang.com/ ) shared "පින්තූර නිර්මාණය කිරීමට DALL-E භාවිතා කරන්නේ කෙසේද?" AI පෙළ සිතුවම් ජනනය කරයි, ජරා චිත්‍ර ඇඳීමට ආයුබෝවන්! 》, ඔබට ප්‍රයෝජනවත්.

මෙම ලිපියේ සබැඳිය බෙදා ගැනීමට සාදරයෙන් පිළිගනිමු:https://www.chenweiliang.com/cwl-31503.html

නවතම යාවත්කාලීන ලබා ගැනීමට Chen Weiliang ගේ බ්ලොගයේ Telegram නාලිකාව වෙත සාදරයෙන් පිළිගනිමු!

🔔 නාලිකා ඉහළ නාමාවලියෙහි වටිනා "ChatGPT අන්තර්ගත අලෙවිකරණ AI මෙවලම් භාවිත මාර්ගෝපදේශය" ලබා ගත් පළමු පුද්ගලයා වන්න! 🌟
📚 මෙම මාර්ගෝපදේශයෙහි විශාල වටිනාකමක් ඇත, 🌟මෙය දුර්ලභ අවස්ථාවක්, එය අතපසු නොකරන්න! ⏰⌛💨
ඔබ කැමති නම් Share කර Like කරන්න!
ඔබගේ බෙදාගැනීම් සහ කැමැත්ත අපගේ අඛණ්ඩ අභිප්‍රේරණයයි!

 

发表

ඔබගේ විද්‍යුත් තැපැල් ලිපිනය ප්‍රකාශයට පත් නොකෙරේ. අවශ්‍ය ක්ෂේත්‍ර භාවිතා වේ * ලේබලය

ඉහළට අනුචලනය කරන්න