DALL-E استعمال ڪندي تصويرون ڪيئن ٺاھيو؟ AI ٽيڪسٽ پينٽنگس ٺاهي ٿو، چئو ته الوداع اسڪمبگ پينٽنگ کي!

✨پنهنجي تخيل کي DALL-E🚀 سان هلايو! هن انقلابي AI تصوير ٺاهڻ وارو اوزار توهان کي متن سان شاندار تصويرون ٺاهڻ جي اجازت ڏئي ٿو🎨.

بس پنهنجا خيال داخل ڪريو ۽ DALL-E انهن کي فن جي زندگيءَ جهڙو ڪم ۾ بدلائي ڇڏيندو!

خوابن جي منظرن کان وٺي شاندار تائينڪردارپورٽريٽ، امڪان آهيلامحدودجو.

DALL-E پينٽنگ جي جادوئي دائري ۾ شامل ٿيو ۽ پنهنجو فني سفر شروع ڪريو!

DALL-E استعمال ڪندي تصويرون ڪيئن ٺاھيو؟ AI ٽيڪسٽ پينٽنگس ٺاهي ٿو، چئو ته الوداع اسڪمبگ پينٽنگ کي!

تازو، مصنوعي ذھني (AI) جي شعبي ۾ قابل ذڪر ترقي ڪئي آھي.چيٽ GPT نه رڳو اهو متن جي تخليق ۾ شاندار آهي، پر اسان جو AI اسٽيج آهستي آهستي خالص متن کان ٻاهر وڌي ٿو.

DALL-E ڇا آهي؟

DALL-E ھڪڙو انقلابي AI سسٽم آھي جيڪو متن جي وضاحتن جي بنياد تي تصويرون ٺاھي ٿو.

DALL-E مصنوعي ذهانت جي تخليق ۾ هڪ اهم سنگ ميل آهي، ۽ جديد نسخو، DALL-E 3، اڃا به وڌيڪ طاقتور آهي.

هن رهنمائي ۾، اسان هڪ ويجھو نظر وجهنداسين ته DALL-E ڇا آهي، اهو ڪيئن ڪم ڪري ٿو، ان جي ايپليڪيشن جا علائقا، ۽ بهترين بصري مواد ٺاهڻ لاءِ ان کي استعمال ڪرڻ لاءِ صلاحون.

تصور سادو لڳي ٿو، پر بھترين نتيجن لاءِ، توھان کي انھن صلاحن تي عمل ڪرڻو پوندو مستند ۽ صحيح ڳولا جا نتيجا! انهي کي يقيني بڻائڻ لاءِ ته توهان سڀ کان وڌيڪ مستند ۽ صحيح ڳولا جا نتيجا حاصل ڪريو، اسان توهان کي هيٺيون تجويزون ۽ ترڪيبون مهيا ڪريون ٿا.

DALL-E استعمال ڪرڻ کان اڳ، ٽي گھر جي سنڀال جا ضابطا آھن جيڪي توھان کي سمجھڻ جي ضرورت آھي:

جيئن ته توهان فني طور تي پنهنجي آرٽ ورڪ لاءِ خيال پيدا ڪيو آهي، توهان ڊفالٽ طور فنڪار آهيو، جيتوڻيڪ اها تصوير DALL-E 2 جي رنگ واٽر مارڪ سان ڊائون لوڊ ڪئي ويندي.

اتي حدون آهن جيڪي توهان ٺاهي سگهو ٿا. مثال طور، DALL-E 2 جي مواد جي پاليسي نقصانڪار، گمراھ ڪندڙ، يا سياسي مواد کي منع ڪري ٿي. غلط استعمال کي روڪڻ لاءِ، عوامي شخصيتن لاءِ ڪجهه ڳولها لفظ، جهڙوڪ ٽيلر سوئفٽ، بند ٿيل آهن. جڏهن ته سڀئي مشهور شخصيتون مواد جي پاليسين جي ڀڃڪڙي نه ڪندا آهن، انهن جا منهن اڪثر حفاظت لاء مسخ ڪيا ويندا آهن.

DALL-E 2 لاءِ ڪريڊٽ جي حد: صارف جيڪي 2023 اپريل 4 کان اڳ اي ميل ذريعي رجسٽر ۽ اڪائونٽ ٺاهي سگھن ٿا 6 مفت ڪريڊٽ حاصل ڪري سگھن ٿا، هر مهيني ختم ٿيڻ ۽ تجديد ٿيڻ. مثال طور، مون 15 سيپٽمبر 2022 تي سائن اپ ڪيو، تنهنڪري مون کي هر مهيني 9 مفت ڪريڊٽ ملن ٿا، جيڪي پاڻمرادو تجديد ٿين ٿا. نوٽ ڪريو ته مفت ڪريڊٽ روليبل نه هوندا آهن، تنهن ڪري جيتوڻيڪ آئون ٽن مهينن تائين آرٽ نه ٺاهيان، مان 25 ڪريڊٽ گڏ نه ٿو ڪري سگهان. نوان استعمال ڪندڙ جن صرف هڪ اڪائونٽ ٺاهيو آهي هاڻي ساڳئي مفت ڪريڊٽ جي فائدي مان لطف اندوز نه ٿيو ۽ گهٽ ۾ گهٽ 15 ڪريڊٽ $ 60 ۾ خريد ڪرڻ گهرجن. استعمال ڪندڙ خريد ڪري سگھن ٿا DALL-E ڪريڊٽ الڳ الڳ labs.openai.com ذريعي، جيڪي DALL-E API کان الڳ بل ڪيا ويا آھن.

ڪريڊٽ صرف ان کان پوءِ حاصل ڪيا ويندا آهن جڏهن اهي داخل ڪيا ويا ۽ ٺاهيا ويا، ڳولها جيڪي آخرڪار پيدا نه ڪيون ويون آهن مواد جي پاليسي جي خلاف ورزين جي ڪري مفت ڪريڊٽ مان ڪٽجي نه وينديون. توھان ڪلڪ ڪري سگھوٿا پنھنجي پروفائل آئڪن تي سرچ انٽرفيس جي مٿئين ساڄي ڪنڊ ۾ اھو ڏسڻ لاءِ ته توھان ھر مھيني ڪيترو ڪريڊٽ ڇڏيو آھي، ۽ توھان وڌيڪ خريد ڪرڻ جو انتخاب ڪري سگھو ٿا، $115 کان شروع ٿيندڙ 15 ڪريڊٽ لاءِ.

تصويرون ٺاهڻ لاءِ DALL-E ڪيئن استعمال ڪجي؟

DALL-E هن وقت مارڪيٽ تي موجود سڀ کان وڌيڪ طاقتور مصنوعي ذهانت وارو اوزار آهي.

ھي ھڪڙو مصنوعي ذھني تصويري جنريٽر آھي جيڪو OpenAI ٽيم پاران ChatGPT جي پويان ٺاھيو ويو آھي. اھو ھڪڙي ٽيڪنالاجي استعمال ڪري ٿو جنھن کي "generative artificial intelligence" سڏيو ويندو آھي متن جي اشارن جي بنياد تي اصل تصويرون ٺاهڻ لاءِ.

مثال طور، جيڪڏهن توهان متن داخل ڪريو "an avocado chair with a red colored monkey”، DALL-E هن عجيب شئي جون نيون تصويرون ٺاهيندو.

هڪ ايوڪوڊ ڪرسي ۽ هڪ ڳاڙهي بندر جي تصوير 2

بلڪه هڪ تصوير جي حصن کي ڪٽڻ ۽ کولڻ جي بدران، اهو اصل ۾ "تصور" آهي جيڪو توهان بيان ڪري رهيا آهيو. وڌيڪ تفصيل سان توهان جي وضاحت، وڌيڪ سڌريل نتيجن واري تصوير هوندي.

اها ڳالهه نوٽ ڪرڻ جي قابل آهي ته نالو "DALL-E" سريالسٽ آرٽسٽ سلواڊور دالي ۽ Pixar جي دوستانه روبوٽ ڪردار WALL-E جو هڪ هوموفوني آهي. اهو اشارو ڏئي ٿو ته ڪيئن DALL-E آرٽ ۽ ٽيڪنالاجي کي گڏ ڪري ٿو شاندار بصري اثر پيدا ڪرڻ لاءِ سڌو ٽيڪسٽ وضاحتن مان.

هي DALL-E جو عجب آهي، جيڪو مصنوعي ذهانت جي تخليقيت ۾ هڪ ليپ جي نمائندگي ڪري ٿو.

جڏهن ته انسان لفظن جي ذريعي شين کي آسانيءَ سان تصور ڪري سگهي ٿو، پر ڪمپيوٽر ائين ڪرڻ کان قاصر هئا، خاص ڪري اهڙي وشد انداز ۾ نه. DALL-E ڪمپيوٽرن ۾ موجود عملي تخيل ۽ مسئلا حل ڪرڻ جي صلاحيت کي محسوس ڪري ٿو، گرافڪ ڊيزائن، تصويري ٽيمپليٽس، ويب پيج جي ترتيب، ۽ وڌيڪ لاءِ دلچسپ امڪانن کي کولڻ.

DALL-E ڪيئن ڪم ڪندو آهي؟

DALL-E پنهنجو جادو ڪيئن اڇلائي ٿو؟ جيئن اڳ ذڪر ڪيو ويو آهي، اهو هڪ ٽيڪنالاجي استعمال ڪري ٿو جنهن کي "پيداوار مصنوعي ذهانت" سڏيو ويندو آهي. اچو ته هڪ ويجهي نظر وٺو.

پيدا ٿيندڙ AI ماڊل

جنريٽو AI ماڊل تصوير 3

اڪثر ٽاسڪ-مخصوص AI جي برعڪس، پيدا ڪندڙ AI ماڊل خاص ڪم ڪرڻ لاءِ خاص نه هوندا آهن.

ان جي بدران، اهي تصويرون، ٽيڪسٽ، ۽ ٻين ڊيٽا جي وڏي سيٽ تي تربيت ڏني وينديون آهن مختلف تصورن جي وچ ۾ لاڳاپن جي گهڻي ڄاڻ کي وڌائڻ لاء.

اهو انهن کي نئين پيداوار پيدا ڪرڻ جي قابل بنائي ٿو جيڪو انتهائي حقيقي آهي ۽ صحيح طور تي اشارو سان ملندو آهي.

مثال طور، هڪ AI صرف ٻلين جي تصويرن تي تربيت ڪئي وئي آهي، جيڪو "فليمنگو-شير" وانگر هڪ ناول جانور تصور نه ڪري سگهندو. جانورن، انسانن، رانديڪن ۽ ٻين ڪيترن ئي قسمن جي لکين تصويرن تي تربيت حاصل ڪئي وئي آهي، پيداواري ماڊل هن علم کي گڏ ڪري سگهي ٿو قائل ڪري سگهي ٿو هڪ فليمنگو-شير هائبرڊ پيدا ڪرڻ جي بنياد تي.

DALL-E 3 جي جديد ورزن ۾، مڪمل طور تي نيون شيون ٺاهڻ جي صلاحيت کي وڌيڪ ڏيکاريو ويو آهي. نئون نسخو اشارو جي تشريح ڪرڻ ۾ اعليٰ سطح جي درستگي ڏيکاري ٿو، ذيلي فرقن ۽ تفصيلن کي پڪڙڻ جيڪي اڳوڻا ماڊل پڪڙڻ کان قاصر هئا.

اڳئين مصنوعي ڄاڻ رکندڙ جنريٽر جي مقابلي ۾، DALL-E 3 هاڻي غير متوقع نتيجن جو شڪار ناهي جڏهن پيچيده هدايتون حاصل ڪري رهيا آهن. ان جي بدران، اها ٻوليءَ جي هڪ اعليٰ سمجهه جو مظاهرو ڪري ٿي جيڪا ان کي ناول جي منظرنامي ۽ ڪردارن کي تصور ڪرڻ جي قابل بڻائي ٿي جيڪي ٽيڪسٽ-ٽو-تصوير پيدا ڪندڙ ماڊلز کان توقع کان وڌيڪ آهن.

DALL-E 3 سان، ٻولي ۽ تصوير جي وچ ۾ لاڳاپو اڃا به وڌيڪ ويجھو آهي، صرف ميڪاني طور تي تصويرون ٺاهڻ جي بجاءِ اشارو جي حوالي سان تشريح ڪرڻ جي صلاحيت سان. هي ٺاهيل تصويرن کي صارف جي اميدن جي ويجهو ٺاهي ٿو.

اڳيون، اچو ته هڪ تمام گهڻي نظر رکون ته ڪيئن DALL-E جي نسل جو فن تعمير ڪم ڪري ٿو.

DALL-E جي تخليقي فن تعمير ڪيئن ڪم ڪندو آهي؟

DALL-E کي چالو ڪرڻ جي ڪنجي متن مان تصويرون ٺاهڻ لاءِ ان جي خاص طور تي ٺهيل نيورل نيٽ ورڪ فن تعمير ۾ آهي:

وڏي ڊيٽا سيٽ:

DALL-E اربين تصويري ٽيڪسٽ جوڑوں تي تربيت ڪئي وئي آهي، جيڪا ان کي بصري تصورات ۽ انهن جو تعلق متن جي مواد يا ڳالهائڻ واري ٻولي سان سکڻ جي قابل بڻائي ٿي. هي وسيع ڊيٽا سيٽ ان کي دنيا جي علم جي وسيع سمجھ سان مهيا ڪري ٿو.

درجه بندي جي جوڙجڪ:

نيٽ ورڪ کي اعليٰ سطحي تصورن کان وٺي تفصيلن تائين هڪ ترتيب وار نمائندگي آهي. مٿيون پرتون وسيع درجي کي سمجھن ٿيون (جهڙوڪ پکين)، جڏهن ته هيٺيون پرتون ذهين صفتن کي سڃاڻن ٿيون (جهڙوڪ چونچ جي شڪل، رنگ، ۽ منهن تي پوزيشن).

ٽيڪسٽ انڪوڊنگ:

هن علم کي استعمال ڪندي، DALL-E لکيل لفظن کي متن جي رياضياتي نمائندگي ۾ تبديل ڪرڻ جي قابل آهي. مثال طور، جڏهن اسان ٽائيپ ڪندا آهيون "Flamingo-lion"، اهو ڄاڻي ٿو ته فليمنگو ڇا آهي، شينهن ڇا آهي، ۽ ٻن جانورن جي مختلف خاصيتن کي گڏ ڪرڻ جي قابل آهي. هن ترجمي جي ذريعي، متن جي ان پٽ بصري پيداوار پيدا ڪري سگهي ٿي.

هي ترقي يافته فن تعمير DALL-E کي قابل بنائي ٿو صحيح طور تي تخليقي ۽ مربوط تصويرون ٺاهڻ لاءِ متن جي اشارن جي پٺيان.

ھاڻي، اسان سمجھون ٿا ٽيڪنيڪل پيچيدگيون، پر آخري استعمال ڪندڙ لاء، DALL-E استعمال ڪرڻ بلڪل سادو آھي.

بس اشارو داخل ڪريو ۽ شاندار تصويرون ٺاھيو.

ٻولي جا ماڊل ۽ DALL-E

DALL-E آرڪيٽيڪچر جو هڪ اهم حصو GPT (Generative Pretrained Transformer) ٻولي ماڊل آهي. اهي ماڊل اشعار جي تشريح ۽ سڌارڻ ۾ اهم ڪردار ادا ڪن ٿا.

GPT ماڊل زبان جي حوالي سان ۽ ذيلي فرق کي سمجهڻ ۾ سٺو آهي. جڏهن هڪ پرامپ داخل ڪيو ويندو آهي، GPT ماڊل نه رڳو لفظن کي پڙهي ٿو پر انهن جي پويان ارادي ۽ ذيلي معني کي پڻ سمجهي ٿو. هي سمجھاڻي خلاصي يا پيچيده خيالن کي بصري عناصر ۾ ترجمو ڪرڻ لاءِ انتهائي اهم آهي جنهن کي DALL-E جو تصويري نسل جو حصو استحصال ڪري سگهي ٿو.

جيڪڏهن شروعاتي اشارو واضح ناهي يا تمام وسيع آهي، GPT ماڊل مدد ڪري سگھي ٿو اشاري کي بهتر يا وڌائڻ ۾. ٻولي ۽ مختلف عنوانن تي وسيع تربيت ذريعي، اهو اندازو لڳائي سگھي ٿو ته ڪهڙن تفصيلن سان لاڳاپيل يا دلچسپ ٿي سگھي ٿو تصوير سان، جيتوڻيڪ اصل پرامٽ ۾ واضح طور تي ذڪر نه ڪيو ويو آهي.

GPT ماڊل پڻ اشارن ۾ ممڪن غلطيون يا مونجهاري جي نشاندهي ڪري سگھن ٿا. مثال طور، جيڪڏهن هڪ پرامٽ حقيقتن ۾ تضاد يا مونجهاري واري ٻولي تي مشتمل آهي، ته ماڊل غلطي کي درست ڪري سگهي ٿو يا وضاحت طلب ڪري سگهي ٿو، انهي کي يقيني بڻائي ته تصويري جنريٽر کي حتمي ان پٽ ممڪن طور تي واضح ۽ درست آهي.

دلچسپ ڳالهه اها آهي ته، جي پي ٽي جو ڪردار صرف سمجهڻ ۽ سڌارڻ تائين محدود ناهي، اهو پڻ تخليقيت جي هڪ پرت کي شامل ڪري سگهي ٿو. وسيع تربيت سان، اهو اشعار جي منفرد يا تصوراتي تشريح سان گڏ اچي سگهي ٿو، تصوير جي نسل جي حدن کي زور ڏئي ٿو.

جوهر ۾، GPT ٻولي ماڊل صارف جي ان پٽ ۽ DALL-E جي تصوير جي پيداوار جي صلاحيتن جي وچ ۾ هڪ ذهين وچولي آهي. نه رڳو اھي پڪ ڪندا آھن ته اشارا صحيح سمجھيا ويندا آھن، اھي بھترين ۽ بھتر ڪيا ويندا آھن ته جيئن سڀ کان وڌيڪ لاڳاپيل ۽ تخليقي بصري پيداوار پيدا ڪري سگھن.

DALL-E ڇا لاء استعمال ڪيو ويو آهي؟

DALL-E جا ايپليڪيشن جا شعبا مختلف آهن. اهو مختلف قسم جي بصري عناصر ٺاهڻ لاء استعمال ڪري سگهجي ٿو، مختلف صنعتن ۽ استعمالن لاء تخليقي ۽ ڊيزائن جي سهولت فراهم ڪرڻ.

گرافڪ ڊيزائن:

DALL-E مختلف تصورن جي وچ ۾ لاڳاپن جي تمام گهڻي ڄاڻ حاصل ڪرڻ لاءِ تصويرن، متن، ۽ ٻين ڊيٽا سيٽن تي منفرد ۽ زبردست ٽريننگ ٺاهي سگھي ٿو.

هن طريقي سان، اهي نوان پيداوار پيدا ڪرڻ جي قابل آهن جيڪي انتهائي حقيقي آهن ۽ صحيح طور تي مهيا ڪيل اشارو سان ملن ٿيون.

مثال طور، هڪ AI صرف ٻلين جي تصويرن تي تربيت ڪئي وئي آهي، "فليمنگو ۽ شينهن" وانگر ناول جانورن جي نسلن کي تصور ڪرڻ جي قابل نه هوندا.

۽ مختلف جانورن، انسانن، رانديڪن ۽ وڌيڪ جي لکين تصويرن، ٽيڪسٽ، ۽ آڊيو تي تربيت ذريعي، جنريٽو ماڊل انهن سکيا جي نتيجن کي گڏ ڪري سگهي ٿو قائل طور تي هائبرڊز جهڙوڪ "فليمنگو ۽ شعر" پيدا ڪرڻ لاء.

DALL-E 3 جي جديد ورزن ۾، نيون شيون ٺاهڻ جي اها صلاحيت اڃا به وڌيڪ طاقتور آهي. اهو اشارو ڪري ٿو صحيح طور تي تشريح ڪرڻ ۽ ذيلي فرقن ۽ تفصيلن تي قبضو ڪرڻ ۾ نئين قابليت ڏيکاري ٿو جيڪي اڳوڻو ماڊل پڪڙڻ ۾ ناڪام هئا.

اڳوڻي مصنوعي ڄاڻ رکندڙ جنريٽر جي مقابلي ۾، DALL-E 3 بهتر سمجھڻ جي صلاحيت ڏيکاري ٿو جڏهن پيچيده هدايتون حاصل ڪري ٿي. جڏهن ته پوئين جنريٽر غير متوقع نتيجا پيدا ڪرڻ جي ڪوشش ڪندا هئا جڏهن پيچيده اشارن کي پروسيس ڪري رهيا هئا، DALL-E 3 ٻوليءَ جي بهترين سمجهه جو مظاهرو ڪري ٿو، ان کي اجازت ڏئي ٿو ته ناول جي منظرنامي ۽ ڪردارن کي تصور ڪري سگهي متن کان تصويري نسل جي ماڊل کان ٻاهر.

DALL-E 3 سان، ٻولي ۽ تصوير جي وچ ۾ لاڳاپو اڃا وڌيڪ مضبوط آهي، تنهنڪري اهو صرف اسڪرپٽ مان پڙهڻ جي بجاءِ پرامٽ جي حوالي سان تشريح ڪري سگهي ٿو. پيدا ٿيل نتيجا شايد صارف جي ضرورتن جي تمام ويجهو هوندا.

هتي هڪ سادي ترڪيب جو هڪ مثال آهي: "تصور ڪريو هڪ فليمنگو شعر."

تصوير جي پيداوار:

فليمنگو-شعر تصوير 4

پوء، اهو ڪيئن حاصل ڪيو ويو آهي؟ اها صلاحيت "تصور" ڪرڻ جي ٽيڪسٽ پيدا ڪندڙ AI ماڊل جي ٻن اهم حصن مان نڪرندي آهي:

اعصابي نيٽ ورڪ:

نيورل نيٽ ورڪ هڪ اعلى الورورٿم نيٽورڪ آهي جيڪو انساني دماغ ۾ نيورسن جي ڪم ڪندڙ اصول کي نقل ڪري ٿو. اهو مصنوعي ذهانت کي وڏي ڊيٽا سيٽن ۾ نمونن ۽ تصورن کي سڃاڻڻ جي قابل بڻائي ٿو.

مشين لرننگ الگورتھم:

اهي الگورتھم، جهڙوڪ گہرے سکيا، ڊيٽا جي رشتن جي اعصابي نيٽ ورڪ جي سمجھ کي بهتر ڪرڻ لاء جاري رکو.

پيداواري ماڊل وڏي ڊيٽا سيٽن تي تربيت ذريعي دنيا جي امير تصوراتي سمجھ کي تعمير ڪن ٿا. درست اشارا انهن سکيا جي نتيجن کي ريمڪس ڪري سگھن ٿا ته جيئن اڳ ۾ نه ڏٺو ويو پيداوار پيدا ٿئي.

ڪيئن DALL-E جو جنريٽو آرڪيٽيڪچر ڪم ڪندو آهي

DALL-E متن مان تصويرون پيدا ڪرڻ جي قابل آهي ان جي خاص ڊزائين ڪيل نيورل نيٽ ورڪ آرڪيٽيڪچر جي مهرباني:

وڏي ڊيٽا سيٽ:

DALL-E بلين تصويري ٽيڪسٽ جوڑوں تي تربيت ڪئي وئي آهي، جيڪا ان کي بصري تصورن کي سکڻ جي اجازت ڏئي ٿي ۽ متن جي مواد يا ڳالهائڻ واري ٻولي سان انهن جو تعلق. هي وسيع ڊيٽا سيٽ ان کي دنيا جي وسيع ڄاڻ سان مهيا ڪري ٿو.

درجه بندي جي جوڙجڪ:

نيٽ ورڪ کي اعلي سطحي تصورن کان تفصيلن تائين، درجه بندي جي نمائندگي ڪئي وئي آهي. مٿيون پرتون وسيع درجي کي سمجھن ٿيون (جهڙوڪ پکين)، جڏهن ته هيٺيون پرتون ذهين صفتن کي سڃاڻن ٿيون (جهڙوڪ چونچ جي شڪل، رنگ، ۽ منهن تي پوزيشن).

ٽيڪسٽ انڪوڊنگ:

هن علم سان، DALL-E لکيل لفظن کي رياضياتي نمائندگي ۾ تبديل ڪرڻ جي قابل آهي. مثال طور، جڏهن اسان ٽائيپ ڪريون ٿا ”فليمنگو شعر“، اهو ڄاڻي ٿو ته فليمنگو ۽ شينهن ڇا آهن ۽ انهن ٻن جانورن جي مختلف خاصيتن کي گڏ ڪرڻ جي قابل آهي. هن قسم جي ترجمي ذريعي، متن جي ان پٽ بصري پيداوار پيدا ڪري سگهي ٿي.

هي ترقي يافته فن تعمير DALL-E جي مدد ڪري ٿو تخليقي ۽ مربوط تصويرون ٺاهڻ ۾ مبني متن جي اشارن جي بنياد تي.

هاڻي، اسان ڄاڻون ٿا ته ٽيڪنيڪل مسئلا ڪافي پيچيده ٿي سگهن ٿا، پر آخري صارف لاء، آپريشن بلڪل سادو آهي.

بس صلاحون ڏيو ۽ شاندار تصويرون ٺاھيو.

ٻولي جا ماڊل ۽ DALL-E

DALL-E جي اڏاوت جو هڪ اهم حصو GPT (Generative Pretrained Transformer) ٻولي ماڊل آهي. اهي ماڊل تصوير جي پيداوار کي بهتر ڪرڻ لاء اشعار جي تشريح ۽ بهتر ڪرڻ ۾ اهم ڪردار ادا ڪن ٿا.

GPT ماڊلز ٻوليءَ جي حوالي سان ۽ نزاڪت کي سمجهڻ ۾ سٺا آهن. جڏهن اشارو ڪيو ويو، GPT ماڊل صرف لفظن کي سڃاڻڻ جي قابل ناهي پر انهن جي پويان ارادي ۽ ذيلي معني کي پڻ سمجهي سگهي ٿو. هي سمجھاڻي خلاصي يا پيچيده خيالن کي بصري عناصر ۾ ترجمو ڪرڻ لاءِ انتهائي اهم آهي جنهن کي DALL-E جو تصويري نسل جو حصو استحصال ڪري سگهي ٿو.

جيڪڏهن شروعاتي پرامٽ مبہم يا تمام وسيع ٿي سگهي ٿو، GPT ماڊل مدد ڪري سگھي ٿو پرامٽ کي بهتر يا وڌائڻ ۾. ٻوليءَ ۽ مختلف عنوانن تي وسيع تربيت ذريعي، اهو اندازو لڳائي سگھي ٿو ته ڪهڙيون تفصيلون ڪنهن تصوير سان لاڳاپيل يا دلچسپ ٿي سگهن ٿيون، جيتوڻيڪ انهن جو اصل پرامٽ ۾ واضح طور تي ذڪر نه ڪيو ويو آهي.

GPT ماڊل پڻ اشارن ۾ ممڪن غلطيون يا ابهام جي نشاندهي ڪرڻ جي قابل آهي. مثال طور، جيڪڏهن هڪ پرامپٽ حقيقتن ۾ تضاد يا مونجهاري واري ٻولي تي مشتمل آهي، ماڊل غلطي کي درست ڪري سگهي ٿو يا وضاحت طلب ڪري سگهي ٿو، انهي کي يقيني بڻائي ته تصويري جنريٽر جو حتمي نتيجو جيترو ممڪن ٿي سگهي واضح ۽ درست آهي.

دلچسپ ڳالهه اها آهي ته، جي پي ٽي جو ڪردار صرف سمجهڻ ۽ سڌارڻ تائين محدود ناهي، اهو پڻ تخليقيت جي هڪ پرت کي شامل ڪري سگهي ٿو. وسيع تربيت سان، اهو اشعار جي منفرد يا تصوراتي تشريح سان گڏ اچي سگهي ٿو، تصوير جي پيداوار جي تخليقي حدن کي زور ڏئي ٿو.

جوهر ۾، GPT ٻولي ماڊل صارف جي ان پٽ ۽ DALL-E جي تصوير جي پيداوار جي صلاحيتن جي وچ ۾ هڪ ذهين وچولي آهي. نه رڳو اهو يقيني بڻائي ٿو ته اشارن کي صحيح طور تي سمجھيو ويو آهي، پر اهي پڻ بهتر ۽ بهتر ڪيا ويا آهن ته جيئن سڀ کان وڌيڪ لاڳاپيل ۽ تخليقي بصري پيداوار پيدا ڪن.

DALL-E جي درخواست

DALL-E صرف هڪ بهترين ٽيڪنالاجي جي نمائش کان وڌيڪ آهي، ان ۾ ڪيتريون ئي عملي ايپليڪيشنون آهن.

1. تخليقي ڊيزائن:

ڊزائينر آساني سان پنھنجي تخليقي خيالن کي DALL-E سان محسوس ڪري سگھن ٿا. ڇا اهو هڪ منفرد پراڊڪٽ جو تصور آهي، اشتهارن جي تصوير، يا فنڪشنل ڪم، DALL-E ڊزائن جي ميدان ۾ نئين انسپيڪشن داخل ڪري سگهي ٿو.

2. مواد ٺاھڻ:

ليکڪ ۽ تخليق ڪندڙ DALL-E استعمال ڪري سگھن ٿا بصري عناصر پيدا ڪرڻ لاءِ سندن ڪهاڻيون، مضمونن يا مزاحيه. هي انهن جي تخليق کي بهتر بنائڻ ۽ انهن کي وڌيڪ پرڪشش بنائڻ ۾ مدد ڪري ٿو.

3. بصري واپار:

برانڊز ۽ مارڪيٽنگ ٽيمون DALL-E استعمال ڪري سگھن ٿيون اکين کي پڪڙڻ وارا اشتهار، پوسٽر ۽ ٻيون پروموشنل مواد ٺاهڻ لاءِ. هي برانڊ جي شعور کي وڌائڻ ۽ وڌيڪ حدف ٿيل سامعين کي راغب ڪرڻ ۾ مدد ڪري ٿو.

4. تعليمي مدد:

تعليم ڏيندڙ DALL-E استعمال ڪري سگهن ٿا تصويرون ٺاهڻ لاءِ ته جيئن تدريسي مواد کي وڌيڪ جاندار ۽ دلچسپ بڻائي سگهجي. شاگرد بصري عناصر ذريعي پيچيده تصورن کي بهتر سمجهي سگهن ٿا.

5. مجازي منظر ٺاهڻ:

فلم ۽ ٽيليويزن پروڊيوسر ۽ گيم ڊولپرز DALL-E استعمال ڪري سگھن ٿا منفرد منظر، ڪردار ۽ پروپس پيدا ڪرڻ لاءِ انھن جي ڪم ۾ رنگ شامل ڪرڻ لاءِ.

اهو صرف DALL-E جي آئس برگ جو ٽپ آهي، ۽ ان جي ايپليڪيشن جا علائقا اڃا تائين وڌي رهيا آهن. اهو زندگي جي سڀني شعبن ۾ بي مثال تخليق ۽ ڪارڪردگي آڻيندو آهي.

نتيجي ۾

مصنوعي ذهانت جي موج ۾، DALL-E بلاشبہ هڪ ڪارو گهوڙو آهي. اهو تصوير جي پيداوار ۾ مصنوعي ذهانت جي غير معمولي صلاحيتن کي ظاهر ڪري ٿو، ٺاهيندڙن، ڊزائنر، ۽ مارڪيٽنگ پروفيسر لاء طاقتور اوزار مهيا ڪري ٿو.

ڊيپ لرننگ ۽ جديد نيورل نيٽ ورڪن ذريعي، DALL-E نه صرف متن جي اشارن کي سمجهڻ جي قابل آهي، پر تخليقي طور تي انهن کي شاندار بصري مواد ۾ تبديل ڪري ٿو. ان جي نسل جي عمل ۾ پيدا ٿيندڙ مصنوعي ذهانت ۽ ٻولي ماڊلز کي گڏ ڪري ٿو ته جيئن صارفين کي هڪ سادي ۽ طاقتور تجربو مهيا ڪري سگهجي.

چاهي اها تخليقي ڊيزائن هجي، مواد جي تخليق هجي يا مارڪيٽنگ، DALL-E مختلف صنعتن ۾ نئين توانائيءَ جو انجڻ لڳايو آهي. اهو نه رڳو ٽيڪنالاجي جو عروج آهي، پر لامحدود تخليق جو ذريعو پڻ آهي.

جيئن ٽيڪنالاجي ترقي ڪندي رهي ٿي، اسان اميد ڪري سگهون ٿا ته DALL-E جا مستقبل جا نسخا وڌيڪ حيرت انگيز آڻيندا ۽ مصنوعي ذهانت جي ميدان ۾ وڌيڪ جوش پيدا ڪندا.

اميد چن ويلانگ بلاگ ( https://www.chenweiliang.com/ ) شيئر ڪيو "تصويرون ٺاهڻ لاءِ DALL-E ڪيئن استعمال ڪجي؟" AI ٽيڪسٽ پينٽنگس ٺاهي ٿو، چئو ته الوداع اسڪمبگ پينٽنگ کي! 》، توهان لاء مددگار.

هن آرٽيڪل جي لنڪ کي حصيداري ڪرڻ لاء ڀليڪار:https://www.chenweiliang.com/cwl-31503.html

تازن تازه ڪاريون حاصل ڪرڻ لاءِ Chen Weiliang جي بلاگ جي ٽيليگرام چينل تي ڀليڪار!

🔔 چينل جي ٽاپ ڊاريڪٽري ۾ قيمتي "ChatGPT مواد مارڪيٽنگ AI اوزار استعمال ڪرڻ جي گائيڊ" حاصل ڪرڻ وارا پھريون بڻجي وڃو! 🌟
📚 هي گائيڊ وڏي قيمت تي مشتمل آهي، 🌟 هي هڪ نادر موقعو آهي، ان کي نه وڃايو! ⏰⌛💨
پسند اچي ته شيئر ڪريو ۽ پسند ڪريو!
توهان جي حصيداري ۽ پسند اسان جي مسلسل حوصلا آهن!

 

发表 评论

توهان جو اي ميل پتو شايع نه ڪيو ويندو. 必填 项 已 用 * ليبل

مٿي ڏانهن ڇڪيو