"Unlocking Creativity: Exploring the Integrated Editing Tools in DALL-E 3"

 কখনও আপনার DALL-E 3 সৃষ্টি অবিলম্বে সম্পাদনা করতে চেয়েছিলেন কিন্তু পরিবর্তনগুলি কীভাবে করবেন তা জানেন না?




OpenAI আপনার কথা শুনেছে এবং ChatGPT-এ DALL-E 3-এ ইনলাইন এডিটিং টুল যোগ করেছে, যা আপনাকে অ্যাপ না রেখেই আপনার সৃষ্টিতে পরিবর্তন করতে দেয়।

একমাত্র সমস্যা হল যে ওপেনএআই যা বিজ্ঞাপন দেয় তারা তা করে না এবং আপনি আপনার পছন্দসই সম্পাদনাগুলি পাবেন কিনা তা নিয়ে এটি একটি মিশ্র ব্যাগ। কিন্তু তবুও, এটি DALL-E 3 সম্পাদনার জন্য যা আসতে চলেছে তার একটি শুরু, এবং তারা এভাবেই কাজ করে।

DALL-E 3 এর সম্পাদনা সরঞ্জামগুলি কী কী?

তারা আসতে বেশ কিছুক্ষণ হয়েছে, কিন্তু OpenAI অবশেষে ChatGPT প্লাসে DALL-E 3 এ সম্পাদনা কার্যকারিতা যুক্ত করেছে। এর আগে, আপনি আপনার DALL-E 3 সৃষ্টিতে সম্পাদনা করার চেষ্টা করতে পারেন, তবে এটি সাধারণত সর্বদা একটি সম্পূর্ণ নতুন চিত্র তৈরি করে। এমনকি যদি সম্পাদিত ইমেজ তৈরি করতে ব্যবহৃত প্রম্পটগুলি প্রথম প্রম্পটের সাথে অত্যন্ত মিল ছিল, জেনারেটিভ AI এর প্রকৃতির কারণে, আউটপুট উল্লেখযোগ্যভাবে ভিন্ন হতে পারে।

DALL-E 3 এর সমন্বিত সম্পাদনা সরঞ্জামগুলি এখন নতুন প্রম্পট তৈরি না করে একই চিত্রের মধ্যে সমস্যাগুলি সমাধান করার লক্ষ্য রাখে। আপনি যে চিত্রটি সামঞ্জস্য করতে চান তার একটি এলাকা হাইলাইট করুন, DALL-E কে একটি নির্দিষ্ট পরিবর্তন করতে অনুরোধ করুন (যেমন "এটি সরান" বা "এই বৈশিষ্ট্যটি যুক্ত করুন"), এবং এটি কাজ করে।




যাইহোক, এটি একটি মিশ্র ব্যাগ.

OpenAI-এর অফিসিয়াল ব্লগের উদাহরণ দেখায় যে DALL-E বিড়ালের উকিও-ই-স্টাইলের ছবিতে চেরি ফুল যোগ করছে এবং এটি পুরোপুরি কাজ করছে। আমার অভিজ্ঞতায়, DALL-E-এর সম্পাদনা সরঞ্জামগুলি বিদ্যমান ছবিতে এই ধরনের বিশদ চিত্র যুক্ত করার জন্য লড়াই করে এবং বেশিরভাগ অংশে, এই প্রকৃতির অনুরোধগুলি প্রক্রিয়া করতে পারে না।

এটি বলার নয় যে সম্পাদনা সরঞ্জামগুলি কাজ করে না। তারা একেবারে বৈশিষ্ট্যগুলি সরিয়ে ফেলতে পারে এবং ছোট পরিবর্তন করতে পারে, যেমন নীচে বিশদ বিবরণ দেওয়া হয়েছে, তবে এটি সবই ছোট স্কেলে।



কিভাবে DALL-E 3 এর এডিটিং টুল ব্যবহার করবেন

DALL-E 3-এর সম্পাদনা টুল কী করতে পারে তা দেখানোর সর্বোত্তম উপায় হল কিছু সঠিক উদাহরণ।

অপসারণ এবং মুছে ফেলা হচ্ছে

DALL-E 3 এর সম্পাদনা সরঞ্জামগুলি কিছু ছোট বৈশিষ্ট্য মুছে ফেলতে পারে, তবে এটি অবশ্যই সংগ্রাম করে। নিচের ছবিতে, আমি DALL-E কে তৈরি করতে বলেছিলাম "একটি রোবোটিক হাতে একটি উজ্জ্বল, স্বচ্ছ বর্গাকার চিপ ধরে আছে যার উপরে লেখা 'AI Accelerated'। ব্যাকগ্রাউন্ডটি গাঢ় নীল, একটি ভবিষ্যত এবং উচ্চ প্রযুক্তির পরিবেশ তৈরি করে।"

এখন, প্রদত্ত লেখা লেখাটি জেনারেটিভ এআই-এর জন্য একটি নির্দিষ্ট সমস্যা, আমি বিস্মিত নই যে পাঠ্যটি ভুল ছিল—তাই আমি DALL-E কে বানান ভুলটি সরাতে বলেছি। এটি "দয়া করে এই শব্দটি সরান" প্রম্পট দিয়ে প্রথম প্রচেষ্টায় ব্যর্থ হয়েছে কিন্তু "দয়া করে ছবিটি থেকে এই শব্দটি সরান" প্রম্পট দিয়ে দ্বিতীয় চেষ্টায় সফল হয়েছে। সুতরাং, সফলতা, হ্যাঁ, তবে ফলাফল পেতে আপনাকে বিভিন্ন প্রম্পট চেষ্টা করতে হতে পারে। আমি তখন এটিকে AI অক্ষরগুলিকে বর্গক্ষেত্রের কেন্দ্রে সরাতে বলেছিলাম, যা কিছু কারণে আমার পিসি ক্র্যাশ হওয়া সত্ত্বেও এটি ভাল করেছিল।






পরবর্তীতে, আমি DALL-E কে স্থির দেখানো একটি টেলিভিশনের ছবি সম্পাদনা করতে সাহায্য করতে বলেছিলাম। DALL-E অনন্য ইমেজ তৈরি করার জন্য দুর্দান্ত, তবে এটি কিছু বিবরণ ভুল পায় বা বিকৃত পাঠ্য সরবরাহ করে। এই ক্ষেত্রে, টিভি স্ক্রিনের তথ্য বারটি অপ্রীতিকর AI পাঠ্য প্রদর্শন করে, তাই আমি এটি সরাতে চেয়েছিলাম। DALL-E-এর প্রথম প্রচেষ্টা একটি ছায়া ফেলে যেখানে তথ্য বার ছিল, যখন দ্বিতীয় এবং তৃতীয় চেষ্টাটি ছিল অনেক বেশি পরিষ্কার। নিখুঁত নয়, তবে আমি যেটির জন্য ছবিটি ব্যবহার করছিলাম তার জন্য যথেষ্ট শালীন।






যোগ এবং পরিবর্তন

DALL-E 3 ইমেজে কিছু পরিবর্তন করতে পারে, কিন্তু আবার, এটা নির্ভর করে আপনি কি চাইছেন তার স্কেলের উপর। ছোট সংযোজন এবং পরিবর্তন সম্ভব, কিন্তু বেশিরভাগ সময়, DALL-E এর সম্পাদনা সরঞ্জাম যা জিজ্ঞাসা করা হয় তা প্রক্রিয়া করতে পারে না।

আমি DALL-E কে "মানুষের চোখ বন্ধ করে একটি 2:1 4k চিত্র তৈরি করতে, বিস্তারিত হতে" বলেছিলাম, যার ফলে নিম্নলিখিত চিত্রটি দেখা যায়:



বেশ শালীন, যদি একটু অদ্ভুত হয় (চোখের প্রতিফলন?!), কিন্তু আমি আইরিসের রঙের পরিবর্তে নীল-সবুজে পরিবর্তন করতে চেয়েছিলাম, ফলে এই চিত্রটি দেখা যাচ্ছে:



রঙ সামান্য নিস্তেজ কিন্তু অপরিবর্তিত, এবং কিছু বৈশিষ্ট্য সামান্য বিকৃত হয়.
পরবর্তীতে, আমি DALL-E-কে "ইয়েটি ব্যাকগ্রাউন্ড সহ একটি ঢালে স্কি করে টাইগার ওয়ানসি পরা একজন ব্যক্তির 4k 2:1 ক্লেমেশন শৈলীর চিত্র তৈরি করতে" বলেছিলাম৷



আবার, আসল চিত্রটি ভাল, তীক্ষ্ণ, প্রাণবন্ত রঙ রয়েছে এবং প্রম্পটের সাথে মেলে। যাইহোক, আমি ইয়েটিকে একটি ভিন্ন ধরনের ভীতিকর প্রাণীতে পরিবর্তন করতে চেয়েছিলাম। 
একটি ভিন্ন প্রাণীর জন্য ইয়েটি অদলবদল করার পরিবর্তে, এটি সম্পূর্ণরূপে চলে গেছে। পরিবর্তে, আমি আসল ছবিতে ফিরে এসেছি এবং এটিকে আরেকটি ইয়েটি যোগ করতে বলেছি, যা এটি করতে ব্যর্থ হয়েছে। ছবিটিতে আরও গাছ যোগ করতে বলা হলে এটি একইভাবে ব্যর্থ হয়।

পাঠ্য যোগ করা হচ্ছে

এখানে কভার করার অনেক কিছু নেই। যেমন বলা হয়েছে, জেনারেটিভ এআই সাধারণত যেভাবেই হোক টেক্সটের সাথে লড়াই করে এবং একটি ছবিতে পাঠ্য যোগ করা আরও কঠিন। আমি DALL-E কে একটি ব্রিটিশ সমুদ্র উপকূল থেকে একটি পোস্টকার্ড তৈরি করার জন্য অনুরোধ করেছিলাম, যা এটি করেছিল, দৃশ্যটি সুন্দরভাবে ক্যাপচার করে। আমি তখন ইমেজটিতে "সানি বিচ" শব্দ যোগ করতে চেয়েছিলাম, যা এটি ঠিক করতে পারেনি। অর্থাৎ, DALL-E-কে কী করতে হবে তা মনে করিয়ে দেওয়ার জন্য প্রায় ছয় বা সাতটি বার-বার প্রম্পট না হওয়া পর্যন্ত, এটি প্রয়োজনীয় পাঠ্য সহ একটি সম্পূর্ণ নতুন চিত্র তৈরি করেছে। এবং সঠিক পাঠ্যও; আমি রোদে শিশুর মুখ সম্পর্কে নিশ্চিত নই, মন।

পরবর্তীতে, আমি একটি জন্মদিনের কার্ডের জন্য গিয়েছিলাম। এইবার, DALL-E প্রম্পট না করেই "শুভ জন্মদিন" যোগ করেছে, যা থিম অনুযায়ী ঠিক আছে। তাই, আমি কার্ডে জন্মদিনের তারিখ যোগ করতে বলেছি। আবার, এটি কার্ডে তারিখ যোগ করতে ব্যর্থ হয়েছে, কিন্তু কয়েক রাউন্ড প্রম্পট করার পরে, এটি অনুরোধ করা তারিখ সমন্বিত একটি নতুন চিত্র তৈরি করেছে। এই ক্ষেত্রে, তারিখ যোগ করা সহজ হত, বিশেষ করে যদি আমি আসল ছবিটি রাখতে চাই।


DALL-E-এর সম্পাদনা সরঞ্জামগুলি দরকারী, তবে কাজ করা দরকার (এবং একটু জেদ)

আমি দেখেছি যে DALL-E-এর সম্পাদনা সরঞ্জামগুলি নির্দিষ্ট কাজের জন্য উপযোগী, তবে সম্পাদনাটি সঠিক হতে কিছুটা সময় লাগে। অন্য সময়ে, এটি কাজ করবে না, এবং আপনি সম্ভবত আপনার আসল প্রম্পট গ্রহণ করা এবং একটি নতুন চিত্র তৈরি করতে এটি টুইক করা ভাল।

DALL-E-এর সম্পাদনা সরঞ্জামগুলি সম্ভবত সময়ের সাথে উন্নত হবে, কিন্তু ততক্ষণ পর্যন্ত, আপনি DALL-E-এর সাথে একাধিক সময় ব্যয়কারী রাউন্ডের কথোপকথনের মধ্য দিয়ে যাওয়ার পরিবর্তে একটি চিত্র সম্পাদনা সরঞ্জাম দিয়ে আপনার ছবি সম্পাদনা করা ভাল হতে পারে। যখন এটি কাজ করে, এটি ভাল; যখন এটি বোঝে না বা সম্পাদনা করে না, তখন এটি হতাশাজনক।




Post a Comment

0 Comments