চ্যাটজিপিটিতে স্টুডিও ঘিবলি অঙ্কনের মতো স্টাইলের ছবির জন্য ইমেজ এডিটিং প্রম্পট

ChatGPT কীভাবে স্টুডিও ঘিবলির স্টাইলে ছবি তৈরি করে তা বুঝুন

ফেলিপ ফাউস্টিনোর অবতার
ChatGPT-তে একটি বড় আপডেটের পর, কার্যকারিতা এখন আরও উন্নত ছবি তৈরির অনুমতি দেয়। দেখুন কিভাবে এটি কাজ করে।

বোমা ফাটানোর মাঝে প্রবণতা অ্যানিমে-শৈলীর ছবিগুলো দেখে আপনি নিশ্চয়ই ভেবেছেন: কীভাবে চ্যাটজিপিটি শৈলীতে ছবি তৈরি করে স্টুডিও ঘিবলিসে আগে এটা করতে পারত না? আচ্ছা… দেখা যাচ্ছে যে নতুন জেনারেটিভ ইমেজিং ক্ষমতার OpenAI এটি সত্যিই নতুন এবং এর সাথে কোম্পানির কৃত্রিম বুদ্ধিমত্তা মডেলের কার্যপদ্ধতির একটি বড় পরিবর্তনের সরাসরি সম্পর্ক রয়েছে। এই লেখাটিতে বুঝুন, কীভাবে... চ্যাটজিপিটি শিল্পের অনুকরণ করতে সক্ষম হয়েছিল স্টুডিও ঘিবলি এবং অন্যান্য মডেলের তুলনায় প্রধান পার্থক্যগুলো।

ChatGPT কীভাবে গিবলি-শৈলীর ছবি তৈরি করে?

কিভাবে বুঝতে হবে চ্যাটজিপিটি এটিতে তৈরি করা ছবিগুলির মতো ছবি তৈরি করতে সক্ষম হয়ে উঠল প্রবণতা do স্টুডিও ঘিবলিএর দ্বারা সৃষ্ট প্রধান পরিবর্তনগুলো জানা প্রয়োজন। OpenAI মডেলে GPT-4oনিচে পড়ুন।

GPT-4 মডেলে কী পরিবর্তন আনা হয়েছে?

একজন ব্যক্তি কম্পিউটার ব্যবহার করে চ্যাটজিপিটি (chatgpt) দিয়ে ছবি তৈরি করছেন।
ছবি: রিপ্রোডাকশন/ওপেনএআই

ছবিতে তৈরি GPT-4o এটি স্থাপত্যের উপর ভিত্তি করে তৈরি। ট্রান্সফরমারযা প্যাটার্ন বিশ্লেষণ করে এবং দৃশ্যমান উপাদানের সাথে পাঠ্য বিবরণ যুক্ত করে। 'ডিফিউশন মডেল'-এর বিপরীতে, যা একটি এলোমেলো ছবি দিয়ে শুরু করে এবং ক্রমান্বয়ে সেটিকে পরিমার্জন করে, এটি GPT-4o এটি একটি অটোরেগ্রেসিভ পদ্ধতি অবলম্বন করে, যা পর্যায়ক্রমিক ধাপে চিত্রটি তৈরি করে এবং এর ফলে দৃশ্যগত সামঞ্জস্য ও কাঙ্ক্ষিত শৈলীর প্রতি বিশ্বস্ততা উন্নত হয়।

ছবির মধ্যে নির্ভুলতা ও লেখা প্রদর্শনের উন্নতি এবং বিস্তারিত নির্দেশাবলী বোঝা ও অনুসরণ করার ক্ষমতার উন্নতির ফলে, চ্যাটজিপিটি এটি একটি একক দৃশ্যে বিপুল সংখ্যক স্বতন্ত্র বস্তু পরিচালনা করার ক্ষমতা বাড়িয়েছে (পূর্বে যেখানে ৫ থেকে ৮টির তুলনায় এখন ২০টি পর্যন্ত) এবং তাদের মধ্যে সঠিক সম্পর্ক বজায় রাখতে সক্ষম।

পূর্ববর্তী মডেলগুলির তুলনায়, যেমন DALL-E3যেগুলো তারা ব্যবহার করত পাইপলাইনগুলি বিভিন্ন ধরণের মিডিয়ার জন্য পৃথক করা (ধাপ বা প্রক্রিয়ার একটি সেট), GPT-4o এটি একটি সমন্বিত পদ্ধতি গ্রহণ করে, যা দ্রুততর প্রতিক্রিয়া এবং লিখিত নির্দেশের সাথে আরও সামঞ্জস্যপূর্ণ চিত্র প্রদান করে এবং একাধিক মধ্যবর্তী প্রক্রিয়ার প্রয়োজনীয়তা দূর করে। এর মানে হলো, মডেলটি ব্যবহারকারীদের দেওয়া নির্দেশনার সূক্ষ্মতা আরও ভালোভাবে বুঝতে পারে, যা নিশ্চিত করে যে দৃশ্যমান ফলাফলটি মূল উদ্দেশ্যের সাথে আরও বেশি সঙ্গতিপূর্ণ।

এই বিপুল ক্ষমতার সাথে একটি বিতর্কিত সমস্যাও রয়েছে: অনলাইন ফ্যাশনের ব্যাপক প্রসারের কারণে গ্রাফিক প্রসেসিংয়ের চাহিদা বৃদ্ধি পাওয়ায়, OpenAI কিছু দিনের জন্য টুলটির ব্যবহারযোগ্যতা সীমিত করা প্রয়োজন হয়ে পড়েছিল, বিশেষ করে এর বিনামূল্যের ব্যবহারকারীদের জন্য। চ্যাটজিপিটিকারণ তাদের জিপিইউ কোম্পানির সিইও-র মতে, সেগুলো 'গলে যাচ্ছিল'। স্যাম অল্টম্যাননির্বাহী কর্মকর্তার ঘোষণা অনুযায়ী, এই অসুবিধা সত্ত্বেও কোম্পানিটি ইতোমধ্যে ফ্রি প্ল্যানের ব্যবহারকারীদের জন্য উন্নত ইমেজ তৈরির সক্ষমতা চালু করেছে।

আপডেটটি কীভাবে গিবলি-শৈলীর ছবিগুলো সক্ষম করে?

দুই পুরুষ এবং একটি কুকুর, বাম, ডানে একই ছবি অ্যানিমে স্টাইলে রূপান্তরিত
ছবি: ব্যক্তিগত সংগ্রহ/ব্রুনো মার্টিনেজ

কিন্তু নান্দনিকতা ধারণ করার ক্ষেত্রে এআই-এর ক্ষমতার পরিপ্রেক্ষিতে এই সবকিছুর অর্থ কী? স্টুডিও ঘিবলিদেখা যাচ্ছে যে, নতুন আপডেটের ফলে, GPT-4o এটি বিপুল পরিমাণ ছবির উদাহরণের উপর ভিত্তি করে শৈলীর ধরণ সম্পর্কে আরও ভালোভাবে ধারণা লাভ করে এবং ব্যবহারকারীর দেওয়া নির্দেশ অনুযায়ী সেই বৈশিষ্ট্যগুলো অনুকরণ করতে শেখে।

যদিও OpenAI তাদের প্রশিক্ষণ ডেটাসেটে নির্দিষ্ট শিল্পকর্ম অন্তর্ভুক্ত ছিল কিনা তা তারা স্পষ্টভাবে উল্লেখ করেনি। স্টুডিও ঘিবলি, হিসাবে হিসাবে ভাইয়াগেম ডি চিহিরোতে ou ছেলেটি এবং বক – স্টুডিও এবং জীবিত শিল্পীদের শৈলী পুনরুৎপাদনের মধ্যকার ব্যবধান পূরণ করে – স্টুডিওর নান্দনিকতা অনুকরণে মডেলটির দক্ষতা জোরালোভাবে ইঙ্গিত দেয় যে তিনি চলচ্চিত্র এবং সংশ্লিষ্ট শৈলীর অসংখ্য উদাহরণের সংস্পর্শে এসেছিলেন।

এই প্রদর্শনীর মাধ্যমে, GPT-4o শৈলীকে সংজ্ঞায়িত করে এমন প্রধান চাক্ষুষ বৈশিষ্ট্যগুলো জানুন। স্টুডিও ঘিবলিএর মধ্যে রয়েছে: হাতে আঁকা অ্যানিমেশনের অনুভূতি, যা প্রায়শই ঐতিহ্যবাহী কাগজের অ্যানিমেশনের কথা মনে করিয়ে দেয়; বিস্ময় ও প্রশান্তি জাগানো পটভূমি; বড় ও আবেগঘন চোখবিশিষ্ট অভিব্যক্তিপূর্ণ চরিত্র; প্যাস্টেল ও অনুজ্জ্বল রঙের প্রাধান্যসহ একটি কোমল ও স্বাভাবিক রঙের বিন্যাস; এবং বিশদ পরিবেশ, যেখানে প্রায়শই কল্পনা ও বাস্তবতার উপাদান মিশে যায়।

এছাড়াও, GPT-4o এটি ইনপুট হিসেবে ছবিও প্রসেস করতে পারে, যা ব্যবহারকারীদের বিদ্যমান ভিজ্যুয়ালকে রূপান্তর করতে বা নতুন কন্টেন্ট তৈরির ভিত্তি হিসেবে ব্যবহার করার সুযোগ দেয়। এইভাবে, ব্যবহারকারীরা যে শৈল্পিক স্টাইলটি পুনরায় তৈরি করতে চান তার সমস্ত বিবরণ উল্লেখ করার পাশাপাশি, নিজেদের বা যে ছবিটি তারা পুনরায় তৈরি করতে চান সেটির বর্ণনা দেওয়ারও প্রয়োজন হয় না; তারা কেবল চ্যাটে একটি ছবি প্রবেশ করান এবং এআই-কে অ্যানিমেশন স্টাইলে এটি পুনরায় তৈরি করতে বলেন – যেমনটি আপনি আমাদের এ সম্পর্কিত নিবন্ধে দেখতে পারেন। ChatGPT ব্যবহার করে কীভাবে গিবলি-স্টাইলের ছবি তৈরি করবেন, তাৎক্ষণিক পরামর্শ সহ।

অন্যান্য এআই কি স্টুডিও জিবলির শৈলী অনুকরণ করতে পারে?

নতুন ছবি তৈরি করুন ব্যবহার করে chatbots তবে এটি কোনো সাম্প্রতিক উদ্ভাবন নয়, আপডেটের মাধ্যমে অর্জিত সক্ষমতা চ্যাটজিপিটি নির্দেশনা অনুযায়ী বিবরণ বিশ্লেষণ ও পুনরুৎপাদন করলে এআই তার নিজ স্থানে ফিরে আসে। OpenAI এর প্রধান প্রতিযোগীদের থেকে এগিয়ে, যেমন মিথুনরাশি, কর গুগল, গ্রুকসেখানে XAi e কো-পাইলটসেখানে মাইক্রোসফটচিত্র তৈরির পরিপ্রেক্ষিতে।

একই ছবিকে যখন কোনো একটি শৈলী দ্বারা অনুপ্রাণিত হয়ে আঁকা ছবিতে রূপান্তরিত করা হয়, তখন তার পার্থক্য দেখুন... স্টুডিও ঘিবলি একই নির্দেশ অনুসরণ করে:

Crie uma imagem, inspirada nessa foto, com base no estilo do Studio Ghibli
প্রাকৃতিক পরিবেশে গাঢ় নীল শার্ট পরা একজন পুরুষের ছবি - বুঝুন কিভাবে চ্যাটজিপিটি স্টুডিও জিবলি-শৈলীর ছবি তৈরি করে।
চূড়ান্ত মানের পার্থক্য সুস্পষ্ট, বিশেষ করে অক্ষর ও প্রতীক তৈরির ক্ষেত্রে – ছবি: ব্যক্তিগত সংগ্রহ/ফেলিপে ফাউস্তিনো

মূল ছবির খুঁটিনাটি আরও ভালোভাবে ধারণ করার পাশাপাশি, জেনারেটিভ ইমেজিংয়ের অন্যতম সেরা অগ্রগতি হলো... GPT-4o শার্টের উপর লোগো এবং অক্ষরগুলো হুবহু ফুটিয়ে তোলার ক্ষমতাই এর প্রমাণ, যা অন্যান্য মডেলের ক্ষেত্রে একটি বড় অসুবিধা ছিল।

যখন গ্রুক এটি একভাবে শৈলীর বৈশিষ্ট্যগুলোকে পুনর্নির্মাণ করতে সক্ষম হয়। স্টুডিও ঘিবলিযদিও এটি ছবির বিশদ বিবরণে সমস্যায় ভোগে, মিথুনরাশি এটা প্রচলিত ধারার সম্পূর্ণ পরিপন্থী, যার ফলে গতানুগতিক শিল্পকর্মের সৃষ্টি হয়। এটা মনে রাখা দরকার যে... গুগল জেনারেটিভ ইমেজের আপডেটে ইতিমধ্যে বিনিয়োগ করা হচ্ছে মিথুনরাশিজটিল ছবি তৈরি এবং ছবি সম্পাদনা সক্ষম করে – এমন সরঞ্জাম যা এআই স্টুডিও ব্যবহার করে এগুলো পরীক্ষা করা যেতে পারে।। দ্য কো-পাইলটসেখানে মাইক্রোসফটপ্রম্পটটির উত্তর দিতে পারেননি।

আপনি কি প্রবেশের জন্য টুলটি ইতিমধ্যে পরীক্ষা করেছেন? স্টুডিও ঘিবলি ট্রেন্ডকমেন্টে আমাদের জানান।

খুব দেখুন

টেক্সট দ্বারা পর্যালোচনা আলেকজান্ডার মার্কেস 01/04/2025 তারিখে।

উত্স: ভারতের টাইমস, হিন্দুস্তান টাইমস, অর্থনৈতিক টাইমস


Showmetech সম্পর্কে আরও আবিষ্কার করুন

ইমেল দ্বারা আমাদের সর্বশেষ খবর পেতে সাইন আপ করুন.

সম্পর্কিত পোস্ট
এনভিডিয়া আরটিএক্স স্পার্ক কি উইন্ডোজ পিসির জন্য 'অ্যাপল সিলিকন মুহূর্ত' হতে পারে?

এনভিডিয়া আরটিএক্স স্পার্ক কি উইন্ডোজ পিসিগুলোর জন্য 'অ্যাপল সিলিকন মুহূর্ত' হতে পারে?

এআরএম সিপিইউ, ব্ল্যাকওয়েল জিপিইউ এবং ১২৮ জিবি পর্যন্ত ইউনিফাইড মেমোরির সাহায্যে আরটিএক্স স্পার্ক উইন্ডোজ পিসিগুলোকে ম্যাকের মতো সমন্বিত স্তরে নিয়ে আসার চেষ্টা করে।
ব্রুনো মার্টিনেজ অবতার
আরও পড়ুন
ব্রাজিলিয়ান রিয়ালের নোট ও মুদ্রা দ্বারা পরিবেষ্টিত ইনস্টাগ্রাম লোগোযুক্ত একটি মোবাইল ফোন, যা ইনস্টাগ্রাম প্লাস-এর পেইড সাবস্ক্রিপশনকে নির্দেশ করে।

ব্রাজিলে ১০ রেইস-এ ইনস্টাগ্রাম প্লাস এসেছে; সাবস্ক্রিপশনের ফিচারগুলো দেখুন।

ব্রাজিলে মাসিক R$10 মূল্যে ইনস্টাগ্রাম প্লাস চালু হয়েছে, যাতে রয়েছে ৪৮-ঘণ্টার স্টোরি, সুপার লাইক, আরও বেশি লিস্ট এবং প্রোফাইলের অতিরিক্ত ফিচার।
ব্রুনো মার্টিনেজ অবতার
আরও পড়ুন
পারানায় তোলা ইউএফও-র বিশেষ ছবি, যেখানে আকাশে একটি আলো দেখা যাচ্ছে এবং এর উজ্জ্বল বিন্দুটিকে বিশেষভাবে তুলে ধরা হয়েছে।

পারানায় ইউএফও: ঘটনাটি বুঝুন এবং আকাশে দেখা আলোর সম্ভাব্য ব্যাখ্যা কী হতে পারে।

পারানার ইউএফও সংক্রান্ত প্রতিবেদনগুলো, ব্রাজিলীয় বিমান বাহিনী ও ডিইসিইএ (আকাশসীমা নিয়ন্ত্রণ বিভাগ) কী বলছে, এবং ক্যাম্পো লার্গো ও পন্টালের আলোগুলোর কেন পার্থিব ব্যাখ্যা থাকতে পারে, তা বুঝুন।
ব্রুনো মার্টিনেজ অবতার
আরও পড়ুন