ওমনিহিউম্যান-১: টিকটকের মালিক এমন একটি এআই চালু করেছেন যা একটিমাত্র ছবি থেকে মানুষের মতো ভিডিও তৈরি করে। ছবি: রিপ্রোডাকশন / ওমনিহিউম্যান-১।

OmniHuman-1: TikTok মালিক AI চালু করেছেন যা একটি মাত্র ছবি থেকে মানুষের ভিডিও তৈরি করে

আলেকজান্ডার মার্কেসের অবতার
টিকটকের মালিক কোম্পানি বাইটড্যান্স, হিউম্যান অ্যানিমেশন মডেলের জন্য একটি নতুন এআই উন্মোচন করেছে। জানুন কীভাবে এবং কেন এই টুলটি বৈপ্লবিক হতে পারে।

A বাইট্যান্স, এর মালিক টিক টক, সম্প্রতি উপস্থাপন করেছেন ওমনিহিউম্যান-১একটি নতুন কৃত্রিম বুদ্ধিমত্তা (এআই) যা একটিমাত্র ছবি থেকে অত্যন্ত বাস্তবসম্মত ও মানুষের মতো ভিডিও তৈরি করে। এই ভিডিওগুলো তৈরি করতে অডিওর মতো দুর্বল সংকেত ব্যবহার করার জন্য এই টুলটি বিশেষভাবে উল্লেখযোগ্য, যা প্রচলিত ডিজিটাল কন্টেন্ট তৈরির পদ্ধতিতে একটি নতুন মানদণ্ড স্থাপন করেছে। এই নতুন ফিচারটি সম্পর্কে সবকিছু জেনে নিন:

ওমনিহিউম্যান-১ কীভাবে কাজ করে

কম্পিউটিং ও কৃত্রিম বুদ্ধিমত্তার পথিকৃৎ অ্যালান ট্যুরিং-এর একটি ঐতিহাসিক ছবি।
ওমনিহিউম্যান-১ সমন্বিত একটি নতুন ভিডিও তৈরি করতে ব্যবহৃত অ্যালবার্ট আইনস্টাইনের স্থিরচিত্র। ছবি: পুনরুৎপাদন / ওমনিহিউম্যান-১।

O ওমনিহিউম্যান-১ এটি একটি উদ্ভাবনী মাল্টিমোডাল হিউম্যান-কন্ডিশন্ড ভিডিও জেনারেশন ফ্রেমওয়ার্ক ব্যবহার করে, যা একটিমাত্র মানুষের ছবি এবং অডিও ও ভিডিওর মতো মোশন সিগন্যাল থেকে অত্যন্ত বাস্তবসম্মত ভিডিও তৈরি করতে সক্ষম। এর আর্কিটেকচারে একটি মিশ্র প্রশিক্ষণ কৌশল অন্তর্ভুক্ত রয়েছে, যা মডেলটিকে বিভিন্ন উৎস থেকে প্রাপ্ত নানান ধরনের ডেটা থেকে শিখতে সাহায্য করে। এটি পূর্ববর্তী মডেলগুলোর সম্মুখীন হওয়া সেই সমস্যার সমাধান করে, যেগুলো প্রায়শই উচ্চ-মানের প্রশিক্ষণ ডেটার অভাবে অসুবিধায় পড়ত।

টুলটি বিভিন্ন অ্যাস্পেক্ট রেশিওতে ইমেজ ইনপুট সমর্থন করে, যেমন ছবি, অর্ধ-শরীরের ছবি e পুরো শরীরবিভিন্ন প্রেক্ষাপট ও পরিস্থিতিতে বাস্তবসম্মত ভিডিও তৈরি করার জন্য এই বৈশিষ্ট্যটি অপরিহার্য। তাছাড়া, ওমনিহিউম্যান-১ খুঁটিনাটি বিষয়ের প্রতি বিশ্বস্ততা বজায় রাখতে সক্ষম হয়, যেমন আন্দোলন, আলো e জমিনফলাফলটি যেন বিশ্বাসযোগ্য ও স্বাভাবিক হয় তা নিশ্চিত করা।

আরেকটি গুরুত্বপূর্ণ দিক হল ওমনিহিউম্যান-১ বিভিন্ন ধরনের দৃশ্য ও শ্রাব্য শৈলী সামলানোর ক্ষমতাই এর মূল বৈশিষ্ট্য। এটি শুধুমাত্র অডিওর মতো দুর্বল সংকেত থেকেও ভিডিও তৈরি করতে পারে, অথবা আরও সুনির্দিষ্ট গতির নির্দেশনার জন্য অডিও ও ভিডিও একত্রিত করতে পারে। এই বহুমুখিতা টুলটিকে মিডিয়া এবং বিনোদনমূলক অ্যাপ্লিকেশনের জন্য আদর্শ করে তোলে, যেখানে কাস্টমাইজেশন এবং গুণমান অপরিহার্য। ওমনিহিউম্যান-১সুতরাং, এটি ডিজিটাল কন্টেন্ট তৈরির ক্ষেত্রে একটি অগ্রগতি, যা ইন্টারেক্টিভ এবং ব্যক্তিগতকৃত ভিডিও তৈরির নতুন সম্ভাবনা উন্মোচন করে।

এরপরে, আসুন প্রতিটি দিক আরও ঘনিষ্ঠভাবে দেখি যা তৈরি করে ওমনিহিউম্যান-১ একটি বৈপ্লবিক ভিডিও-তৈরি করার এআই।

যেকোনো শারীরিক আকার ও আকৃতির জন্য উপযুক্ত।

শোমিটেক-এ প্রদর্শিত হচ্ছে সর্বমানবীয় এআই প্রযুক্তি সম্পন্ন সুপারকম্পিউটার।
যে ভিডিওটিকে অনেকেই এনভিডিয়ার প্রতি উপহাস বলে মনে করেছেন, সেটিতে ওমনিহিউম্যান-১ জেনসেন হুয়াং-এর একটি ছবি ব্যবহার করে ভিডিওটি তৈরি করেন। ছবি: পুনরুৎপাদন / ওমনিহিউম্যান-১।

পোর্ট্রেট, হাফ-বডি বা ফুল-বডি, যেকোনো অ্যাস্পেক্ট রেশিওর ইমেজ ইনপুট সাপোর্ট করা এর অন্যতম প্রধান শক্তি... ওমনিহিউম্যান-১। এর মানে হলো, এই টুলটি প্রদত্ত ইমেজ ফরম্যাট নির্বিশেষে বাস্তবসম্মত ভিডিও তৈরি করতে পারে, যা পূর্ববর্তী অনেক প্রযুক্তি একই নির্ভুলতার সাথে করতে পারত না। এই নমনীয়তার কারণে টুলটি বিভিন্ন প্রেক্ষাপটে প্রয়োগ করা যায়, যেমন... ব্যক্তিগত ভিডিও e পেশাদার ate শৈল্পিক প্রযোজনা e বিজ্ঞাপনসকল ক্ষেত্রে ধারাবাহিক ও উচ্চমানের ফলাফল নিশ্চিত করে।

এছাড়াও, আরও স্বাভাবিক এবং ব্যক্তিগত ভিডিও তৈরির জন্য বিভিন্ন শারীরিক গড়নের জন্য সমর্থন থাকা অপরিহার্য। ওমনিহিউম্যান-১ এটি শুধু ছবির অ্যাস্পেক্ট রেশিওর সাথেই খাপ খায় না, বরং বিষয়বস্তুর নড়াচড়া এবং শারীরিক বৈশিষ্ট্যের বিশ্বস্ততাও বজায় রাখে। এটি বিশেষত মিডিয়া এবং বিনোদনের মতো ক্ষেত্রে উপযোগী, যেখানে দর্শকদের আকৃষ্ট ও মুগ্ধ করার জন্য প্রামাণিকতা এবং বাস্তবতা অপরিহার্য।

অডিও বিকল্প, ভঙ্গি এবং চিত্র রেফারেন্স।

এর ক্ষমতা ওমনিহিউম্যান-১ অডিও এবং ভিডিওর মতো বিভিন্ন ধরণের সিগন্যাল ইনপুটের সাথে কাজ করার ক্ষমতা এআই-কে শুধুমাত্র একটি অডিও সিগন্যাল ব্যবহার করে বাস্তবসম্মত ও মানুষের মতো ভিডিও তৈরি করতে, অথবা আরও নির্ভুল ও স্বাভাবিক ফলাফলের জন্য অডিও এবং ভিডিওকে একত্রিত করতে সাহায্য করে। এই বৈশিষ্ট্যটি... ওমনিহিউম্যান-১ বিভিন্ন তথ্যসূত্রের উপর ভিত্তি করে ভিডিও তৈরি করুন এবং নানা শিল্পে সেগুলোর সম্ভাব্য প্রয়োগক্ষেত্র প্রসারিত করুন।

উদাহরণস্বরূপ, অডিও বিকল্পগুলি ছাড়াও, ওমনিহিউম্যান-১ এটি বিভিন্ন ধরনের ভঙ্গি এবং ছবির রেফারেন্স সামলানোর ক্ষমতাও প্রদর্শন করে। এর মানে হলো, ইনপুট ছবিতে বিষয়বস্তুর অবস্থান বা ভঙ্গি যাই হোক না কেন, এই টুলটি এমন একটি ভিডিও তৈরি করতে পারে যা নড়াচড়ার স্বাভাবিকতা এবং সাবলীলতা বজায় রাখে। এই বহুমুখিতা পূর্ববর্তী প্রযুক্তিগুলোর তুলনায় একটি অগ্রগতি, যেগুলো প্রায়শই জটিল বা অস্বাভাবিক ভঙ্গি নিয়ে সমস্যার সম্মুখীন হতো।

বিভিন্ন ভিজ্যুয়াল শৈলীর ভিডিও

শিরোনাম: নীল আকাশ ও মেঘের পটভূমিতে বাইরে গিটার বাজাচ্ছেন এক যুবক।
ওমনিহিউম্যান-১ চরম বাস্তববাদ থেকে শুরু করে আরও শৈল্পিক উপস্থাপনা পর্যন্ত বিভিন্ন ভিজ্যুয়াল শৈলীতে ভিডিও তৈরি করতে সক্ষম। ছবি: পুনরুৎপাদন / ওমনিহিউম্যান-১।

O ওমনিহিউম্যান-১ এটি বিভিন্ন ভিজ্যুয়াল স্টাইলের ভিডিও তৈরি করতে পারে, যা এটিকে কন্টেন্ট ক্রিয়েটরদের জন্য একটি অত্যন্ত বহুমুখী টুলে পরিণত করে। এটি চরম বাস্তববাদ থেকে শুরু করে আরও শৈল্পিক উপস্থাপনা পর্যন্ত বিভিন্ন ধরনের স্টাইলের সাথে নিজেকে মানিয়ে নিতে পারে, যা নিশ্চিত করে যে ফলাফলটি ব্যবহারকারীর নির্দিষ্ট চাহিদা এবং পছন্দ পূরণ করে। বিভিন্ন ভিজ্যুয়াল স্টাইলের ভিডিও তৈরি করার এই ক্ষমতা [সফটওয়্যার/টুলটির] অত্যাধুনিক প্রশিক্ষণ কৌশলের কল্যাণে সম্ভব হয়েছে। ওমনিহিউম্যান-১যা মডেলটিকে বিভিন্ন ধরনের ভিজ্যুয়াল ডেটা থেকে শিখতে সাহায্য করে।

মানুষ ও বস্তুর মধ্যে মিথস্ক্রিয়া

আরেকটি উদ্ভাবনী বৈশিষ্ট্য ওমনিহিউম্যান-১ মানুষ ও বস্তুর মধ্যকার মিথস্ক্রিয়াকে বাস্তবসম্মত ও স্বাভাবিকভাবে উপস্থাপন করার ক্ষমতার ফলে, এই টুলটি এমন ভিডিও তৈরি করতে পারে যেখানে বিষয়বস্তু তার পারিপার্শ্বিক বিভিন্ন বস্তুর সাথে মিথস্ক্রিয়া করে এবং একই সাথে নড়াচড়ার সামঞ্জস্য ও খুঁটিনাটি বিবরণের বিশ্বস্ততা বজায় রাখে। অগমেন্টেড ও ভার্চুয়াল রিয়েলিটির মতো ক্ষেত্রগুলিতে এই কার্যকারিতা অপরিহার্য, যেখানে ব্যবহারকারীর নিমজ্জনের জন্য পরিবেশের সাথে বাস্তবসম্মত মিথস্ক্রিয়া অত্যন্ত গুরুত্বপূর্ণ।

মানুষ ও বস্তুর মধ্যকার মিথস্ক্রিয়াকে নির্ভুলভাবে উপস্থাপন করা অনেক ভিডিও নির্মাণ প্রযুক্তির জন্য একটি উল্লেখযোগ্য চ্যালেঞ্জ, কিন্তু ওমনিহিউম্যান-১ এর উন্নত প্রশিক্ষণ কৌশল এবং উচ্চ-মানের ডেটা ব্যবহারের ফলে এটি সেটিকে ছাড়িয়ে যেতে সক্ষম হয়।

এআই প্রাপ্যতা

কৃত্রিম বুদ্ধিমত্তার সৃষ্টি - সর্বমানব, উন্নত প্রযুক্তি, উদ্ভাবন এবং ডিজিটাল জগতের ভবিষ্যৎ।
বাইটড্যান্স এখনও পরিষেবা বা ডাউনলোডের মাধ্যমে OmniHuman-1-কে সর্বসাধারণের ব্যবহারের জন্য উপলব্ধ করেনি। ছবি: পুনরুৎপাদন / OmniHuman-1।

ইতিমধ্যে উপস্থাপন করা সত্ত্বেও ওমনিহিউম্যান-১, একটি বাইট্যান্স টুলটি এখনও পরিষেবা বা ডাউনলোডের মাধ্যমে জনসাধারণের ব্যবহারের জন্য উপলব্ধ করা হয়নি। তবে, শোমেটেক আমরা সতর্ক থাকব এবং এআই ব্যবহারের জন্য উপলব্ধ হওয়া মাত্রই আমাদের পাঠকদের কাছে সমস্ত প্রয়োজনীয় তথ্য পৌঁছে দেব।

এআই ভিডিও তৈরির জগতে এই নতুন অগ্রগতিটি আপনার কেমন লেগেছে? কমেন্টে আমাদের জানান! মন্তব্য নিচে!

খুব দেখুন:

উত্স: GitHub, মার্কটেক e ইনস্টাগ্রাম.

দ্বারা পর্যালোচনা গ্যাব্রিয়েল প্রিন্সেভাল 05/02/202 এ5


Showmetech সম্পর্কে আরও আবিষ্কার করুন

ইমেল দ্বারা আমাদের সর্বশেষ খবর পেতে সাইন আপ করুন.

সম্পর্কিত পোস্ট
এনভিডিয়া আরটিএক্স স্পার্ক কি উইন্ডোজ পিসির জন্য 'অ্যাপল সিলিকন মুহূর্ত' হতে পারে?

এনভিডিয়া আরটিএক্স স্পার্ক কি উইন্ডোজ পিসিগুলোর জন্য 'অ্যাপল সিলিকন মুহূর্ত' হতে পারে?

এআরএম সিপিইউ, ব্ল্যাকওয়েল জিপিইউ এবং ১২৮ জিবি পর্যন্ত ইউনিফাইড মেমোরির সাহায্যে আরটিএক্স স্পার্ক উইন্ডোজ পিসিগুলোকে ম্যাকের মতো সমন্বিত স্তরে নিয়ে আসার চেষ্টা করে।
ব্রুনো মার্টিনেজ অবতার
আরও পড়ুন
ব্রাজিলিয়ান রিয়ালের নোট ও মুদ্রা দ্বারা পরিবেষ্টিত ইনস্টাগ্রাম লোগোযুক্ত একটি মোবাইল ফোন, যা ইনস্টাগ্রাম প্লাস-এর পেইড সাবস্ক্রিপশনকে নির্দেশ করে।

ব্রাজিলে ১০ রেইস-এ ইনস্টাগ্রাম প্লাস এসেছে; সাবস্ক্রিপশনের ফিচারগুলো দেখুন।

ব্রাজিলে মাসিক R$10 মূল্যে ইনস্টাগ্রাম প্লাস চালু হয়েছে, যাতে রয়েছে ৪৮-ঘণ্টার স্টোরি, সুপার লাইক, আরও বেশি লিস্ট এবং প্রোফাইলের অতিরিক্ত ফিচার।
ব্রুনো মার্টিনেজ অবতার
আরও পড়ুন
পারানায় তোলা ইউএফও-র বিশেষ ছবি, যেখানে আকাশে একটি আলো দেখা যাচ্ছে এবং এর উজ্জ্বল বিন্দুটিকে বিশেষভাবে তুলে ধরা হয়েছে।

পারানায় ইউএফও: ঘটনাটি বুঝুন এবং আকাশে দেখা আলোর সম্ভাব্য ব্যাখ্যা কী হতে পারে।

পারানার ইউএফও সংক্রান্ত প্রতিবেদনগুলো, ব্রাজিলীয় বিমান বাহিনী ও ডিইসিইএ (আকাশসীমা নিয়ন্ত্রণ বিভাগ) কী বলছে, এবং ক্যাম্পো লার্গো ও পন্টালের আলোগুলোর কেন পার্থিব ব্যাখ্যা থাকতে পারে, তা বুঝুন।
ব্রুনো মার্টিনেজ অবতার
আরও পড়ুন