অন্যান্য উপাদানসহ একটি পটভূমিতে এলএলএম-এর ছবি।

এলএলএম-এর ভিতরে: চ্যাটজিপিটি কীভাবে চিন্তা করে

লুইস আন্তোনিও কস্তার অবতার
এলএলএম কী এবং কীভাবে কাজ করে তা বুঝুন—চ্যাটজিপিটি-র মতো এআই এজেন্টদের পেছনের মূল চালিকাশক্তি।

যাকেই জিজ্ঞাসা করা হোক কিভাবে চ্যাটজিপিটিআজকের সবচেয়ে জনপ্রিয় এআই এজেন্টটি যদি কাজ করে, তবে অনেকের মুখেই উত্তরটি ভেসে উঠবে: কৃত্রিম বুদ্ধিমত্তা। কিন্তু সেই উত্তরটি খুবই অস্পষ্ট। বর্তমানে কম্পিউটার বিজ্ঞানের সবচেয়ে বেশি গবেষণা ও উন্নয়ন হওয়া ক্ষেত্রগুলোর মধ্যে একটি হওয়া সত্ত্বেও, কৃত্রিম বুদ্ধিমত্তা বেশ কয়েকটি বৈজ্ঞানিক বিষয়কে অন্তর্ভুক্ত করে।

এগুলোর মধ্যে একটি হলো চ্যাটজিপিটি (ChatGPT) এবং ওয়েবে উপলব্ধ অধিকাংশ এআই এজেন্টের কার্যকারিতার পেছনের মূল চাবিকাঠি: এলএলএম (LLM)। এই প্রবন্ধে আমরা বিস্তারিতভাবে আলোচনা করব, কীভাবে এই ধারণাটি কৃত্রিম বুদ্ধিমত্তা এবং আমাদের বিশ্বে বৈপ্লবিক পরিবর্তন এনেছে।

বৃহৎ ভাষা মডেল (LLM) বলতে কী বোঝায়?

বড় ভাষার মডেল (পর্তুগিজ ভাষায় এলএলএম বা লার্জ ল্যাঙ্গুয়েজ মডেল) হলো অ্যালগরিদম গভীর জ্ঞানার্জন (ডিপ লার্নিং, পর্তুগিজ ভাষায়) বিভিন্ন ধরনের কাজ সম্পাদনে সক্ষম স্বাভাবিক ভাষা প্রক্রিয়াকরণ (পর্তুগিজ ভাষায় ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং)। উফ, কত যে সংক্ষিপ্ত রূপ, তাই না?

এলএলএম ট্রান্সফরমার মডেল ব্যবহার করে এবং বিশাল ডেটাসেট দিয়ে এগুলোকে প্রশিক্ষণ দেওয়া হয়। কিছু জনপ্রিয় ডেটাসেটের উদাহরণ হলো: LAION-2B-en, সিসিএডব্লিউ e উইকিটেক্সট-১০৩একটি ট্রান্সফরমার মডেলকে এমন একটি রোবট বলে মনে হতে পারে যা গাড়িতে রূপান্তরিত হয়, কিন্তু কৃত্রিম বুদ্ধিমত্তার (AI) ক্ষেত্রে এটি একটি এলএলএম (ল্যাবরেটরি ফ্রেমওয়ার্ক ফর লার্নিং)-এর সবচেয়ে প্রচলিত স্থাপত্যের প্রতিনিধিত্ব করে।

ট্রান্সফর্মারটি গঠিত হয় একটি এনকোডার (পর্তুগিজ ভাষায় এনকোডার) এবং একটি ডিকোডার (পর্তুগিজ ভাষায় ডিকোডার)। মূলত, এনকোডারের কাজ হলো একটি বাক্য বা লেখার শব্দগুলোকে টোকেন নামক ছোট ছোট অংশে বিভক্ত করা, এবং ডিকোডার এই টোকেনগুলোর মধ্যে সম্পর্ক শনাক্ত করার জন্য গাণিতিক প্রক্রিয়া সম্পাদন করে।

সরলীকৃত ট্রান্সফরমার স্থাপত্য
ট্রান্সফরমার আর্কিটেকচারটি এনকোডারে শব্দ ও বাক্যাংশ এনকোড করে এবং এলএলএম-এর ব্যবহারের জন্য ডিকোডারের সাহায্যে সেগুলোকে ডিকোড করে। (ছবি: শোমিটেক)

ট্রান্সফর্মার এবং বহু বছর আগে ব্যবহৃত আর্কিটেকচার, এলএসটিএম (এর মধ্যে বড় পার্থক্য হলোদীর্ঘ স্বল্পমেয়াদী স্মৃতিট্রান্সফর্মারদের (বা দীর্ঘমেয়াদী স্মৃতি এবং স্বল্পমেয়াদী স্মৃতিকে) যা অনন্য করে তোলে তা হলো, এরা স্ব-মনোযোগ পদ্ধতির মাধ্যমে কাজ করে, যার অর্থ হলো, পূর্বাভাস তৈরি করার জন্য এরা একটি বাক্যের অংশবিশেষ বা এমনকি তার প্রেক্ষাপট বিবেচনা করে দ্রুত শিখতে সক্ষম।

ল্যাঙ্গুয়েজ লার্নিং মডিউল (এলএলএম) হলো বহুমুখী এআই সিস্টেম, যা মানুষের ভাষা প্রক্রিয়াকরণ ছাড়াও প্রোটিন কাঠামো বিশ্লেষণ এবং প্রোগ্রামিং কোড তৈরির মতো অন্যান্য কাজও করতে পারে। দক্ষতার সাথে কাজ করার জন্য, টেক্সট ক্লাসিফিকেশন, সারসংক্ষেপ তৈরি এবং প্রশ্নোত্তরের মতো ফাংশনগুলো সামলানোর জন্য এলএলএম-এর পূর্ব-প্রশিক্ষণ এবং সতর্ক সমন্বয়ের প্রয়োজন হয়, যা এগুলিকে স্বাস্থ্যসেবা, অর্থায়ন এবং বিনোদনের মতো ক্ষেত্রগুলির জন্য মূল্যবান করে তোলে।

মূল উপাদান

এলএলএম একাধিক নিউরাল নেটওয়ার্ক স্তর দ্বারা গঠিত। একটি নিউরাল নেটওয়ার্কে (নিউরাল নেটওয়ার্কমূলত, একটি ভেরিয়েবলকে ইনপুট হিসেবে ব্যবহার করা হয়, যা এক বা একাধিক লেয়ার দ্বারা বিভিন্ন ওয়েট ও গাণিতিক সমীকরণের মাধ্যমে প্রক্রিয়াজাত হয়ে একটি আউটপুট মান তৈরি হয়।

এলএলএম-এ উপস্থিত প্রথম ধরণের নিউরাল নেটওয়ার্ক হলো এমবেডিং লেয়ার (এম্বেডিং স্তরএটি এমবেডিং প্রক্রিয়ার জন্য দায়ী, যা ইনপুটের শব্দার্থ এবং বাক্যগঠনগত অর্থ ধারণ করে, যাতে মডেলটি প্রসঙ্গটি বুঝতে পারে।

এরপরে রয়েছে ফিডফরোয়ার্ড নেটওয়ার্ক (FFN) লেয়ার, যা একাধিক আন্তঃসংযুক্ত লেয়ার দ্বারা গঠিত এবং এম্বেডিং ইনপুটগুলোকে রূপান্তরিত করে। এই প্রক্রিয়ায়, এই লেয়ারগুলো মডেলকে উচ্চ-স্তরের অ্যাবস্ট্রাকশন সংগ্রহ করতে, অর্থাৎ টেক্সট ইনপুটের মাধ্যমে ব্যবহারকারীর উদ্দেশ্য বুঝতে সাহায্য করে।

এলএলএম-এর মূল উপাদানগুলো বর্ণনা করা হলো
একটি নিউরাল নেটওয়ার্ক, এমবেডিং লেয়ার এবং ফিডফরোয়ার্ড নেটওয়ার্ক হলো একটি এলএলএম (LLM)-এর কার্যক্রমের মূল উপাদান। (ছবি: শোমিটেক)

এরপরে রয়েছে রিকারেন্ট লেয়ার, যা ইনপুট টেক্সটের শব্দগুলোকে ক্রমানুসারে ব্যাখ্যা করে। একটি বাক্যের শব্দগুলোর মধ্যকার সম্পর্ক নির্ণয় করাই এর কাজ।

সবশেষে, রয়েছে অ্যাটেনশন মেকানিজম, যা LLM-কে ইনপুট টেক্সটের সেইসব অনন্য অংশের উপর মনোযোগ কেন্দ্রীভূত করতে সাহায্য করে, যেগুলো নির্ধারিত কাজের সাথে প্রাসঙ্গিক। এই লেয়ারটি মডেলকে সবচেয়ে উপযুক্ত এবং নির্ভুল আউটপুট তৈরি করতে সক্ষম করে।

তারা কিভাবে কাজ করে

এখন যেহেতু আমরা জানি এলএলএম কী এবং এর মূল উপাদানগুলো কী, আমরা এর কার্যপ্রণালী আরও স্পষ্টভাবে বুঝতে পারব। মূলত, ট্রান্সফরমার-ভিত্তিক এলএলএম একটি ইনপুট গ্রহণ করে, সেটিকে এনকোড করে এবং তারপর একটি পূর্বাভাসিত আউটপুট তৈরি করার জন্য সেটিকে ডিকোড করে। তবে, একটি এলএলএম টেক্সট ইনপুট গ্রহণ করে পূর্বাভাসিত আউটপুট তৈরি করার আগে, সাধারণ কাজগুলো করার জন্য এর ট্রেনিং এবং নির্দিষ্ট কাজগুলো করতে সক্ষম করার জন্য ফাইন-টিউনিং প্রয়োজন হয়।

প্রাক-প্রশিক্ষণ (প্রাক-প্রশিক্ষণ(ইংরেজিতে) হলো এই ক্ষেত্রের একটি চিরায়ত প্রক্রিয়া। মেশিন লার্নিং (মেশিন লার্নিংকৃত্রিম বুদ্ধিমত্তার ক্ষেত্রে। এই প্রক্রিয়াটিতে, নাম থেকেই বোঝা যায়, বিভিন্ন ওয়েবসাইট থেকে সংগৃহীত ট্রিলিয়ন ট্রিলিয়ন শব্দের বিশাল টেক্সচুয়াল ডেটাসেট ব্যবহার করে এলএলএম-দের প্রি-ট্রেনিং করানো হয়, যেমন— উইকিপিডিয়া, GitHub...অন্যান্য আরও অনেক কিছুর মধ্যে। সর্বোপরি, এলএলএম-কে তো কোথাও থেকে শিখতে হয়, ঠিক একটা ছোট বাচ্চার মতো, তাই না?

এই পর্যায়ে, এলএলএম যা করে তা হলো তত্ত্বাবধানবিহীন শিখন (অশিক্ষিত শিক্ষা(ইংরেজিতে) – এমন একটি প্রক্রিয়া যেখানে ডেটাসেটগুলো কোনো নির্দিষ্ট নির্দেশনা ছাড়াই কেবল পড়া হয়। অর্থাৎ, কোনো “প্রশিক্ষক” ছাড়াই, LLM-এর নিজস্ব AI অ্যালগরিদম প্রতিটি শব্দের অর্থ এবং তাদের মধ্যকার সম্পর্ক শেখার দায়িত্বে থাকে। এছাড়াও, LLM প্রসঙ্গের উপর ভিত্তি করে শব্দগুলোর মধ্যে পার্থক্য করতেও শেখে। উদাহরণস্বরূপ, এটি বুঝতে শেখে যে “right” বলতে “correct” বোঝায়, নাকি এটি কেবল “left-এর বিপরীত”।

সূক্ষ্ম সমন্বয় প্রক্রিয়া (ফাইন টিউনিংপ্রম্পট অ্যাডজাস্টমেন্ট (ইংরেজিতে) হলো এলএলএম-কে নির্দিষ্ট কাজ, যেমন টেক্সট অনুবাদ, দক্ষতার সাথে সম্পাদনের জন্য "টিউন" করার একটি প্রক্রিয়া, যা এর পারফরম্যান্সকে অপ্টিমাইজ করে। প্রম্পট অ্যাডজাস্টমেন্ট (এলএলএম-কে দেওয়া প্রশ্ন ও নির্দেশাবলী) এক ধরনের ফাইন-টিউনিং হিসেবে কাজ করে, কারণ এটি মডেলটিকে একটি নির্দিষ্ট কাজ সম্পাদনের জন্য প্রশিক্ষণ দিতে সক্ষম।

মেশিন লার্নিং মডেল: প্রি-ট্রেনিং, আনসুপারভাইজড লার্নিং এবং ফাইন-টিউনিং।
এলএলএম করার প্রক্রিয়াটি তিনটি প্রধান ধাপ নিয়ে গঠিত: প্রি-ট্রেনিং, আনসুপারভাইজড লার্নিং এবং ফাইন টিউনিং। (ছবি: শোমিটেক)

একটি বৃহৎ আকারের ভাষা মডেলকে অনুবাদের মতো কোনো নির্দিষ্ট কাজ সম্পাদন করতে হলে, সেটিকে অবশ্যই সেই নির্দিষ্ট কার্যকলাপের জন্য সূক্ষ্মভাবে সমন্বয় করতে হয়। সূক্ষ্ম সমন্বয়ের মাধ্যমে নির্দিষ্ট কাজের জন্য কর্মক্ষমতা সর্বোত্তম করা হয়।

প্রম্পট টিউনিং ফাইন-টিউনিং-এর মতোই একটি কাজ করে, যেখানে অল্প-ট্রায়াল বা জিরো-ট্রায়াল প্রম্পট ব্যবহার করে একটি মডেলকে কোনো নির্দিষ্ট কাজ করার জন্য প্রশিক্ষণ দেওয়া হয়। নিচে অল্প-ট্রায়াল প্রম্পট ব্যবহার করে একটি 'সেন্টিমেন্ট অ্যানালাইসিস' অনুশীলনের উদাহরণ দেওয়া হলো:

Texto de entrada: Essa casa é linda!
Sentimento da frase: Positivo

Texto de entrada: Essa casa é horrível!
Sentimento da frase: Negativo

এই উদাহরণে প্রাপ্ত ফলাফলের ভিত্তিতে, 'ভয়াবহ' শব্দটির অর্থগত তাৎপর্য এবং একটি বিপরীত উদাহরণ প্রদান করার কারণে, এলএলএম বুঝতে পারবে যে দ্বিতীয় উদাহরণে ব্যবহারকারীর অনুভূতি 'নেতিবাচক'।

ব্যবহারের ক্ষেত্র

যেমনটি আমরা আগে উল্লেখ করেছি, এলএলএম বিভিন্ন উদ্দেশ্যে ব্যবহার করা যেতে পারে:

  • তথ্য পুনরুদ্ধার: এক্ষেত্রে, আমরা গুগল বা বিং-এর মতো ওয়েব সার্চ ইঞ্জিনগুলিতে এর ব্যবহারের কথা ভাবতে পারি। যখন কোনো ব্যবহারকারী এই পরিষেবাগুলির সার্চ ফাংশন ব্যবহার করেন, তখন তাঁরা তাঁদের অনুরোধের প্রতিক্রিয়া হিসাবে তথ্য তৈরি করার জন্য এলএলএম (LLM) ব্যবহার করেন। এলএলএম তথ্য পুনরুদ্ধার করতে, সেটিকে সংক্ষিপ্ত করতে এবং ব্যবহারকারীর সাথে কথোপকথনের আকারে প্রতিক্রিয়াটি জানাতে সক্ষম।
  • টেক্সট জেনারেশন এবং প্রোগ্রামিং কোডএলএলএম (LLM) হলো জেনারেটিভ এআই (Generative AI), যেমন চ্যাটজিপিটি (ChatGPT)-এর মূল 'ইঞ্জিন', এবং এটি ইনপুট ও প্রম্পটের উপর ভিত্তি করে টেক্সট ও প্রোগ্রামিং কোড তৈরি করতে পারে। উদাহরণস্বরূপ, চ্যাটজিপিটি প্যাটার্ন বুঝতে পারে এবং ব্যবহারকারীর অনুরোধে দক্ষতার সাথে সাড়া দিতে পারে, যেমন—"ম্যানুয়েল বান্দেইরার শৈলীতে ফুল নিয়ে একটি কবিতা লিখুন" অথবা "চলচ্চিত্রের একটি তালিকা বর্ণানুক্রমিকভাবে সাজাতে সক্ষম একটি পাইথন কোড লিখুন"।
  • কথোপকথনের জন্য চ্যাটবট ও এআই: এলএলএমগুলো ইতিমধ্যেই চ্যাটবট এজেন্টের মাধ্যমে গ্রাহক পরিষেবা দিতে সক্ষম, যেগুলো ভোক্তাদের সাথে কথোপকথন করে, তাদের প্রশ্ন ও সন্দেহের অর্থ অনুধাবন করে এবং উপযুক্ত উত্তর বা নির্দেশনা প্রদান করে।

এইসব ব্যবহারের ক্ষেত্র ছাড়াও, প্রযুক্তি, স্বাস্থ্য ও বিজ্ঞান, বিপণন, আইন এবং ব্যাংকিং ব্যবস্থায় এলএলএম একটি সম্ভাবনাময় এআই টুল হিসেবে প্রমাণিত হচ্ছে। একটি ধারণা দেওয়ার জন্য বলা যায়, এলএলএম বর্তমানে উচ্চ নির্ভুলতার সাথে ভবিষ্যদ্বাণী করতে সক্ষম। স্তন ক্যান্সারের ঘটনা অনেক অভিজ্ঞ চিকিৎসকের চেয়েও উচ্চতর নির্ভুলতার সাথে কোষের নমুনা সেট বিশ্লেষণ করে।

গ্রাফিক্সযুক্ত পটভূমিতে একটি রোবট একজন ডাক্তারের সাথে কথা বলছে।
কার্য স্বয়ংক্রিয়করণের জন্য এলএলএম ব্যবহারের মাধ্যমে স্বাস্থ্যসেবা ক্ষেত্র ব্যাপকভাবে উপকৃত হতে পারে। (চিত্র: রিপ্রোডাকশন/কগিটোটেক)

এলএলএম এবং জেনারেটিভ প্রি-ট্রেইনড ট্রান্সফরমার (জিপিটি)

O জেনারেটিভ প্রি-ট্রেইনড ট্রান্সফরমার (GPT) হলো এক বিশেষ ধরনের LLM যা ট্রান্সফরমার আর্কিটেকচার ব্যবহার করে এবং এটি OpenAI কোম্পানি দ্বারা তৈরি করা হয়েছে। এটিকে অত্যন্ত কার্যকর ও বাস্তবসম্মত উপায়ে স্বাভাবিক ভাষা (যেমন পর্তুগিজ বা ইংরেজি) বোঝা, তৈরি করা এবং পরিচালনা করার জন্য ডিজাইন করা হয়েছে।

নামটি বিশ্লেষণ করলে আমরা GPT কী, তা আরও ভালোভাবে বুঝতে পারি:

  • সৃজক (সৃজনশীল, পর্তুগিজ ভাষায়): এর থেকে বোঝা যায় যে মডেলটি টেক্সট তৈরি করে, অর্থাৎ এটি নতুন বাক্য, উত্তর, সারাংশ, কোড ইত্যাদি তৈরি করতে সক্ষম।
  • পূর্ব-প্রশিক্ষিত (পূর্ব-প্রশিক্ষিত, পর্তুগিজ ভাষায়): এর মানে হলো, এটিকে ইন্টারনেট থেকে সংগৃহীত বিপুল পরিমাণ টেক্সট, যেমন বই, প্রবন্ধ, ওয়েবসাইট এবং অন্যান্য মাধ্যমের ওপর আগে থেকেই প্রশিক্ষণ দেওয়া হয়। এরপর, এটিকে নির্দিষ্ট কাজের জন্য সামঞ্জস্য করা যায়।
  • ট্রান্সফরমার: যেমনটি আমরা আগে উল্লেখ করেছি, এটিই সেই নিউরাল নেটওয়ার্ক আর্কিটেকচার যা মডেলটির ভিত্তি তৈরি করে। এটি অত্যন্ত সমান্তরালযোগ্য (একই সাথে একাধিক কাজ করতে পারে) এবং দীর্ঘ পাঠ্য অনুক্রম পরিচালনায় দক্ষ।
ওপেনিয়ার চ্যাটজিপিটি, যার সাথে আছে একটি মস্তিষ্ক এবং ইলেকট্রনিক সার্কিট।
ওপেনএআই কোম্পানির তৈরি চ্যাটজিপিটি হলো জিপিটি মডেল ব্যবহারকারী সবচেয়ে বিখ্যাত এআই এজেন্ট। (ছবি: রিপ্রোডাকশন/নলেজিয়েট)

জিপিটি এবং অন্যান্য এলএলএম-এর মধ্যে প্রধান পার্থক্য হলো এর প্রশিক্ষণ পর্যায়, যা ৩টি স্বতন্ত্র প্রক্রিয়া নিয়ে গঠিত:

  • প্রশিক্ষণের পূর্বে: ইন্টারনেট, বই, এমনকি ভিডিও ও সঙ্গীত থেকে বিপুল পরিমাণ ডেটা সংগ্রহ করে টোকেনে প্রক্রিয়াজাত করা হয়।
  • নির্দেশাবলীর সূক্ষ্ম সমন্বয়: এখানে, মডেলটিকে নির্দিষ্ট নির্দেশাবলীতে কীভাবে সাড়া দিতে হয় তা 'শেখানো' হয়, যার ফলে এর প্রতিক্রিয়াগুলো আরও নির্ভুল হয়ে ওঠে।
  • মানুষের মতামতের মাধ্যমে শক্তিশালীকরণ শিক্ষা: ফাইন-টিউনিং-এর মতোই, এখানেও মানুষের মতামতের মাধ্যমে 'শেখানোর' কাজটি করা হয়, যা 'রিইনফোর্সমেন্ট লার্নিং' প্রক্রিয়াকে উৎসাহিত করে। এই প্রক্রিয়ায়, এআই পুনরাবৃত্তি এবং কোনো বাহ্যিক এজেন্টের (এই ক্ষেত্রে, এআই ব্যবহারকারী) দেওয়া তথ্যের মাধ্যমে শেখে কোনটি 'সঠিক' এবং কোনটি 'ভুল'।

ইতিহাস: শত শত কোটি শব্দ থেকে জটিল পাঠ্য

যদিও ল্যাঙ্গুয়েজ মডেলের উত্থান কেবল ২০১৭ সালে শুরু হয়েছিল, আইবিএম-এর অ্যালাইনমেন্ট মডেলগুলো ১৯৯০ সাল থেকেই স্ট্যাটিস্টিক্যাল ল্যাঙ্গুয়েজ মডেলিং-এ অগ্রণী ভূমিকা পালন করে আসছিল। ২০০১ সালে, ৩০ লক্ষ শব্দ দিয়ে প্রশিক্ষিত একটি মডেল অর্জন করেছিল... অত্যাধুনিক পাঠ্য ব্যাখ্যা করা এবং সুসংহত বাক্য গঠনের নির্ভুলতার দিক থেকে।

কৃত্রিম বুদ্ধিমত্তা ও প্রযুক্তি কেন্দ্রবিন্দুতে, যেখানে উদ্ভাবনী সম্পদ এবং আধুনিক প্রযুক্তিগত অগ্রগতির উপর আলোকপাত করা হয়েছে।
লক্ষ লক্ষ করে এলএলএম আরও শক্তিশালী হয়ে উঠল এবং আরও জটিল কাজ সম্পাদন করতে লাগল। (ছবি: রিপ্রোডাকশন/সিঙ্গুলারিটি হাব)

২০১২ সাল থেকে নিউরাল নেটওয়ার্ক এআই-এর জগতে এগুলি আরও বেশি প্রাধান্য লাভ করে এবং শীঘ্রই ভাষা সংক্রান্ত কাজে ব্যবহৃত হতে শুরু করে। ২০১৬ সালে, গুগল এটি গ্রহণ করে। নিউরাল মেশিন অনুবাদ এই ধারণার উপর ভিত্তি করে তৈরি মডেল ব্যবহার করে (পর্তুগিজ ভাষায় নিউরাল মেশিনের অনুবাদ)। ২০১৮ সালে, ওপেনএআই কোম্পানি এলএলএম-এর উপর ভিত্তি করে এআই এজেন্ট তৈরির কাজে পুরোদমে ঝাঁপিয়ে পড়ে এবং পরীক্ষার জন্য জিপিটি-১ চালু করে। এর পরের বছরই জিপিটি-২ তার সম্ভাব্য অনৈতিক ব্যবহারের কারণে জনসাধারণের দৃষ্টি আকর্ষণ করতে শুরু করে।

২০২০ সালে GPT-3 এটি শুধুমাত্র এপিআই (API)-এর মাধ্যমে সীমিত অ্যাক্সেস নিয়ে এসেছিল, কিন্তু ২০২২ সালের আগে চ্যাটজিপিটি (ChatGPT) (জিপিটি-৩ দ্বারা চালিত এআই এজেন্ট) বিশ্বব্যাপী জনসাধারণের দৃষ্টি আকর্ষণ করতে পারেনি।
২০২৩ সালে মাল্টিমোডাল সক্ষমতাসহ GPT-4 চালু করা হয়েছিল, যদিও এর প্রযুক্তিগত বিবরণ প্রকাশ করা হয়নি। ২০২৪ সালে, OpenAI চালু করে... মডেল ও১, যা দীর্ঘ যুক্তি শৃঙ্খল তৈরিতে মনোনিবেশ করে। এই সরঞ্জামগুলি বিভিন্ন গবেষণা ক্ষেত্রে এলএলএম-এর ব্যাপক গ্রহণকে চালিত করেছে।

চ্যাটজিপিটি, কৃত্রিম বুদ্ধিমত্তা, ভার্চুয়াল অ্যাসিস্ট্যান্ট, প্রযুক্তিতে উদ্ভাবন।
২০২২ সাল থেকে, সর্বকালের অন্যতম জনপ্রিয় এআই এজেন্ট চ্যাটজিপিটি-তে ব্যবহারের মাধ্যমে এলএলএম বিশ্বব্যাপী খ্যাতি লাভ করে। (ছবি: রিপ্রোডাকশন/ওপেনএআই)

২০২৪ সাল থেকে, সবচেয়ে বড় এবং সবচেয়ে কার্যকর সমস্ত এলএলএম ট্রান্সফরমার আর্কিটেকচারের উপর ভিত্তি করে তৈরি হয়েছে, যদিও কিছু গবেষক অন্যান্য আর্কিটেকচার নিয়ে পরীক্ষা-নিরীক্ষা করছেন, যেমন পৌনঃপুনিক নিউরাল নেটওয়ার্ক (পুনরাবৃত্ত নিউরাল নেটওয়ার্ক, পর্তুগিজ ভাষায়)।

এলএলএম-এর সুবিধা এবং সীমাবদ্ধতা

বহুবিধ প্রয়োগের কারণে, এলএলএম (LLM) সমস্যা সমাধানে বিশেষভাবে উপকারী, কারণ এটি স্পষ্ট ও সরল শৈলীতে তথ্য উপস্থাপন করে যা ব্যবহারকারীদের জন্য বোঝা সহজ। এছাড়াও, এটি ভাষা অনুবাদ, বাক্য সম্পূর্ণকরণ, অনুভূতি বিশ্লেষণ, প্রশ্নের উত্তর দেওয়া, গাণিতিক সমীকরণ সমাধান এবং আরও অনেক কাজে ব্যবহার করা যেতে পারে।

আরও ডেটা ও প্যারামিটার যুক্ত হওয়ার সাথে সাথে এলএলএম-এর কর্মক্ষমতাও ক্রমাগত উন্নত হতে থাকে। অন্য কথায়, এটি যত বেশি শেখে, তত ভালো হয়ে ওঠে। অধিকন্তু, বৃহৎ ভাষা মডেলগুলো "ইন-কনটেক্সট লার্নিং" নামক একটি বৈশিষ্ট্য প্রদর্শন করতে পারে। একবার একটি এলএলএম প্রি-ট্রেইনড হয়ে গেলে, অল্প-ট্রায়ালের প্রম্পটটি মডেলটিকে কোনো অতিরিক্ত প্যারামিটার ছাড়াই প্রম্পট থেকে শিখতে সাহায্য করে। এইভাবে, এটি ক্রমাগত শিখতে থাকে।

প্রসঙ্গ-ভিত্তিক শিখন প্রদর্শনের মাধ্যমে, এলএলএম-রা দ্রুত শেখে, কারণ প্রশিক্ষণের জন্য তাদের অতিরিক্ত গুরুত্ব, উপকরণ এবং মাপকাঠির প্রয়োজন হয় না। তারা এই অর্থে দ্রুত যে, 'আরও বুদ্ধিমান' হয়ে ওঠার জন্য তাদের অনেক উদাহরণের প্রয়োজন হয় না।

মস্তিষ্ক বিভিন্ন উৎস থেকে শিখছিল।
অন্যান্য সকল এআই-ভিত্তিক অ্যালগরিদমের মতোই, এলএলএম যত বেশি ডেটা গ্রহণ ও বিশ্লেষণ করে, তত ভালোভাবে শেখে। (চিত্র: পুনরুৎপাদন/অন্তর্নির্মিত)

এলএলএম-এর একটি প্রধান বৈশিষ্ট্য হলো অপ্রত্যাশিত প্রশ্নের উত্তর দেওয়ার ক্ষমতা। উদাহরণস্বরূপ, একটি প্রচলিত কম্পিউটার প্রোগ্রাম তার স্বীকৃত সিনট্যাক্সে বা ব্যবহারকারীর দেওয়া ইনপুট থেকে কমান্ড গ্রহণ করে। অন্যদিকে, একটি এলএলএম মানুষের স্বাভাবিক ভাষায় সাড়া দিতে পারে এবং ডেটা বিশ্লেষণ ব্যবহার করে একটি অসংগঠিত প্রশ্ন বা অনুরোধের উত্তর এমনভাবে দিতে পারে যা বোধগম্য হয়। যেখানে একটি সাধারণ কম্পিউটার প্রোগ্রাম "সর্বকালের সেরা পাঁচটি রক ব্যান্ড কোনটি?"-এর মতো প্রশ্ন চিনতে পারবে না, সেখানে একটি এলএলএম এই ধরনের পাঁচটি ব্যান্ডের একটি তালিকা এবং তারা কেন সেরা তার একটি যুক্তিসঙ্গত ও জোরালো যুক্তি দিয়ে উত্তর দিতে পারে।

তবে, তাদের প্রদত্ত তথ্যের ক্ষেত্রে, এলএলএম-রা কেবল তাদের প্রাপ্ত তথ্যের মতোই নির্ভরযোগ্য হতে পারে। যদি তারা প্রশিক্ষণের পূর্ববর্তী পর্যায়ে ভুল তথ্য পায়, তবে তারা ব্যবহারকারীর প্রশ্নের উত্তরেও ভুল তথ্য দেবে। কখনও কখনও, ভুল উত্তর তৈরি করার সময় এলএলএম-রা "বিভ্রমের" শিকার হতে পারে এবং সঠিক উত্তর দিতে না পারলে ভুল সাহিত্যিক উৎসেরও উল্লেখ করতে পারে।

উদাহরণস্বরূপ, ২০২২ সালে, সংবাদ সংস্থাটি ফাস্ট কোম্পানি কোম্পানির পূর্ববর্তী আর্থিক ত্রৈমাসিক সম্পর্কে চ্যাটজিপিটি-কে জিজ্ঞাসা করা হয়েছিল। টেসলাযদিও চ্যাটজিপিটি জবাবে একটি সুসংগত সংবাদ প্রতিবেদন সরবরাহ করেছিল, তাতে থাকা তথ্যের বেশিরভাগই ছিল মনগড়া। যেহেতু এটি একটি এআই-ভিত্তিক সিস্টেম, তাই এটি ক্রমাগত উন্নত হচ্ছে বলে জানা যায়, কিন্তু তা সত্ত্বেও, এলএলএম দ্বারা প্রদত্ত প্রতিক্রিয়ার উপর ১০০% নির্ভর করা ভুল।

নিরাপত্তার দিক থেকে, এলএলএম-ভিত্তিক ব্যবহারকারী-মুখী অ্যাপ্লিকেশনগুলো অন্য যেকোনো অ্যাপ্লিকেশনের মতোই বাগ-প্রবণ। ক্ষতিকর ইনপুটের মাধ্যমে এলএলএম-কে এমনভাবে ম্যানিপুলেট করা যায়, যাতে তা অন্যদের ক্ষতির বিনিময়ে নির্দিষ্ট ধরনের প্রতিক্রিয়া প্রদান করে, যার মধ্যে বিপজ্জনক বা অনৈতিক প্রতিক্রিয়াও অন্তর্ভুক্ত।

লেগো দিয়ে তৈরি চ্যাটবট কাজ করতে গিয়ে ভুল করছে।
এলএলএম-ভিত্তিক এআই সিস্টেমগুলো এখনও ত্রুটিমুক্ত নয় এবং এগুলো ভুল করতে পারে ও মিথ্যা তথ্য প্রদান করতে পারে। (ছবি: পুনরুৎপাদন/আইইইই স্পেকট্রাম)

অবশেষে, এলএলএম-এর একটি নিরাপত্তা সমস্যা হলো, ব্যবহারকারীরা নিজেদের উৎপাদনশীলতা বাড়ানোর জন্য সুরক্ষিত এবং গোপনীয় ডেটা আপলোড করতে পারে। কিন্তু এলএলএম তাদের মডেলগুলোকে আরও প্রশিক্ষিত করার জন্য প্রাপ্ত ইনপুট ব্যবহার করে, এবং এগুলোকে সুরক্ষিত ভান্ডার হিসেবে ডিজাইন করা হয়নি, কারণ অন্য ব্যবহারকারীদের জিজ্ঞাসার জবাবে এগুলো গোপনীয় ডেটা প্রকাশ করে দিতে পারে।

এলএলএম এবং শব্দের পেছনের বুদ্ধিমত্তা

একটি বিশাল লাইব্রেরিতে ছেড়ে দেওয়া শিশুর মতো, এলএলএম হলো বুদ্ধিমান এআই সিস্টেম যা বিপুল পরিমাণ ডেটার উপর ভিত্তি করে মানুষের স্বাভাবিক ভাষা বুঝতে ও অনুকরণ করতে শেখে। সাধারণ ব্যবহারকারীদের অনেক সুবিধা প্রদান করা এবং পেশাগত পরিবেশে একটি শক্তিশালী সহায়ক সরঞ্জাম হয়ে ওঠা সত্ত্বেও, এলএলএম-এর সক্ষমতা এবং ঝুঁকিগুলো এখনও খুব সতর্কতার সাথে অধ্যয়ন করা প্রয়োজন।

তো, এলএলএম সম্পর্কে এই নিবন্ধের ব্যাখ্যাটি আপনার কেমন লাগলো? কমেন্টে আপনার মতামত জানান।

আরো দেখুন

উত্স: Elasticsearch, ক্লাউডফেয়ার, আইবিএম

দ্বারা পর্যালোচনা টিয়াগো রডরিগস 16/04/2025 এ


Showmetech সম্পর্কে আরও আবিষ্কার করুন

ইমেল দ্বারা আমাদের সর্বশেষ খবর পেতে সাইন আপ করুন.

সম্পর্কিত পোস্ট
WWDC 2026-এ ঘোষিত ম্যাকবুক, যেটিতে গোল্ডেন গেট ব্রিজের ওয়ালপেপারসহ macOS 27 গোল্ডেন গেট লোগো প্রদর্শিত হচ্ছে এবং এতে অ্যাপল সিলিকনের জন্য নতুন ফিচার ও এক্সক্লুসিভ সাপোর্ট রয়েছে।

অ্যাপল সিরি এআই, ৩০% দ্রুততর অ্যাপস এবং ইন্টেল ম্যাকের সমাপ্তি সহ ম্যাকওএস ২৭ গোল্ডেন গেট ঘোষণা করেছে।

WWDC 2026-এ উপস্থাপিত গোল্ডেন গেট প্রযুক্তিতে লিকুইড গ্লাসকে আরও উন্নত করা হয়েছে, গুগল জেমিনির মাধ্যমে একটি নতুন সিরি আনা হয়েছে এবং এর জন্য অ্যাপল সিলিকন চিপ প্রয়োজন।
ডিয়েগো আমোরিমের অবতার
আরও পড়ুন
পারানায় তোলা ইউএফও-র বিশেষ ছবি, যেখানে আকাশে একটি আলো দেখা যাচ্ছে এবং এর উজ্জ্বল বিন্দুটিকে বিশেষভাবে তুলে ধরা হয়েছে।

পারানায় ইউএফও: ঘটনাটি বুঝুন এবং আকাশে দেখা আলোর সম্ভাব্য ব্যাখ্যা কী হতে পারে।

পারানার ইউএফও সংক্রান্ত প্রতিবেদনগুলো, ব্রাজিলীয় বিমান বাহিনী ও ডিইসিইএ (আকাশসীমা নিয়ন্ত্রণ বিভাগ) কী বলছে, এবং ক্যাম্পো লার্গো ও পন্টালের আলোগুলোর কেন পার্থিব ব্যাখ্যা থাকতে পারে, তা বুঝুন।
ব্রুনো মার্টিনেজ অবতার
আরও পড়ুন
গেমিং পরিবেশের জন্য আরজিবি ডিজাইন ও কালার প্যানেল সহ এমএসআই এমপিজি ওএলইডি ৩২২ইউআরডিএক্স৩৬ ট্রিপল মোড কিউডি-ওএলইডি মনিটরের সম্মুখ ও পশ্চাৎ দৃশ্য।

এমএসআই বিশ্বের প্রথম ট্রিপল মোড মনিটর উন্মোচন করেছে: একটি ৩২-ইঞ্চি কিউডি-ওএলইডি ডিসপ্লে, যাতে রয়েছে ৪কে ৩৬০হার্টজ, ১৪৪০পি ৫২০হার্টজ এবং ১০৮০পি ৬৮০হার্টজ রেজোলিউশন।

কম্পিউটেক্স ২০২৬-এর আগে ঘোষিত, MPG OLED 322URDX36 হলো বিশ্বের প্রথম ট্রিপল মোড মনিটর এবং DisplayHDR True Black 600 সার্টিফিকেশনপ্রাপ্ত প্রথম OLED। কেনার আগে জেনে নিন এর বিশেষত্ব কী এবং কোন বিষয়গুলো বিশেষভাবে লক্ষণীয়।
ডিয়েগো আমোরিমের অবতার
আরও পড়ুন