সূচক
যাকেই জিজ্ঞাসা করা হোক কিভাবে চ্যাটজিপিটিআজকের সবচেয়ে জনপ্রিয় এআই এজেন্টটি যদি কাজ করে, তবে অনেকের মুখেই উত্তরটি ভেসে উঠবে: কৃত্রিম বুদ্ধিমত্তা। কিন্তু সেই উত্তরটি খুবই অস্পষ্ট। বর্তমানে কম্পিউটার বিজ্ঞানের সবচেয়ে বেশি গবেষণা ও উন্নয়ন হওয়া ক্ষেত্রগুলোর মধ্যে একটি হওয়া সত্ত্বেও, কৃত্রিম বুদ্ধিমত্তা বেশ কয়েকটি বৈজ্ঞানিক বিষয়কে অন্তর্ভুক্ত করে।
এগুলোর মধ্যে একটি হলো চ্যাটজিপিটি (ChatGPT) এবং ওয়েবে উপলব্ধ অধিকাংশ এআই এজেন্টের কার্যকারিতার পেছনের মূল চাবিকাঠি: এলএলএম (LLM)। এই প্রবন্ধে আমরা বিস্তারিতভাবে আলোচনা করব, কীভাবে এই ধারণাটি কৃত্রিম বুদ্ধিমত্তা এবং আমাদের বিশ্বে বৈপ্লবিক পরিবর্তন এনেছে।
বৃহৎ ভাষা মডেল (LLM) বলতে কী বোঝায়?
বড় ভাষার মডেল (পর্তুগিজ ভাষায় এলএলএম বা লার্জ ল্যাঙ্গুয়েজ মডেল) হলো অ্যালগরিদম গভীর জ্ঞানার্জন (ডিপ লার্নিং, পর্তুগিজ ভাষায়) বিভিন্ন ধরনের কাজ সম্পাদনে সক্ষম স্বাভাবিক ভাষা প্রক্রিয়াকরণ (পর্তুগিজ ভাষায় ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং)। উফ, কত যে সংক্ষিপ্ত রূপ, তাই না?
এলএলএম ট্রান্সফরমার মডেল ব্যবহার করে এবং বিশাল ডেটাসেট দিয়ে এগুলোকে প্রশিক্ষণ দেওয়া হয়। কিছু জনপ্রিয় ডেটাসেটের উদাহরণ হলো: LAION-2B-en, সিসিএডব্লিউ e উইকিটেক্সট-১০৩একটি ট্রান্সফরমার মডেলকে এমন একটি রোবট বলে মনে হতে পারে যা গাড়িতে রূপান্তরিত হয়, কিন্তু কৃত্রিম বুদ্ধিমত্তার (AI) ক্ষেত্রে এটি একটি এলএলএম (ল্যাবরেটরি ফ্রেমওয়ার্ক ফর লার্নিং)-এর সবচেয়ে প্রচলিত স্থাপত্যের প্রতিনিধিত্ব করে।
ট্রান্সফর্মারটি গঠিত হয় একটি এনকোডার (পর্তুগিজ ভাষায় এনকোডার) এবং একটি ডিকোডার (পর্তুগিজ ভাষায় ডিকোডার)। মূলত, এনকোডারের কাজ হলো একটি বাক্য বা লেখার শব্দগুলোকে টোকেন নামক ছোট ছোট অংশে বিভক্ত করা, এবং ডিকোডার এই টোকেনগুলোর মধ্যে সম্পর্ক শনাক্ত করার জন্য গাণিতিক প্রক্রিয়া সম্পাদন করে।
ট্রান্সফর্মার এবং বহু বছর আগে ব্যবহৃত আর্কিটেকচার, এলএসটিএম (এর মধ্যে বড় পার্থক্য হলোদীর্ঘ স্বল্পমেয়াদী স্মৃতিট্রান্সফর্মারদের (বা দীর্ঘমেয়াদী স্মৃতি এবং স্বল্পমেয়াদী স্মৃতিকে) যা অনন্য করে তোলে তা হলো, এরা স্ব-মনোযোগ পদ্ধতির মাধ্যমে কাজ করে, যার অর্থ হলো, পূর্বাভাস তৈরি করার জন্য এরা একটি বাক্যের অংশবিশেষ বা এমনকি তার প্রেক্ষাপট বিবেচনা করে দ্রুত শিখতে সক্ষম।
ল্যাঙ্গুয়েজ লার্নিং মডিউল (এলএলএম) হলো বহুমুখী এআই সিস্টেম, যা মানুষের ভাষা প্রক্রিয়াকরণ ছাড়াও প্রোটিন কাঠামো বিশ্লেষণ এবং প্রোগ্রামিং কোড তৈরির মতো অন্যান্য কাজও করতে পারে। দক্ষতার সাথে কাজ করার জন্য, টেক্সট ক্লাসিফিকেশন, সারসংক্ষেপ তৈরি এবং প্রশ্নোত্তরের মতো ফাংশনগুলো সামলানোর জন্য এলএলএম-এর পূর্ব-প্রশিক্ষণ এবং সতর্ক সমন্বয়ের প্রয়োজন হয়, যা এগুলিকে স্বাস্থ্যসেবা, অর্থায়ন এবং বিনোদনের মতো ক্ষেত্রগুলির জন্য মূল্যবান করে তোলে।
মূল উপাদান
এলএলএম একাধিক নিউরাল নেটওয়ার্ক স্তর দ্বারা গঠিত। একটি নিউরাল নেটওয়ার্কে (নিউরাল নেটওয়ার্কমূলত, একটি ভেরিয়েবলকে ইনপুট হিসেবে ব্যবহার করা হয়, যা এক বা একাধিক লেয়ার দ্বারা বিভিন্ন ওয়েট ও গাণিতিক সমীকরণের মাধ্যমে প্রক্রিয়াজাত হয়ে একটি আউটপুট মান তৈরি হয়।
এলএলএম-এ উপস্থিত প্রথম ধরণের নিউরাল নেটওয়ার্ক হলো এমবেডিং লেয়ার (এম্বেডিং স্তরএটি এমবেডিং প্রক্রিয়ার জন্য দায়ী, যা ইনপুটের শব্দার্থ এবং বাক্যগঠনগত অর্থ ধারণ করে, যাতে মডেলটি প্রসঙ্গটি বুঝতে পারে।
এরপরে রয়েছে ফিডফরোয়ার্ড নেটওয়ার্ক (FFN) লেয়ার, যা একাধিক আন্তঃসংযুক্ত লেয়ার দ্বারা গঠিত এবং এম্বেডিং ইনপুটগুলোকে রূপান্তরিত করে। এই প্রক্রিয়ায়, এই লেয়ারগুলো মডেলকে উচ্চ-স্তরের অ্যাবস্ট্রাকশন সংগ্রহ করতে, অর্থাৎ টেক্সট ইনপুটের মাধ্যমে ব্যবহারকারীর উদ্দেশ্য বুঝতে সাহায্য করে।
এরপরে রয়েছে রিকারেন্ট লেয়ার, যা ইনপুট টেক্সটের শব্দগুলোকে ক্রমানুসারে ব্যাখ্যা করে। একটি বাক্যের শব্দগুলোর মধ্যকার সম্পর্ক নির্ণয় করাই এর কাজ।
সবশেষে, রয়েছে অ্যাটেনশন মেকানিজম, যা LLM-কে ইনপুট টেক্সটের সেইসব অনন্য অংশের উপর মনোযোগ কেন্দ্রীভূত করতে সাহায্য করে, যেগুলো নির্ধারিত কাজের সাথে প্রাসঙ্গিক। এই লেয়ারটি মডেলকে সবচেয়ে উপযুক্ত এবং নির্ভুল আউটপুট তৈরি করতে সক্ষম করে।
তারা কিভাবে কাজ করে
এখন যেহেতু আমরা জানি এলএলএম কী এবং এর মূল উপাদানগুলো কী, আমরা এর কার্যপ্রণালী আরও স্পষ্টভাবে বুঝতে পারব। মূলত, ট্রান্সফরমার-ভিত্তিক এলএলএম একটি ইনপুট গ্রহণ করে, সেটিকে এনকোড করে এবং তারপর একটি পূর্বাভাসিত আউটপুট তৈরি করার জন্য সেটিকে ডিকোড করে। তবে, একটি এলএলএম টেক্সট ইনপুট গ্রহণ করে পূর্বাভাসিত আউটপুট তৈরি করার আগে, সাধারণ কাজগুলো করার জন্য এর ট্রেনিং এবং নির্দিষ্ট কাজগুলো করতে সক্ষম করার জন্য ফাইন-টিউনিং প্রয়োজন হয়।
প্রাক-প্রশিক্ষণ (প্রাক-প্রশিক্ষণ(ইংরেজিতে) হলো এই ক্ষেত্রের একটি চিরায়ত প্রক্রিয়া। মেশিন লার্নিং (মেশিন লার্নিংকৃত্রিম বুদ্ধিমত্তার ক্ষেত্রে। এই প্রক্রিয়াটিতে, নাম থেকেই বোঝা যায়, বিভিন্ন ওয়েবসাইট থেকে সংগৃহীত ট্রিলিয়ন ট্রিলিয়ন শব্দের বিশাল টেক্সচুয়াল ডেটাসেট ব্যবহার করে এলএলএম-দের প্রি-ট্রেনিং করানো হয়, যেমন— উইকিপিডিয়া, GitHub...অন্যান্য আরও অনেক কিছুর মধ্যে। সর্বোপরি, এলএলএম-কে তো কোথাও থেকে শিখতে হয়, ঠিক একটা ছোট বাচ্চার মতো, তাই না?
এই পর্যায়ে, এলএলএম যা করে তা হলো তত্ত্বাবধানবিহীন শিখন (অশিক্ষিত শিক্ষা(ইংরেজিতে) – এমন একটি প্রক্রিয়া যেখানে ডেটাসেটগুলো কোনো নির্দিষ্ট নির্দেশনা ছাড়াই কেবল পড়া হয়। অর্থাৎ, কোনো “প্রশিক্ষক” ছাড়াই, LLM-এর নিজস্ব AI অ্যালগরিদম প্রতিটি শব্দের অর্থ এবং তাদের মধ্যকার সম্পর্ক শেখার দায়িত্বে থাকে। এছাড়াও, LLM প্রসঙ্গের উপর ভিত্তি করে শব্দগুলোর মধ্যে পার্থক্য করতেও শেখে। উদাহরণস্বরূপ, এটি বুঝতে শেখে যে “right” বলতে “correct” বোঝায়, নাকি এটি কেবল “left-এর বিপরীত”।
সূক্ষ্ম সমন্বয় প্রক্রিয়া (ফাইন টিউনিংপ্রম্পট অ্যাডজাস্টমেন্ট (ইংরেজিতে) হলো এলএলএম-কে নির্দিষ্ট কাজ, যেমন টেক্সট অনুবাদ, দক্ষতার সাথে সম্পাদনের জন্য "টিউন" করার একটি প্রক্রিয়া, যা এর পারফরম্যান্সকে অপ্টিমাইজ করে। প্রম্পট অ্যাডজাস্টমেন্ট (এলএলএম-কে দেওয়া প্রশ্ন ও নির্দেশাবলী) এক ধরনের ফাইন-টিউনিং হিসেবে কাজ করে, কারণ এটি মডেলটিকে একটি নির্দিষ্ট কাজ সম্পাদনের জন্য প্রশিক্ষণ দিতে সক্ষম।
একটি বৃহৎ আকারের ভাষা মডেলকে অনুবাদের মতো কোনো নির্দিষ্ট কাজ সম্পাদন করতে হলে, সেটিকে অবশ্যই সেই নির্দিষ্ট কার্যকলাপের জন্য সূক্ষ্মভাবে সমন্বয় করতে হয়। সূক্ষ্ম সমন্বয়ের মাধ্যমে নির্দিষ্ট কাজের জন্য কর্মক্ষমতা সর্বোত্তম করা হয়।
প্রম্পট টিউনিং ফাইন-টিউনিং-এর মতোই একটি কাজ করে, যেখানে অল্প-ট্রায়াল বা জিরো-ট্রায়াল প্রম্পট ব্যবহার করে একটি মডেলকে কোনো নির্দিষ্ট কাজ করার জন্য প্রশিক্ষণ দেওয়া হয়। নিচে অল্প-ট্রায়াল প্রম্পট ব্যবহার করে একটি 'সেন্টিমেন্ট অ্যানালাইসিস' অনুশীলনের উদাহরণ দেওয়া হলো:
Texto de entrada: Essa casa é linda!
Sentimento da frase: Positivo
Texto de entrada: Essa casa é horrível!
Sentimento da frase: Negativo
এই উদাহরণে প্রাপ্ত ফলাফলের ভিত্তিতে, 'ভয়াবহ' শব্দটির অর্থগত তাৎপর্য এবং একটি বিপরীত উদাহরণ প্রদান করার কারণে, এলএলএম বুঝতে পারবে যে দ্বিতীয় উদাহরণে ব্যবহারকারীর অনুভূতি 'নেতিবাচক'।
ব্যবহারের ক্ষেত্র
যেমনটি আমরা আগে উল্লেখ করেছি, এলএলএম বিভিন্ন উদ্দেশ্যে ব্যবহার করা যেতে পারে:
- তথ্য পুনরুদ্ধার: এক্ষেত্রে, আমরা গুগল বা বিং-এর মতো ওয়েব সার্চ ইঞ্জিনগুলিতে এর ব্যবহারের কথা ভাবতে পারি। যখন কোনো ব্যবহারকারী এই পরিষেবাগুলির সার্চ ফাংশন ব্যবহার করেন, তখন তাঁরা তাঁদের অনুরোধের প্রতিক্রিয়া হিসাবে তথ্য তৈরি করার জন্য এলএলএম (LLM) ব্যবহার করেন। এলএলএম তথ্য পুনরুদ্ধার করতে, সেটিকে সংক্ষিপ্ত করতে এবং ব্যবহারকারীর সাথে কথোপকথনের আকারে প্রতিক্রিয়াটি জানাতে সক্ষম।
- টেক্সট জেনারেশন এবং প্রোগ্রামিং কোডএলএলএম (LLM) হলো জেনারেটিভ এআই (Generative AI), যেমন চ্যাটজিপিটি (ChatGPT)-এর মূল 'ইঞ্জিন', এবং এটি ইনপুট ও প্রম্পটের উপর ভিত্তি করে টেক্সট ও প্রোগ্রামিং কোড তৈরি করতে পারে। উদাহরণস্বরূপ, চ্যাটজিপিটি প্যাটার্ন বুঝতে পারে এবং ব্যবহারকারীর অনুরোধে দক্ষতার সাথে সাড়া দিতে পারে, যেমন—"ম্যানুয়েল বান্দেইরার শৈলীতে ফুল নিয়ে একটি কবিতা লিখুন" অথবা "চলচ্চিত্রের একটি তালিকা বর্ণানুক্রমিকভাবে সাজাতে সক্ষম একটি পাইথন কোড লিখুন"।
- কথোপকথনের জন্য চ্যাটবট ও এআই: এলএলএমগুলো ইতিমধ্যেই চ্যাটবট এজেন্টের মাধ্যমে গ্রাহক পরিষেবা দিতে সক্ষম, যেগুলো ভোক্তাদের সাথে কথোপকথন করে, তাদের প্রশ্ন ও সন্দেহের অর্থ অনুধাবন করে এবং উপযুক্ত উত্তর বা নির্দেশনা প্রদান করে।
এইসব ব্যবহারের ক্ষেত্র ছাড়াও, প্রযুক্তি, স্বাস্থ্য ও বিজ্ঞান, বিপণন, আইন এবং ব্যাংকিং ব্যবস্থায় এলএলএম একটি সম্ভাবনাময় এআই টুল হিসেবে প্রমাণিত হচ্ছে। একটি ধারণা দেওয়ার জন্য বলা যায়, এলএলএম বর্তমানে উচ্চ নির্ভুলতার সাথে ভবিষ্যদ্বাণী করতে সক্ষম। স্তন ক্যান্সারের ঘটনা অনেক অভিজ্ঞ চিকিৎসকের চেয়েও উচ্চতর নির্ভুলতার সাথে কোষের নমুনা সেট বিশ্লেষণ করে।
এলএলএম এবং জেনারেটিভ প্রি-ট্রেইনড ট্রান্সফরমার (জিপিটি)
O জেনারেটিভ প্রি-ট্রেইনড ট্রান্সফরমার (GPT) হলো এক বিশেষ ধরনের LLM যা ট্রান্সফরমার আর্কিটেকচার ব্যবহার করে এবং এটি OpenAI কোম্পানি দ্বারা তৈরি করা হয়েছে। এটিকে অত্যন্ত কার্যকর ও বাস্তবসম্মত উপায়ে স্বাভাবিক ভাষা (যেমন পর্তুগিজ বা ইংরেজি) বোঝা, তৈরি করা এবং পরিচালনা করার জন্য ডিজাইন করা হয়েছে।
নামটি বিশ্লেষণ করলে আমরা GPT কী, তা আরও ভালোভাবে বুঝতে পারি:
- সৃজক (সৃজনশীল, পর্তুগিজ ভাষায়): এর থেকে বোঝা যায় যে মডেলটি টেক্সট তৈরি করে, অর্থাৎ এটি নতুন বাক্য, উত্তর, সারাংশ, কোড ইত্যাদি তৈরি করতে সক্ষম।
- পূর্ব-প্রশিক্ষিত (পূর্ব-প্রশিক্ষিত, পর্তুগিজ ভাষায়): এর মানে হলো, এটিকে ইন্টারনেট থেকে সংগৃহীত বিপুল পরিমাণ টেক্সট, যেমন বই, প্রবন্ধ, ওয়েবসাইট এবং অন্যান্য মাধ্যমের ওপর আগে থেকেই প্রশিক্ষণ দেওয়া হয়। এরপর, এটিকে নির্দিষ্ট কাজের জন্য সামঞ্জস্য করা যায়।
- ট্রান্সফরমার: যেমনটি আমরা আগে উল্লেখ করেছি, এটিই সেই নিউরাল নেটওয়ার্ক আর্কিটেকচার যা মডেলটির ভিত্তি তৈরি করে। এটি অত্যন্ত সমান্তরালযোগ্য (একই সাথে একাধিক কাজ করতে পারে) এবং দীর্ঘ পাঠ্য অনুক্রম পরিচালনায় দক্ষ।
জিপিটি এবং অন্যান্য এলএলএম-এর মধ্যে প্রধান পার্থক্য হলো এর প্রশিক্ষণ পর্যায়, যা ৩টি স্বতন্ত্র প্রক্রিয়া নিয়ে গঠিত:
- প্রশিক্ষণের পূর্বে: ইন্টারনেট, বই, এমনকি ভিডিও ও সঙ্গীত থেকে বিপুল পরিমাণ ডেটা সংগ্রহ করে টোকেনে প্রক্রিয়াজাত করা হয়।
- নির্দেশাবলীর সূক্ষ্ম সমন্বয়: এখানে, মডেলটিকে নির্দিষ্ট নির্দেশাবলীতে কীভাবে সাড়া দিতে হয় তা 'শেখানো' হয়, যার ফলে এর প্রতিক্রিয়াগুলো আরও নির্ভুল হয়ে ওঠে।
- মানুষের মতামতের মাধ্যমে শক্তিশালীকরণ শিক্ষা: ফাইন-টিউনিং-এর মতোই, এখানেও মানুষের মতামতের মাধ্যমে 'শেখানোর' কাজটি করা হয়, যা 'রিইনফোর্সমেন্ট লার্নিং' প্রক্রিয়াকে উৎসাহিত করে। এই প্রক্রিয়ায়, এআই পুনরাবৃত্তি এবং কোনো বাহ্যিক এজেন্টের (এই ক্ষেত্রে, এআই ব্যবহারকারী) দেওয়া তথ্যের মাধ্যমে শেখে কোনটি 'সঠিক' এবং কোনটি 'ভুল'।
ইতিহাস: শত শত কোটি শব্দ থেকে জটিল পাঠ্য
যদিও ল্যাঙ্গুয়েজ মডেলের উত্থান কেবল ২০১৭ সালে শুরু হয়েছিল, আইবিএম-এর অ্যালাইনমেন্ট মডেলগুলো ১৯৯০ সাল থেকেই স্ট্যাটিস্টিক্যাল ল্যাঙ্গুয়েজ মডেলিং-এ অগ্রণী ভূমিকা পালন করে আসছিল। ২০০১ সালে, ৩০ লক্ষ শব্দ দিয়ে প্রশিক্ষিত একটি মডেল অর্জন করেছিল... অত্যাধুনিক পাঠ্য ব্যাখ্যা করা এবং সুসংহত বাক্য গঠনের নির্ভুলতার দিক থেকে।
২০১২ সাল থেকে নিউরাল নেটওয়ার্ক এআই-এর জগতে এগুলি আরও বেশি প্রাধান্য লাভ করে এবং শীঘ্রই ভাষা সংক্রান্ত কাজে ব্যবহৃত হতে শুরু করে। ২০১৬ সালে, গুগল এটি গ্রহণ করে। নিউরাল মেশিন অনুবাদ এই ধারণার উপর ভিত্তি করে তৈরি মডেল ব্যবহার করে (পর্তুগিজ ভাষায় নিউরাল মেশিনের অনুবাদ)। ২০১৮ সালে, ওপেনএআই কোম্পানি এলএলএম-এর উপর ভিত্তি করে এআই এজেন্ট তৈরির কাজে পুরোদমে ঝাঁপিয়ে পড়ে এবং পরীক্ষার জন্য জিপিটি-১ চালু করে। এর পরের বছরই জিপিটি-২ তার সম্ভাব্য অনৈতিক ব্যবহারের কারণে জনসাধারণের দৃষ্টি আকর্ষণ করতে শুরু করে।
২০২০ সালে GPT-3 এটি শুধুমাত্র এপিআই (API)-এর মাধ্যমে সীমিত অ্যাক্সেস নিয়ে এসেছিল, কিন্তু ২০২২ সালের আগে চ্যাটজিপিটি (ChatGPT) (জিপিটি-৩ দ্বারা চালিত এআই এজেন্ট) বিশ্বব্যাপী জনসাধারণের দৃষ্টি আকর্ষণ করতে পারেনি।
২০২৩ সালে মাল্টিমোডাল সক্ষমতাসহ GPT-4 চালু করা হয়েছিল, যদিও এর প্রযুক্তিগত বিবরণ প্রকাশ করা হয়নি। ২০২৪ সালে, OpenAI চালু করে... মডেল ও১, যা দীর্ঘ যুক্তি শৃঙ্খল তৈরিতে মনোনিবেশ করে। এই সরঞ্জামগুলি বিভিন্ন গবেষণা ক্ষেত্রে এলএলএম-এর ব্যাপক গ্রহণকে চালিত করেছে।
২০২৪ সাল থেকে, সবচেয়ে বড় এবং সবচেয়ে কার্যকর সমস্ত এলএলএম ট্রান্সফরমার আর্কিটেকচারের উপর ভিত্তি করে তৈরি হয়েছে, যদিও কিছু গবেষক অন্যান্য আর্কিটেকচার নিয়ে পরীক্ষা-নিরীক্ষা করছেন, যেমন পৌনঃপুনিক নিউরাল নেটওয়ার্ক (পুনরাবৃত্ত নিউরাল নেটওয়ার্ক, পর্তুগিজ ভাষায়)।
এলএলএম-এর সুবিধা এবং সীমাবদ্ধতা
বহুবিধ প্রয়োগের কারণে, এলএলএম (LLM) সমস্যা সমাধানে বিশেষভাবে উপকারী, কারণ এটি স্পষ্ট ও সরল শৈলীতে তথ্য উপস্থাপন করে যা ব্যবহারকারীদের জন্য বোঝা সহজ। এছাড়াও, এটি ভাষা অনুবাদ, বাক্য সম্পূর্ণকরণ, অনুভূতি বিশ্লেষণ, প্রশ্নের উত্তর দেওয়া, গাণিতিক সমীকরণ সমাধান এবং আরও অনেক কাজে ব্যবহার করা যেতে পারে।
আরও ডেটা ও প্যারামিটার যুক্ত হওয়ার সাথে সাথে এলএলএম-এর কর্মক্ষমতাও ক্রমাগত উন্নত হতে থাকে। অন্য কথায়, এটি যত বেশি শেখে, তত ভালো হয়ে ওঠে। অধিকন্তু, বৃহৎ ভাষা মডেলগুলো "ইন-কনটেক্সট লার্নিং" নামক একটি বৈশিষ্ট্য প্রদর্শন করতে পারে। একবার একটি এলএলএম প্রি-ট্রেইনড হয়ে গেলে, অল্প-ট্রায়ালের প্রম্পটটি মডেলটিকে কোনো অতিরিক্ত প্যারামিটার ছাড়াই প্রম্পট থেকে শিখতে সাহায্য করে। এইভাবে, এটি ক্রমাগত শিখতে থাকে।
প্রসঙ্গ-ভিত্তিক শিখন প্রদর্শনের মাধ্যমে, এলএলএম-রা দ্রুত শেখে, কারণ প্রশিক্ষণের জন্য তাদের অতিরিক্ত গুরুত্ব, উপকরণ এবং মাপকাঠির প্রয়োজন হয় না। তারা এই অর্থে দ্রুত যে, 'আরও বুদ্ধিমান' হয়ে ওঠার জন্য তাদের অনেক উদাহরণের প্রয়োজন হয় না।
এলএলএম-এর একটি প্রধান বৈশিষ্ট্য হলো অপ্রত্যাশিত প্রশ্নের উত্তর দেওয়ার ক্ষমতা। উদাহরণস্বরূপ, একটি প্রচলিত কম্পিউটার প্রোগ্রাম তার স্বীকৃত সিনট্যাক্সে বা ব্যবহারকারীর দেওয়া ইনপুট থেকে কমান্ড গ্রহণ করে। অন্যদিকে, একটি এলএলএম মানুষের স্বাভাবিক ভাষায় সাড়া দিতে পারে এবং ডেটা বিশ্লেষণ ব্যবহার করে একটি অসংগঠিত প্রশ্ন বা অনুরোধের উত্তর এমনভাবে দিতে পারে যা বোধগম্য হয়। যেখানে একটি সাধারণ কম্পিউটার প্রোগ্রাম "সর্বকালের সেরা পাঁচটি রক ব্যান্ড কোনটি?"-এর মতো প্রশ্ন চিনতে পারবে না, সেখানে একটি এলএলএম এই ধরনের পাঁচটি ব্যান্ডের একটি তালিকা এবং তারা কেন সেরা তার একটি যুক্তিসঙ্গত ও জোরালো যুক্তি দিয়ে উত্তর দিতে পারে।
তবে, তাদের প্রদত্ত তথ্যের ক্ষেত্রে, এলএলএম-রা কেবল তাদের প্রাপ্ত তথ্যের মতোই নির্ভরযোগ্য হতে পারে। যদি তারা প্রশিক্ষণের পূর্ববর্তী পর্যায়ে ভুল তথ্য পায়, তবে তারা ব্যবহারকারীর প্রশ্নের উত্তরেও ভুল তথ্য দেবে। কখনও কখনও, ভুল উত্তর তৈরি করার সময় এলএলএম-রা "বিভ্রমের" শিকার হতে পারে এবং সঠিক উত্তর দিতে না পারলে ভুল সাহিত্যিক উৎসেরও উল্লেখ করতে পারে।
উদাহরণস্বরূপ, ২০২২ সালে, সংবাদ সংস্থাটি ফাস্ট কোম্পানি কোম্পানির পূর্ববর্তী আর্থিক ত্রৈমাসিক সম্পর্কে চ্যাটজিপিটি-কে জিজ্ঞাসা করা হয়েছিল। টেসলাযদিও চ্যাটজিপিটি জবাবে একটি সুসংগত সংবাদ প্রতিবেদন সরবরাহ করেছিল, তাতে থাকা তথ্যের বেশিরভাগই ছিল মনগড়া। যেহেতু এটি একটি এআই-ভিত্তিক সিস্টেম, তাই এটি ক্রমাগত উন্নত হচ্ছে বলে জানা যায়, কিন্তু তা সত্ত্বেও, এলএলএম দ্বারা প্রদত্ত প্রতিক্রিয়ার উপর ১০০% নির্ভর করা ভুল।
নিরাপত্তার দিক থেকে, এলএলএম-ভিত্তিক ব্যবহারকারী-মুখী অ্যাপ্লিকেশনগুলো অন্য যেকোনো অ্যাপ্লিকেশনের মতোই বাগ-প্রবণ। ক্ষতিকর ইনপুটের মাধ্যমে এলএলএম-কে এমনভাবে ম্যানিপুলেট করা যায়, যাতে তা অন্যদের ক্ষতির বিনিময়ে নির্দিষ্ট ধরনের প্রতিক্রিয়া প্রদান করে, যার মধ্যে বিপজ্জনক বা অনৈতিক প্রতিক্রিয়াও অন্তর্ভুক্ত।
অবশেষে, এলএলএম-এর একটি নিরাপত্তা সমস্যা হলো, ব্যবহারকারীরা নিজেদের উৎপাদনশীলতা বাড়ানোর জন্য সুরক্ষিত এবং গোপনীয় ডেটা আপলোড করতে পারে। কিন্তু এলএলএম তাদের মডেলগুলোকে আরও প্রশিক্ষিত করার জন্য প্রাপ্ত ইনপুট ব্যবহার করে, এবং এগুলোকে সুরক্ষিত ভান্ডার হিসেবে ডিজাইন করা হয়নি, কারণ অন্য ব্যবহারকারীদের জিজ্ঞাসার জবাবে এগুলো গোপনীয় ডেটা প্রকাশ করে দিতে পারে।
এলএলএম এবং শব্দের পেছনের বুদ্ধিমত্তা
একটি বিশাল লাইব্রেরিতে ছেড়ে দেওয়া শিশুর মতো, এলএলএম হলো বুদ্ধিমান এআই সিস্টেম যা বিপুল পরিমাণ ডেটার উপর ভিত্তি করে মানুষের স্বাভাবিক ভাষা বুঝতে ও অনুকরণ করতে শেখে। সাধারণ ব্যবহারকারীদের অনেক সুবিধা প্রদান করা এবং পেশাগত পরিবেশে একটি শক্তিশালী সহায়ক সরঞ্জাম হয়ে ওঠা সত্ত্বেও, এলএলএম-এর সক্ষমতা এবং ঝুঁকিগুলো এখনও খুব সতর্কতার সাথে অধ্যয়ন করা প্রয়োজন।
তো, এলএলএম সম্পর্কে এই নিবন্ধের ব্যাখ্যাটি আপনার কেমন লাগলো? কমেন্টে আপনার মতামত জানান।
আরো দেখুন
উত্স: Elasticsearch, ক্লাউডফেয়ার, আইবিএম
দ্বারা পর্যালোচনা টিয়াগো রডরিগস 16/04/2025 এ
Showmetech সম্পর্কে আরও আবিষ্কার করুন
ইমেল দ্বারা আমাদের সর্বশেষ খবর পেতে সাইন আপ করুন.