বিজ্ঞান ও প্রযক্তি ডেস্ক : জেনারেটিভ এআই ‘পাগল হয়ে উঠতে পারে’ ও ইন্টারনেট ব্যবস্থা ভেঙে দিতে পারে, সম্প্রতি এমনই সতর্কবার্তা দিয়েছেন বিজ্ঞানীরা।
ওপেনএআইয়ের ‘জিপিটি-৪’ ও স্ট্যাবিলিটি এআইয়ের ‘স্টেবল ডিফিউশন’-এর মতো জেনারেটিভ এআই মডেল বিস্ময়করভাবে টেক্সট, কোড, ইমেজ ও ভিডিও তৈরি করতে পারে।
এআই মডেল প্রশিক্ষণে বিপুল পরিমাণ ডেটা প্রয়োজন, যা সংগ্রহের একেবারে শেষ পর্যায়ে চলে এসেছে অ্যাপ নির্মাতারা। এমনকি শিগগিরই হয়ত প্রশিক্ষণ নেওয়ার মতো ডেটা অবশিষ্ট থাকবে না বলে প্রতিবেদনে লিখেছে বিজ্ঞানভিত্তিক প্রকাশনা নোরিজ।
বাস্তব জগতের ডেটায় ঘাটতি দেখা দিলে শীর্ষ প্রযুক্তি কোম্পানিগুলো ‘সিন্থেটিক’ বা কৃত্রিম ডেটা তৈরির দিকে ঝুঁকতে পারে, এমন ঝুঁকিও আছে।
এআই থেকে তৈরি কৃত্রিম ডেটা তুলনামূলক সস্তামানের ও ভার্চুয়াল জগতে এর ফুরিয়ে যাওয়ার সম্ভাবনাও নেই। এমনকি এতে প্রাইভেসি ঝুঁকিও কম, বিশেষ করে মেডিকাল ডেটার মতো স্পর্শকাতর তথ্যের বেলায়। আর কিছু ক্ষেত্রে এআইয়ের কার্যকারিতা উন্নত করার সম্ভাবনাও আছে এতে।
তবে, যুক্তরাষ্ট্রের ‘রাইস ইউনিভার্সিটি’র ‘ডিজিটাল সিগন্যাল প্রসেসিং গ্রুপ’-এর সাম্প্রতিক এক গবেষণায় দেখা গেছে, এই ‘সিন্থেটিক’ ডেটা পদ্ধতিতে বেশ কিছু ত্রুটি থাকতে পারে।
বিষয়টি ব্যাখ্যা করেছেন রাইস ইউনিভার্সিটি’র ‘ইলেকট্রিক্যাল অ্যান্ড কম্পিউটার ইঞ্জিনিয়ারিং’ বিভাগের অধ্যাপক রিচার্ড বারানিউক।
“প্রশিক্ষণের জন্য কৃত্রিম ডেটার ক্রমাগত ব্যবহারে এমন হতে পারে। ফলে এক ধরনের ‘ফিডব্যাক লুপ’ তৈরি হয়, যাকে আমরা ডাকছি ‘অটোফাগাস’ বা ‘সেলফ-কনজিউমিং’ লুপ বলে। এমনকি কয়েক প্রজন্ম পর এইসব মডেল এতটা বিকৃত হয়ে উঠতে পারে, যা আর পূরণ করা সম্ভব হবে না।”
“আমরা একে ‘মডেল অটোফেজি ডিসঅর্ডার (এমএডি)’ বলে ডাকি। পাগল গরুর রোগ যেভাবে কাজ করে ঠিক তেমন।”
বিভিন্ন জেনারেটিভ মডেলে কীভাবে সত্যিকারের ও কৃত্রিম ডেটা মিশে যায় তা বুঝতে ‘সেলফ-কনজিউমিং’ প্রশিক্ষণের বিভিন্ন লুপের তিনটি বৈচিত্র্য নিয়ে গবেষণা করেছেন ‘রাইস ইউনিভার্সিটি’র বারানিয়ুক ও তার গবেষণা দলটি।
এজন্য তিনটি দৃশ্যের ইলাস্ট্রেশন করেছেন গবেষকরা। একটি সম্পূর্ণ সিন্থেটিক লুপ, একটি সিন্থেটিক-এর বাড়তি লুপ (আসল ডেটার একটি নির্দিষ্ট সেটের সঙ্গে সিন্থেটিক ডেটা যুক্ত করা) ও একটি নতুন ডেটা লুপ (নতুন আসল ডেটার সঙ্গে সিন্থেটিক ডেটা যুক্ত করা)।
গরুর ‘পাগল রোগে’র মতো, যা গরুর মধ্যে এদের সমবয়সীদের প্রক্রিয়াজাত খাবারের অবশিষ্টাংশ খাওয়ানোর মাধ্যমে ছড়ায়। ঠিক তেমনি বিভিন্ন এআই মডেলে যখন বারবার এদের নিজস্ব তৈরি ডেটাতে প্রশিক্ষণ দেয় তখন ‘এমএডি’ ঘটে। যা এআইয়ের বিভিন্ন আউটপুটের গুণমান ও বৈচিত্র্যকে দ্রুত পতনের দিকে নিয়ে যায়। ফলে এমন একটি ঘটনা ঘটে যাকে ‘জেনারেটিভ আর্টিফ্যাক্টস’ বলে ডাকছেন গবেষকরা।
ক্রমাগত প্রজন্ম ধরে মানুষের মুখের বিভিন্ন ডেটাসেট গ্রিডের মতো দাগ দিয়ে রেখাযুক্ত হয়ে যায় ও বিভিন্ন সংখ্যা অপাঠ্য নানা স্ক্রিবলে রূপান্তরিত হয়।
‘ইন্টারন্যাশনাল কনফারেন্স অন লার্নিং রিপ্রেজেন্টেশনস (আইসিএলআর)’-এ উপস্থাপিত এই গবেষণায় দেখা মিলেছে, সম্পূর্ণ সিন্থেটিক লুপগুলো নতুন বাস্তব তথ্য ছাড়াই দ্রুত কমে যায়। সিন্থেটিক অগমেন্টেশন ও নতুন ডেটা লুপগুলো আরও ভালভাবে সম্পাদন করতে পারলেও এগুলো এখনও সময়ের সঙ্গে সঙ্গে কমের দিকে যাচ্ছে।
বারানিউকের গবেষণা দলটি তাদের বিভিন্ন সিমুলেশনে পক্ষপাত হিসেবে ‘চেরি পিকিং’ যুক্ত করেছে, যাতে বিভিন্ন ডেটার চেয়ে উচ্চমানের ডেটার জন্য ব্যবহারকারীদের পছন্দকে নকল করতে পারে। এই পক্ষপাত তথ্যের গুণমানকে দীর্ঘকাল ধরে সংরক্ষণ করলেও তথ্যের বৈচিত্র্যের দ্রুত পতন ঘটায়।
“পর্যাপ্ত নতুন বাস্তবভিত্তিক তথ্য ছাড়া ভবিষ্যতের বিভিন্ন জেনারেটিভ মডেল ‘এমএডিনেস’-এ ধ্বংস হয়ে যাবে,” বলেছেন বারানিউক।
“এর একটি শেষ দৃশ্য হল, যদি বহু প্রজন্ম ধরে এটি অনিয়ন্ত্রিত থাকে তবে ‘এমএডি’ পুরো ইন্টারনেট ডেটাড় গুণমান ও বৈচিত্র্যকে বিকৃত করতে পারে। সংক্ষেপে, অনিবার্যভাবে অদূর ভবিষ্যতে এআই ‘অটোফ্যাজি’ থেকে কিছু অনাকাঙ্ক্ষিত পরিণতি দেখা যাবে।”
সিন্থেটিক ডেটাকে সুবিধাজনক সমাধান বলে মনে হলেও এটি সময়ের সঙ্গে সঙ্গে বিভিন্ন এআই মডেলকে বিকৃত করার ক্ষেত্রে গুরুতর ঝুঁকি তৈরি করে।
জুমবাংলা নিউজ সবার আগে পেতে Follow করুন জুমবাংলা গুগল নিউজ, জুমবাংলা টুইটার , জুমবাংলা ফেসবুক, জুমবাংলা টেলিগ্রাম এবং সাবস্ক্রাইব করুন জুমবাংলা ইউটিউব চ্যানেলে।