‘SORA’ নামক কৃত্রিম বুদ্ধিমত্তা কীভাবে কাজ করে এটা নিয়ে অনেকের আগ্রহ আছে। সোরা একধরনের ডিফিউশন এআই মডেল। অর্থাৎ এটি স্থির ছবি তৈরির মাধ্যমে ভিডিও বানানো শুরু করে। তারপর নির্দেশনা অনুসারে ধীরে ধীরে ছবিটিকে রূপান্তর করে ভিডিওতে। তবে সোরার একটি বৈশিষ্ট্য হলো, এটি একই সঙ্গে একাধিক স্থির ছবি—ভিডিওর ভাষায় ‘ফ্রেম’ নিয়ে কাজ করতে পারে। ফলে ফ্রেমগুলো যখন গতিশীল হয় বা বদলে যায়, তখনও ফ্রেমের বস্তুগুলো—যেমন কোনো মানুষ বা ডলফিন—বদলে যায় না, একই থাকে। অর্থাৎ এই কৃত্রিম বুদ্ধিমত্তা যথেষ্ট স্থিতিশীল ও কার্যকর।
শুধু তাই নয়, ডিফিউশন মডেলের সঙ্গে ট্রান্সফরমার আর্কিটেকচারেরও মিশেল ঘটেছে সোরায়। সহজ করে বললে, এর ফলে ট্রান্সফরমার মডেল বা আর্কিটেকচার পুরো লে-আউট বা ফ্রেম তৈরি করতে পারে ভালোভাবে, আর ডিফিউশন মডেল ডিটেলস বা খুঁটিনাটি বিষয়গুলো তুলে আনতে পারে সুন্দরভাবে।
তবে এর একটা বড় সমস্যা হলো, বাস্তব দুনিয়ার সঙ্গে এটি এখনো পুরোপুরি খাপ খাইয়ে নিতে পারেনি। যেমন কার্যকারণ ও ফলাফল—অর্থাৎ একটা কাজ হলে এর ফলে আরেকটা ঘটনা ঘটবে, এই ক্রমটা ঠিক বুঝতে পারে না সোরা। এর উদাহরণ হলো, ট্রিগার টিপলে গুলি বের হয়। সোরা এই যৌক্তিক ক্রম বুঝতে পারে না বলে গুলি ট্রিগার চাপার আগেই বেরিয়ে যেতে দেখা যেতে পারে ভিডিওতে। নিচে এরকম একটি ভিডিও দেখতে পাবেন—দেখা যাচ্ছে বাস্কেটবলের জাল বিস্ফোরিত হওয়ার পরে আবার ঠিকঠাক! অথচ এমনটা হওয়ার কথা নয়। এরকম কিছু সমস্যা এখনো রয়ে গেছে এই কৃত্রিম বুদ্ধিমত্তায়।
এটি এখনো সবার জন্য উন্মুক্ত করে দেওয়া হয়নি। তবে বেটা টেস্ট করার জন্য অনেককে দেওয়া হচ্ছে। আর এর নিরাপত্তার বিষয়গুলো নিয়ে জোরদার পদক্ষেপ নিচ্ছে ওপেন এআই। রেড টিমারদের সুযোগ দেওয়া হচ্ছে এই কৃত্রিম বুদ্ধিমত্তা পরীক্ষা করে দেখতে। রেড টিমার মানে, যারা শত্রু হিসেবে এই বুদ্ধিমত্তার সমস্যা ও দুর্বলতাগুলো বের করার চেষ্টা করবেন। বাস্তবে হ্যাকার বা এ ধরনের কেউ আক্রমণ করে বা অন্যায় ব্যবহার করে কী ধরনের সুযোগ নিতে পারে, সেগুলোই তাঁরা বের করার চেষ্টা করবেন।
পাশাপাশি সোরা দিয়ে বানানো ভিডিও শনাক্ত করার উপায় (প্রযুক্তির ভাষায়, ডিটেকশন ক্লাসিফায়ার) এবং মেটাডেটা (ভিডিও বানানোর বিস্তারিত তথ্য) যুক্ত করে দেওয়ার কথাও ভাবছে ওপেন এআই। যাঁরা ছবি নিয়ে কাজ করেন, তাঁরা হয়তো মেটাডেটার সঙ্গে পরিচিত। ছবিটি কে বানিয়েছে, এডিট করা হয়েছে কি না, তোলা ছবি হলে কোথায় তোলা হয়েছে, এডিটের সময় কী কী পরিবর্তন হয়েছে—এই সবই থাকে মেটাডেটায়।
এর মাধ্যমে কেউ যেন কাউকে হয়রানি করতে না পারেন বা ঘৃণা ছড়ানোর কাজে ব্যবহার করতে না পারেন, এ বিষয়গুলো নিয়ে ওপেন এআই প্রযুক্তিবিদ, নীতিনির্ধারক, শিল্পী ও শিক্ষকদের সঙ্গে কথা বলবে বলে জানিয়েছে।
জুমবাংলা নিউজ সবার আগে পেতে Follow করুন জুমবাংলা গুগল নিউজ, জুমবাংলা টুইটার , জুমবাংলা ফেসবুক, জুমবাংলা টেলিগ্রাম এবং সাবস্ক্রাইব করুন জুমবাংলা ইউটিউব চ্যানেলে।