ছবির ভেতরে সঠিকভাবে লেখা উপস্থাপনের ক্ষেত্রে বড় অগ্রগতি এসেছে। নতুন ‘ইমেজেস ২.০’ মডেলের মাধ্যমে এখন এমন ছবি তৈরি করা সম্ভব, যেখানে লেখাও প্রায় নিখুঁতভাবে ফুটে ওঠে। আগে এটি কৃত্রিম বুদ্ধিমত্তার জন্য একটি বড় চ্যালেঞ্জ ছিল।

প্রযুক্তিবিষয়ক এক প্রতিবেদনে বলা হয়েছে, নতুন এই মডেল দিয়ে এমন মানের লেখা তৈরি করা যায়, যা সরাসরি ব্যবহারযোগ্য। উদাহরণ হিসেবে একটি রেস্তোরাঁর মেনু তৈরি করে দেখা গেছে, সেটি বাস্তব মেনুর মতোই স্বাভাবিক ও পরিপাটি।
এর আগে ছবি তৈরির মডেলগুলো প্রধানত এমন একটি পদ্ধতি ব্যবহার করত, যেখানে এলোমেলো বিন্দু থেকে ধাপে ধাপে ছবি গঠন করা হয়। এতে বড় অবয়ব বা মূল বিষয়বস্তু ভালোভাবে তৈরি হলেও ছোট অংশগুলো—বিশেষ করে লেখা—প্রায়ই বিকৃত হয়ে যেত।
বিশেষজ্ঞদের মতে, ছবির মধ্যে লেখার অংশ খুব ছোট হওয়ায় মডেলগুলো সেটি যথাযথভাবে শিখতে পারত না। ফলে ভুল বানান বা অস্বাভাবিক শব্দ দেখা দিত।
নতুন মডেলে এই সীমাবদ্ধতা অনেকটাই কাটিয়ে ওঠা হয়েছে। এতে এমন একটি পদ্ধতি ব্যবহার করা হয়েছে, যা ভাষা প্রক্রিয়াকরণের মতো ধাপে ধাপে তথ্য তৈরি করে। ফলে ছবি তৈরির সময় লেখাসহ সূক্ষ্ম উপাদানগুলো আরও নির্ভুলভাবে ফুটে ওঠে। যদিও এই প্রযুক্তির বিস্তারিত বিষয়ে নির্মাতা প্রতিষ্ঠান কোনো নির্দিষ্ট তথ্য প্রকাশ করেনি।
নতুন মডেলে চিন্তনক্ষমতা যুক্ত করা হয়েছে বলে জানানো হয়েছে। এর ফলে এটি একটি নির্দেশনা থেকে একাধিক ছবি তৈরি করতে পারে, প্রয়োজনে তথ্য যাচাই করতে পারে এবং জটিল নকশাও তৈরি করতে সক্ষম।
এই প্রযুক্তি ব্যবহার করে বিপণনভিত্তিক ভিজ্যুয়াল, কমিকস কিংবা ব্যবহারকারী ইন্টারফেসের নকশা সহজেই তৈরি করা যায়। এমনকি জাপানি, কোরিয়ান, হিন্দি ও বাংলার মতো অ-ল্যাটিন ভাষার লেখাও তুলনামূলকভাবে ভালোভাবে উপস্থাপন করতে পারে।
তবে এর কিছু সীমাবদ্ধতাও রয়েছে। মডেলটির জ্ঞানভান্ডার ২০২৫ সালের ডিসেম্বর পর্যন্ত সীমাবদ্ধ। ফলে সাম্প্রতিক কোনো তথ্য বা ঘটনার ক্ষেত্রে এটি সব সময় নির্ভুল নাও হতে পারে।
নতুন মডেলটি আগের তুলনায় সূক্ষ্ম নির্দেশনা আরও ভালোভাবে বুঝতে পারে এবং ছোট লেখা, চিহ্ন বা জটিল বিন্যাসও যথাযথভাবে উপস্থাপন করতে সক্ষম। সর্বোচ্চ দুই হাজার পিক্সেল রেজোলিউশনের ছবি তৈরি করা সম্ভব।
আরও পড়ুনঃ স্বাস্থ্য খাতের বর্তমান সংকটে দুই সরকারের ব্যর্থতাকে দায়ী করেছেন স্বাস্থ্যমন্ত্রী
তবে এই মানের ছবি তৈরি করতে কিছুটা বেশি সময় লাগে। সাধারণ প্রশ্নের উত্তরের মতো তাৎক্ষণিক না হলেও জটিল ছবি তৈরিতে কয়েক মিনিট সময় লাগতে পারে।
ধাপে ধাপে ব্যবহারকারীরা এই সুবিধা পাবেন বলে জানানো হয়েছে। অর্থের বিনিময়ে ব্যবহৃত সংস্করণে উন্নত মানের ছবি তৈরির সুযোগ থাকবে। পাশাপাশি একটি আলাদা প্রোগ্রামিং সুবিধাও চালু করা হবে, যার খরচ ছবির মান ও রেজোলিউশনের ওপর নির্ভর করবে।
বিশ্লেষকদের মতে, এই উন্নয়ন ডিজিটাল কনটেন্ট তৈরির ক্ষেত্রে বড় পরিবর্তন আনতে পারে। এতে স্বল্প সময়ে ও কম খরচে মানসম্মত ভিজ্যুয়াল তৈরি করা সহজ হবে। তবে একই সঙ্গে কৃত্রিমভাবে তৈরি কনটেন্ট এবং বাস্তব কনটেন্টের মধ্যে পার্থক্য নির্ধারণ করাও আরও কঠিন হয়ে উঠতে পারে।
জুমবাংলা নিউজ সবার আগে পেতে Follow করুন জুমবাংলা গুগল নিউজ, জুমবাংলা টুইটার , জুমবাংলা ফেসবুক, জুমবাংলা টেলিগ্রাম এবং সাবস্ক্রাইব করুন জুমবাংলা ইউটিউব চ্যানেলে।


