ছবির ভেতরে সঠিকভাবে লেখা উপস্থাপনের ক্ষেত্রে বড় অগ্রগতি এসেছে। নতুন ‘ইমেজেস ২.০’ মডেলের মাধ্যমে এখন এমন ছবি তৈরি করা সম্ভব, যেখানে লেখাও প্রায় নিখুঁতভাবে ফুটে ওঠে। আগে এটি কৃত্রিম বুদ্ধিমত্তার জন্য একটি বড় চ্যালেঞ্জ ছিল।

ওপেনএআই

Advertisement

প্রযুক্তিবিষয়ক এক প্রতিবেদনে বলা হয়েছে, নতুন এই মডেল দিয়ে এমন মানের লেখা তৈরি করা যায়, যা সরাসরি ব্যবহারযোগ্য। উদাহরণ হিসেবে একটি রেস্তোরাঁর মেনু তৈরি করে দেখা গেছে, সেটি বাস্তব মেনুর মতোই স্বাভাবিক ও পরিপাটি।

এর আগে ছবি তৈরির মডেলগুলো প্রধানত এমন একটি পদ্ধতি ব্যবহার করত, যেখানে এলোমেলো বিন্দু থেকে ধাপে ধাপে ছবি গঠন করা হয়। এতে বড় অবয়ব বা মূল বিষয়বস্তু ভালোভাবে তৈরি হলেও ছোট অংশগুলো—বিশেষ করে লেখা—প্রায়ই বিকৃত হয়ে যেত।

বিশেষজ্ঞদের মতে, ছবির মধ্যে লেখার অংশ খুব ছোট হওয়ায় মডেলগুলো সেটি যথাযথভাবে শিখতে পারত না। ফলে ভুল বানান বা অস্বাভাবিক শব্দ দেখা দিত।

নতুন মডেলে এই সীমাবদ্ধতা অনেকটাই কাটিয়ে ওঠা হয়েছে। এতে এমন একটি পদ্ধতি ব্যবহার করা হয়েছে, যা ভাষা প্রক্রিয়াকরণের মতো ধাপে ধাপে তথ্য তৈরি করে। ফলে ছবি তৈরির সময় লেখাসহ সূক্ষ্ম উপাদানগুলো আরও নির্ভুলভাবে ফুটে ওঠে। যদিও এই প্রযুক্তির বিস্তারিত বিষয়ে নির্মাতা প্রতিষ্ঠান কোনো নির্দিষ্ট তথ্য প্রকাশ করেনি।

নতুন মডেলে চিন্তনক্ষমতা যুক্ত করা হয়েছে বলে জানানো হয়েছে। এর ফলে এটি একটি নির্দেশনা থেকে একাধিক ছবি তৈরি করতে পারে, প্রয়োজনে তথ্য যাচাই করতে পারে এবং জটিল নকশাও তৈরি করতে সক্ষম।

এই প্রযুক্তি ব্যবহার করে বিপণনভিত্তিক ভিজ্যুয়াল, কমিকস কিংবা ব্যবহারকারী ইন্টারফেসের নকশা সহজেই তৈরি করা যায়। এমনকি জাপানি, কোরিয়ান, হিন্দি ও বাংলার মতো অ-ল্যাটিন ভাষার লেখাও তুলনামূলকভাবে ভালোভাবে উপস্থাপন করতে পারে।

তবে এর কিছু সীমাবদ্ধতাও রয়েছে। মডেলটির জ্ঞানভান্ডার ২০২৫ সালের ডিসেম্বর পর্যন্ত সীমাবদ্ধ। ফলে সাম্প্রতিক কোনো তথ্য বা ঘটনার ক্ষেত্রে এটি সব সময় নির্ভুল নাও হতে পারে।

নতুন মডেলটি আগের তুলনায় সূক্ষ্ম নির্দেশনা আরও ভালোভাবে বুঝতে পারে এবং ছোট লেখা, চিহ্ন বা জটিল বিন্যাসও যথাযথভাবে উপস্থাপন করতে সক্ষম। সর্বোচ্চ দুই হাজার পিক্সেল রেজোলিউশনের ছবি তৈরি করা সম্ভব।

আরও পড়ুনঃ স্বাস্থ্য খাতের বর্তমান সংকটে দুই সরকারের ব্যর্থতাকে দায়ী করেছেন স্বাস্থ্যমন্ত্রী

তবে এই মানের ছবি তৈরি করতে কিছুটা বেশি সময় লাগে। সাধারণ প্রশ্নের উত্তরের মতো তাৎক্ষণিক না হলেও জটিল ছবি তৈরিতে কয়েক মিনিট সময় লাগতে পারে।

ধাপে ধাপে ব্যবহারকারীরা এই সুবিধা পাবেন বলে জানানো হয়েছে। অর্থের বিনিময়ে ব্যবহৃত সংস্করণে উন্নত মানের ছবি তৈরির সুযোগ থাকবে। পাশাপাশি একটি আলাদা প্রোগ্রামিং সুবিধাও চালু করা হবে, যার খরচ ছবির মান ও রেজোলিউশনের ওপর নির্ভর করবে।

বিশ্লেষকদের মতে, এই উন্নয়ন ডিজিটাল কনটেন্ট তৈরির ক্ষেত্রে বড় পরিবর্তন আনতে পারে। এতে স্বল্প সময়ে ও কম খরচে মানসম্মত ভিজ্যুয়াল তৈরি করা সহজ হবে। তবে একই সঙ্গে কৃত্রিমভাবে তৈরি কনটেন্ট এবং বাস্তব কনটেন্টের মধ্যে পার্থক্য নির্ধারণ করাও আরও কঠিন হয়ে উঠতে পারে।

Zoom Bangla News
Zoom Bangla News
inews.zoombangla.com
Follow

Follow Zoom Bangla News On Google

Open the Google follow page and tap the checkmark option to receive more updates from Zoom Bangla News in your Google news feed.

Follow Zoom Bangla News On Google

Mynul Islam Nadim is a journalist at Zoom Bangla News, contributing to news writing and editorial support. He is involved in refining content to ensure accuracy, clarity, and consistency for digital platforms. His work reflects a commitment to responsible journalism and audience-focused reporting.