Lip Reading হচ্ছে একজন ব্যক্তির ঠোঁটের নড়াচড়া, Facial Expression, দাঁত এবং জিহ্বার মুভমেন্ট, বাচনভঙ্গি ইত্যাদি বিশ্লেষণ করে সে কী বোঝাতে চাচ্ছে সেটা অনুধাবন করতে পারা। Lip Reading কে একটি আর্ট হিসেবে গণ্য করা হয়।
ষোড়শ শতাব্দী থেকেই অনেক ব্যক্তি এটিকে আর্ট হিসেবে চর্চা করে আসছেন। Lip Reading বিষয়ে কয়েকটি গবেষণা পরিচালনা করা হয়। গবেষণায় দেখা যায় যে মানুষ এখানে মাত্র বিশ শতাংশ শব্দ বা বাক্য অনুধাবন করতে সক্ষম হয়। অন্য একটি গবেষণায় দেখাতে চাই যে প্রতি ১২টি শব্দের মধ্যে মাত্র পাঁচ থেকে ছয়টি শব্দ Lip Reading এর মাধ্যমে পরিষ্কার বুঝতে পারে মানুষ।
Lip Reading এর সময় মানুষের কথা বলার Tone এবং Pitch ধরতে পারাটা বেশ কঠিন। একই শব্দ দিয়ে অনেক সময় ভিন্ন অর্থ প্রকাশ করা সম্ভব।
ইরানের একটি বিশ্ববিদ্যালয়ের গবেষকরা জানান যে Lip Reading এর সময় আর্টিফিশিয়াল ইন্টেলিজেন্স সিস্টেম ভিজুয়াল ইনফরমেশনকে শব্দে রূপান্তর করে। অন্যদিকে মানুষ প্রত্যেকটি শব্দ বুঝতে পারে না। তাই সে সারাংশ করার চেষ্টা করে।
মেশিনের মাধ্যমে Lip Reading বেশ চ্যালেঞ্জিং। কেননা AI যদি সাবজেক্টের পজিশন এবং Motion এর তথ্য ঠিকমত বুঝতে না পারে তাহলে ফলাফল ভিন্ন আসতে পারে।
এ AI সাবজেক্টের ভিডিওকে অনেকগুলি ইমেজে বিভক্ত করে। এরপর প্রত্যেকটি ইমেজ বিশ্লেষণ করে তথ্য প্রদান করে থাকে।
AI ভিসুয়াল স্পিচ রিকগনেশন এবং অটোমেটেড স্পিচ রিকগনেশন সিস্টেমের মধ্যে সমন্বয় করতে পারে। বর্তমানে অটোমেটেড স্পিচ রিকগনেশন পদ্ধতি নিয়ে গবেষণা অনেক দূর এগোতে সক্ষম হয়েছে। অন্যদিকে ভিসুয়াল স্পিচ রিকগনেশন সিস্টেম নিয়ে এখনো অনেক দূর পর্যন্ত স্টাডি করা বাকি।
মেশিনের মধ্যে Lip Reading এনালাইসিস করার পুরো মডেল সেট করা সময় সাপেক্ষ ব্যাপার। ভবিষ্যতে মানুষ থেকে আর্টিফিশিয়াল ইন্টেলিজেন্স সিস্টেম Lip Reading এ ভালো পারফর্ম করবে।
আপনি চিন্তা করে দেখুন যে অন্য মানুষ কী বোঝাতে চাইছে সেটা যদি আপনি খুব সহজে AI এর মাধ্যমে অনুধাবন করতে পারেন তাহলে আপনার জীবন আগের থেকে অনেক বেশি সহজ হয়ে যাবে। হয়তো অদূর ভবিষ্যৎ এ মানুষের সাথে কথা না বলে সরাসরি এক ব্রেইন থেকে অন্য ব্রেইনের সাথে যোগাযোগ স্থাপন করে ভাষা অনুধাবন করা সম্ভব হবে।
জুমবাংলা নিউজ সবার আগে পেতে Follow করুন জুমবাংলা গুগল নিউজ, জুমবাংলা টুইটার , জুমবাংলা ফেসবুক, জুমবাংলা টেলিগ্রাম এবং সাবস্ক্রাইব করুন জুমবাংলা ইউটিউব চ্যানেলে।