বাংলাদেশ-শ্রীলঙ্কা নিয়ে পুলিশের বক্তব্যের ভিডিওটি এআই প্রযুক্তিতে তৈরি
বুম বাংলাদেশ দেখেছে, আলোচ্য ভিডিওটি বাস্তব কোনো বক্তব্যের সময়ের নয় বরং এআই প্রযুক্তিতে এটি তৈরি করা হয়েছে।

সামাজিক যোগাযোগ মাধ্যম ফেসবুকে একটি ভিডিও পোস্ট করা হয়েছে। ভিডিওতে দেখা যাচ্ছে, বাংলাদেশ পুলিশের পোশাক পরা এক কর্মকর্তা বলছেন, 'শ্রীলঙ্কায় বিপ্লবের পর দুর্নীতি গায়েব আর বাংলাদেশে বিপ্লবের পর বিপ্লব নিজেই গায়েব। শ্রীলঙ্কার সরকার ছিলো চোর আর জনগণ ছিলো ভালো তাই তারা অল্প সময়ের মধ্যেই ঘুরে দাঁড়াইছে। অপরদিকে বাংলাদেশের সরকার ছিলো চোর আর জনগণ হচ্ছে ডাকাত তাই এদেশ ঘুরে দাঁড়ানোর কোনো চান্সই নেই' এরকম একটি পোস্ট দেখুন এখানে, এখানে ও এখানে।
গত ১৩ আগস্ট 'Sojol Hossain’ নামক একটি ফেসবুক পেজ থেকে ভিডিওটি পোস্ট করা হয়। পোস্টে উল্লেখ করা হয় "বাংলাদেশ ঠিক না হওয়ার এটাই মূল কারণ" পোস্টটির স্ক্রিনশট দেখুন--
ফ্যাক্ট চেক:
বুম বাংলাদেশ যাচাই করে দেখেছে, দাবিটি সঠিক নয়। ভিডিওটি বাংলাদেশ পুলিশের কোনো কর্মকর্তার বাস্তবে দেওয়া কোনো বক্তব্যের নয় বরং এআই প্রযুক্তির সহায়তায় ভিডিওটি তৈরি করা হয়েছে।
আলোচ্য ভিডিও থেকে কি-ফ্রেম নিয়ে সার্চ করে এবং ভিডিওতে প্রচারিত দাবি (বক্তব্য) সরাসরি সার্চ করে গণমাধ্যম সহ গ্রহণযোগ্য কোনো মাধ্যমে কোনো উল্লেখযোগ্য তথ্য পাওয়া যায়নি।
পরবর্তীতে ভিডিওটি পর্যবেক্ষণ করে কিছু অসঙ্গতি পাওয়া যায়। ভিডিওতে পোডিয়ামের পেছনে দাঁড়ানো পুলিশ সদস্যের প্যান্টের রঙয়ের সাথে বাস্তবের পুলিশের পোশাকের সাথে মিল নেই। ফেসবুকে প্রচারিত ভিডিওটির স্থিরচিত্রের সাথে (বামে) বাস্তবে পুলিশের পোশাকের ছবির (ডানে) পাশাপাশি অমিল দেখুন--
ভিডিওতে বাস্তব এমন দৃশ্যের অডিওর তুলনায় ভিডিওটিতে কথা বলার সাউন্ড কিছুটা অস্বাভাবিক মনে হয়েছে। সম্প্রতি সাধারণত গুগলের ভিও-৩ মডেল ব্যবহার করে তৈরি করা এআই ভিডিওতে অডিওর এমন উচ্চতর আউটপুট শোনা যায়।
গুগল 'Veo' হলো গুগলের একটি প্রায় বাস্তবসম্মত ভিডিও জেনারেশন টুল যা গুগল ডিপমাইন্ড দ্বারা তৈরি করা হয়েছে। এটি টেক্সট-টু-ভিডিও জেনারেশন, ইমেজ-টু-ভিডিও জেনারেশন এবং সর্বশেষ সংস্করণ, ভিও-৩ ভিডিওর পাশাপাশি নেটিভ অডিও তৈরি করতে পারে।
এছাড়াও গুগলের জেনারেটিভ টুল তাদের কন্টেন্টে 'SynthID' নামক এক ধরণের ওয়াটারমার্কিং ব্যবহার করে যা শোনা যায় না বা খালি চোখে শনাক্ত করা যায়না। তবে গুগলের SynthID ডিটেকশন টুল সেটি শনাক্ত করতে পারে। এই প্রক্রিয়ায় যাচাই করলে টুলটি আলোচ্য ভিডিওর অডিওকে 'গুগলের এআই টুল দিয়ে তৈরি' বলে ফলাফল দিয়েছে। দেখুন--
অডিওতে 'SynthID' শনাক্ত করলেও টুলটি ভিডিওতে 'SynthID' শনাক্ত করতে পারেনি। সাধারণত একটি ভিও-জেনারেটেড ভিডিওর কোয়ালিটি বিভিন্ন কারণে স্বাভাবিকের তুলনায় কম হয়ে গেলে কিংবা সম্পাদনার কারণে কম্প্রেস হলে অনেক ক্ষেত্রেই 'SynthID' শনাক্ত করা কঠিন হয়ে যায় কিংবা শনাক্ত হয়না।
পরবর্তীতে আরেক এআই-ডিপফেক কন্টেন্ট শনাক্তকরণ টুল 'DeepFake-o-meter'-এর মাধ্যমে যাচাই করলেও টুলটি মিশ্র প্রতিক্রিয়াযুক্ত ফলাফল দিয়েছে। টুলটির বেশকিছু ডিটেকশন মেথডের মধ্যে অধিকাংশ মেথডেই ভিডিওটি সম্ভাব্য এআই দ্বারা তৈরি বলে ফলাফল পাওয়া গেছে। দেখুন--
উল্লেখ্য ভিডিওটি নিয়ে সার্চ করে আলোচ্য ভিডিওটিকে একজন টিকটক ব্যবহারকারী কর্তৃক 'AI Lebel' যুক্ত করে পোস্ট করতে দেখা গেছে। এছাড়াও তার প্রোফাইলে দেখা যায় তিনি অনেকটা নিয়মিত এআই তৈরি ভিডিও তার অ্যাকাউন্টে প্রচার করে থাকেন। এমনকি তার টিকটক ইউজারনেম-এর সাথেও তিনি এআই শব্দটি যুক্ত করে রেখেছেন।
অর্থাৎ ভিডিওটি এআই প্রযুক্তিতে তৈরি।
সুতরাং সামাজিক মাধ্যমে এআই প্রযুক্তিতে তৈরি একটি ভিডিওকে বাস্তবে দেওয়া বক্তব্যের বলে প্রচার করা হচ্ছে; যা বিভ্রান্তিকর।