সামাজিক যোগাযোগ মাধ্যম ফেসবুকে একটি ভিডিও পোস্ট করা হয়েছে। ভিডিওতে দেখা যাচ্ছে, বাংলাদেশ পুলিশের মত ইউনিফর্ম পরা এক কর্মকর্তা বলছেন, 'বিএনপি ৪০ সিট, জামাত ১৯০, এনসিপি পাবে ২০। এটা আমাদের জরিপ। মানুষ পরিবর্তন, সুশাসন ও ইসলামের শাসনের পক্ষপাতী। আর বেশি দেরি নয়, আগামী ফেব্রুয়ারিতেই কোরআনের শাসন দেখতে পারবেন আপনারা। সবাই আলহামদুলিল্লাহ পড়ে ভিডিওটা বেশি বেশি ছড়িয়ে দিন'। এরকম দুইটি পোস্ট দেখুন এখানে এবং এখানে। এর মধ্যে একটি পেজ থেকে একই বিষয়ের উপর আরো একটি ভিন্ন ভিডিও প্রকাশ করতে দেখা গেছে; দেখুন এখানে।
গত ৬ই ডিসেম্বর ‘Akhi's story’ নামক পেজ থেকে ভিডিওটি পোস্ট করা হয়। পোস্টটির স্ক্রিনশট দেখুন--
ফ্যাক্ট চেক:
বুম বাংলাদেশ যাচাই করে দেখেছে, দাবিটি সঠিক নয়। ভিডিওটি বাংলাদেশ পুলিশের কোনো কর্মকর্তার নির্বাচনের জরিপ নিয়ে বাস্তবে দেওয়া কোনো বক্তব্যের নয় বরং এআই প্রযুক্তির সহায়তায় ভিডিওটি তৈরি করা হয়েছে। পুলিশের পক্ষ থেকে অফিশিয়ালি নির্বাচন নিয়ে জরিপ করার কোনো তথ্যও নেই, কেননা নির্বাচনকেন্দ্রিক জরিপের জন্য তারা অনুমোদিতও নয়।
আলোচ্য ভিডিওটি থেকে কী-ফ্রেম নিয়ে সার্চ করে এবং ভিডিওতে প্রচারিত দাবি (বক্তব্য) সরাসরি সার্চ করে গণমাধ্যম সহ গ্রহণযোগ্য কোনো মাধ্যমে কোনো উল্লেখযোগ্য তথ্য পাওয়া যায়নি।
পরবর্তীতে ভিডিওটি পর্যবেক্ষণ করে কিছু অসঙ্গতি পাওয়া যায়। ভিডিওতে পুলিশ কর্মকর্তার পোশাক, পেছনের লোগোর সাথে বাস্তবের পুলিশের পোশাকের এবং লোগোর মিল নেই। এমনকি পুলিশ কর্মকর্তার সামনে থাকা গণমাধ্যমের মাইকের লোগো থেকে দেখা যায় যে সেখানে অস্তিত্ব নেই এমন গণমাধ্যমের মাইক দেখা যাচ্ছে। এছাড়াও পুলিশ কর্মকর্তার নেইমপ্লেটে ও পেছনের ব্যানারে অর্থহীন ও পড়া যায়না এমন শব্দ দেখা গেছে। সাধারণত এআই দিয়ে তৈরি করা কন্টেন্টে এমন অসঙ্গতি পাওয়া যায়।
ভিডিওতে বাস্তব এমন দৃশ্যের অডিওর তুলনায় বক্তার কথা বলার সাউন্ড কিছুটা অস্বাভাবিক মনে হয়েছে। গুগলের ভিও-৩ বা তার পরবর্তী সংস্করণের মডেল ব্যবহার করে তৈরি করা এআই ভিডিওতে অডিওর এমন উচ্চতর আউটপুট শোনা যায়।
গুগল 'Veo' হলো গুগলের একটি প্রায় বাস্তবসম্মত ভিডিও জেনারেশন টুল যা গুগল ডিপমাইন্ড দ্বারা তৈরি করা হয়েছে। এটি টেক্সট-টু-ভিডিও জেনারেশন, ইমেজ-টু-ভিডিও জেনারেশন এবং সর্বশেষ সংস্করণ, ভিও-৩ ভিডিওর পাশাপাশি নেটিভ অডিও তৈরি করতে পারে।
এছাড়াও গুগলের জেনারেটিভ টুল তাদের কন্টেন্টে 'SynthID' নামক এক ধরণের ওয়াটারমার্কিং ব্যবহার করে যা শোনা যায় না বা খালি চোখে শনাক্ত করা যায়না। তবে গুগলের SynthID ডিটেকশন টুল সেটি শনাক্ত করতে পারে। এই প্রক্রিয়ায় যাচাই করলে টুলটি আলোচ্য ভিডিওর অডিওকে 'গুগলের এআই টুল দিয়ে তৈরি' বলে ফলাফল দিয়েছে। দেখুন--
অডিওতে 'SynthID' শনাক্ত করলেও টুলটি ভিডিওতে 'SynthID' শনাক্ত করতে পারেনি। সাধারণত একটি ভিও-জেনারেটেড ভিডিওর কোয়ালিটি বিভিন্ন কারণে স্বাভাবিকের তুলনায় কম হয়ে গেলে কিংবা সম্পাদনার কারণে কম্প্রেস হলে অনেক ক্ষেত্রেই 'SynthID' শনাক্ত করা কঠিন হয়ে যায় কিংবা শনাক্ত হয়না। আলোচ্য ভিডিওতেও সম্পাদনা করে টেক্সট বসানোর অন্তত একটি প্রমাণ পাওয়া গেছে। আবার যেহেতু বক্তার মুখভঙ্গির সাথে অডিও তথা শব্দের উচ্চারণের মিল রয়েছে তাই বলা যায় যে ভিডিওটি এবং অডিওটি আলাদাভাবে তৈরি করে যথাযথভাবে যুক্ত করার বিষয়টিও সাধারণভাবে অসম্ভব।
পরবর্তীতে আরেক এআই-ডিপফেক কন্টেন্ট শনাক্তকরণ টুল 'DeepFake-o-meter'-এর মাধ্যমে যাচাই করলেও টুলটি মিশ্র ফলাফল দিয়েছে। টুলটির বেশকিছু ডিটেকশন মেথডের মধ্যে বেশুয়েকটি মেথডেই ভিডিওটি সম্ভাব্য এআই দ্বারা তৈরি বলে ফলাফল পাওয়া গেছে। দেখুন--
দ্বিতীয় ভিডিওটিকেও 'DeepFake-o-meter' ও 'হাইভ' টুলের মাধ্যমে যাচাই করলেও সম্ভাব্য এআই দ্বারা তৈরি বলে ফলাফল পাওয়া গেছে। দুইটি টুলের ফলাফলের কোলাজ দেখুন--
অর্থাৎ ভিডিওটি এআই প্রযুক্তিতে তৈরি।
সুতরাং সামাজিক মাধ্যমে এআই প্রযুক্তিতে তৈরি একটি ভিডিওকে বাস্তবে দেওয়া পুলিশ কর্মকর্তার বক্তব্যের বলে প্রচার করা হচ্ছে; যা বিভ্রান্তিকর।




