Ilustrasi, teknologi AI.(Dok. Freepik)

PROFESOR teknik elektro dan komputer, Amit Roy-Chowdhury bersama kandidat doktor Rohit Kundu, keduanya dari Fakultas Teknik Bourns di University of California Riverside (UCR), bekerja sama dengan para ilmuwan Google untuk mengembangkan model kecerdasan buatan (AI) yang mendeteksi manipulasi video.

Sistem baru mereka disebut Universal Network for Identifying Tampered and synthEtic videos (Unite), untuk mendeteksi pemalsuan yang dibuat teknologi AI dengan memeriksa tidak hanya wajah tetapi juga seluruh frame video, termasuk latar belakang dan pola gerakan.

Analisis itu menjadikannya salah satu alat pertama yang mampu mengidentifikasi video sintetis atau yang direkayasa tanpa bergantung pada konten wajah.

Baca juga : Intip Fitur MWX, Platform AI Marketplace Pertama di Dunia Buatan Indonesia

"Deepfake telah berevolusi dan deepfake bukan lagi sekadar pertukaran wajah. Orang-orang kini membuat video palsu sepenuhnya mulai dari wajah hingga latar belakang video yang menggunakan model generatif yang canggih. Sistem kami dirancang untuk menangkap semua itu," kata Kundu dikutip dari University of California pada Minggu (3/8).

Pengembangan Unite terjadi seiring dengan semakin tersedianya teknologi pembuatan teks ke video dan gambar ke video secara daring. Platform AI ini memungkinkan hampir semua orang untuk membuat video yang sangat meyakinkan, sehingga menimbulkan risiko serius bagi individu, institusi, dan demokrasi itu sendiri.

"Sungguh menakutkan betapa mudahnya alat-alat ini diakses. Siapa pun dengan keterampilan sedang dapat melewati filter keamanan dan menghasilkan video realistis dari tokoh masyarakat yang mengatakan hal-hal yang tidak pernah mereka katakan," ujar Kundu.

Baca juga : AI Disebut akan Menjadi Bagian Integral Sistem Hukum Modern di Indonesia

Kundu menjelaskan detektor deepfake sebelumnya hampir sepenuhnya berfokus pada isyarat wajah. Jika tidak ada wajah dalam bingkai, banyak detektor tidak akan berfungsi. Namun, disinformasi bisa datang dalam berbagai bentuk. Mengubah latar belakang suatu adegan dapat dengan mudah mendistorsi kebenaran.

Untuk mengatasi hal ini, Unite menggunakan model pembelajaran mendalam berbasis transformator untuk menganalisis klip video. Model ini mendeteksi inkonsistensi spasial dan temporal yang halus, isyarat yang sering terlewatkan oleh sistem sebelumnya.

Model ini memanfaatkan kerangka kerja AI dasar yang dikenal sebagai SigLIP, yang mengekstraksi fitur yang tidak terikat pada orang atau objek tertentu. Sebuah metode pelatihan baru, yang dijuluki "attention-diversity loss (kehilangan perhatian)", mendorong sistem untuk memantau beberapa area visual di setiap bingkai, mencegahnya berfokus hanya pada wajah.

Hasilnya adalah detektor universal yang mampu menandai berbagai pemalsuan, mulai dari pertukaran wajah sederhana hingga video sintetis yang rumit yang dibuat tanpa rekaman asli.

"Ini satu model yang menangani semua skenario ini. Itulah yang membuatnya universal," ucapnya.

Para peneliti mempresentasikan temuan mereka di Konferensi Computer Vision and Pattern Recognition (CVPR) 2025 di Nashville, Tennessee, Amerika Serikat.

Makalah mereka berjudul "Towards a Universal Synthetic Video Detector: From Face or Background Manipulations to Fully AI-Generated Content." Meskipun masih dalam tahap pengembangan, Unite dapat segera memainkan peran penting dalam melawan disinformasi video.

Pengguna potensialnya antara lain platform media sosial, pemeriksa fakta, dan ruang redaksi yang berupaya mencegah video manipulasi menjadi viral.

"Orang-orang berhak tahu apakah yang mereka lihat itu nyata. Seiring AI semakin mahir dalam memalsukan realitas, kita juga harus semakin mahir dalam mengungkap kebenaran," pungkasnya.