Google akan membentuk tim baru untuk menggarap model AI yang dapat mensimulasikan dunia fisik. Tim ini akan dipimpin oleh Tim Brooks, salah satu co-leader di generator video OpenAI, Sora, yang telah bergabung dengan Google DeepMind pada bulan Oktober lalu. Menurut Techcrunch, Brooks memiliki rencana ambisius untuk menciptakan model generatif besar-besaran yang dapat mensimulasikan dunia.
Tim baru ini akan bekerja sama dengan tim Gemini, Veo, dan Genie Google untuk menangani masalah baru yang kritis dan meningkatkan skala model ke tingkat komputasi tertinggi. Gemini adalah seri model AI andalan Google untuk menganalisis gambar dan membuat teks, sementara Veo adalah model pembuatan video milik Google sendiri. Sedangkan Genie adalah model AI Google untuk dunia – AI yang dapat mensimulasikan game dan lingkungan 3D secara real time.
Brooks dan timnya akan fokus pada pengembangan alat generasi interaktif real-time di atas model yang mereka bangun. Mereka juga akan belajar cara mengintegrasikan model mereka dengan model multimodal yang sudah ada seperti Gemini. Mereka percaya penskalaan pelatihan AI pada video dan data multimodal sangat penting menuju kecerdasan buatan umum.
Beberapa perusahaan lain juga sedang mengejar model dunia, termasuk World Labs milik Fei-Fei Lee dan Decart dari Israel. Mereka berharap model dunia ini dapat digunakan untuk membuat media interaktif, seperti video game dan film, serta menjalankan simulasi realistis seperti lingkungan pelatihan untuk robot.
Namun, ada beberapa masalah yang harus diatasi, termasuk masalah hak cipta. Beberapa model dunia tampaknya dilatih dengan klip-klip permainan video game tanpa lisensi, yang dapat menimbulkan masalah hukum bagi perusahaan yang mengembangkannya. Google, melalui YouTube, mengklaim memiliki izin untuk melatih model mereka di video YouTube sesuai dengan persyaratan layanan platform tersebut.
Para pekerja kreatif memiliki pendapat yang beragam tentang teknologi ini. Sebuah studi pada tahun 2024 memperkirakan bahwa lebih dari 100.000 pekerjaan di bidang film, televisi, dan animasi di Amerika Serikat akan terganggu oleh AI pada tahun 2026. Beberapa perusahaan rintisan, seperti Odyssey, berjanji untuk berkolaborasi dengan para profesional kreatif daripada menggantikan mereka.
Kita harus menunggu dan melihat apakah Google akan mengikuti jejak perusahaan lain dalam hal ini. Selain itu, perlu ada upaya untuk menyelesaikan masalah hak cipta agar pengembangan model dunia dapat berjalan lancar tanpa hambatan.