4 Model Generatif Baru Google Diluncurkan di Vertex AI, Siap Guncang Dunia Kreatif Digital
Google kembali membuat gebrakan di ranah kecerdasan buatan dengan memperkenalkan sejumlah model AI generatif baru di Vertex AI, termasuk Lyria, model canggih untuk menghasilkan musik dari teks. Dengan kehadiran Lyria, platform Vertex AI kini resmi menjadi yang pertama menyediakan model AI generatif untuk empat media sekaligus: video, gambar, suara, dan musik.
"Yaitu video, gambar, suara, dan musik," kata Warren Barkley, Senior Director of Product Management Google, dalam pernyataan resmi pada Rabu, 9 April 2025.
Keunggulan ini memungkinkan pengguna membuat aset produksi digital yang komplet—mulai dari teks ke gambar, lalu ke video yang sudah dilengkapi musik dan efek suara. Seluruh alur kerja kreatif kini bisa dilakukan dalam satu platform berbasis AI.
🎶 Lyria: Musik Bebas Lisensi dalam Sekejap
Model Lyria saat ini tersedia dalam versi pratinjau terbatas (allowlist). Lyria dirancang menghasilkan audio dengan fidelitas tinggi dan kaya nuansa, cocok untuk berbagai genre musik.
Pengguna cukup memberikan prompt, misalnya:
"Ciptakan musik bebop berenergi tinggi. Utamakan solo saksofon dan terompet yang memukau..."
Model akan merespons dengan musik orisinal yang sesuai dengan deskripsi—lengkap dengan piano ritmis, bass berjalan, dan suasana klub jazz malam yang intens. Lyria dinilai ideal untuk mempercepat produksi video, siniar, dan kampanye brand tanpa repot soal lisensi musik.
🎥 Veo 2: Video AI Makin Canggih
Model video Veo 2 juga mendapat peningkatan besar. Kini mendukung fitur penyuntingan otomatis seperti:
-
Inpainting: menghapus elemen dalam video secara cerdas,
-
Outpainting: memperluas frame agar sesuai berbagai format layar,
-
Kamera Preset: gerakan kamera otomatis, efek timelapse, hingga gaya drone,
-
Interpolasi: transisi mulus antar klip video.
Semua fitur tersedia dalam versi pratinjau dengan sistem allowlist.
🔊 Chirp 3: AI Suara yang Personal dan Realistis
Model audio Chirp 3 kini bisa membuat suara personal hanya dari cuplikan audio 10 detik, melalui fitur Instant Custom Voice. Cocok untuk branding suara hingga layanan pelanggan otomatis.
Ada juga fitur Transcription with Diarization yang memisahkan suara pembicara berbeda dalam satu rekaman. Saat ini, Chirp 3 mendukung lebih dari 35 bahasa dan delapan opsi suara berkualitas HD.
🖼️ Imagen 3: AI Gambar dengan Sentuhan Profesional
Model Imagen 3 juga mendapat penyempurnaan pada fitur inpainting, penghapusan objek, dan perbaikan bagian gambar rusak secara alami. Kualitas visual meningkat signifikan dibandingkan generasi sebelumnya.
🔒 Keamanan dan Etika Jadi Prioritas
Google menegaskan semua model dikembangkan dengan prinsip AI etis dan aman. Teknologi watermark digital SynthID dari DeepMind secara otomatis disematkan ke setiap hasil gambar, video, dan audio untuk mencegah penyalahgunaan.
Seluruh konten yang dihasilkan juga dilindungi dari klaim pelanggaran hak cipta pihak ketiga. "Anda dapat menggunakan konten yang dihasilkan dengan aman karena Google akan melindungi Anda dari klaim IP pihak ketiga, termasuk hak cipta," ujar Barkley.
Post a Comment