Google DeepMind baru saja meluncurkan pembaruan besar pada model Text-to-Speech (TTS) Gemini 2.5 Flash dan Pro, membawa kualitas audio sintetis ke tingkat yang sangat realistis.
Peningkatan ini memungkinkan Gemini 2.5 untuk menghasilkan suara yang lebih ekspresif dan mengikuti instruksi nada spesifik, serta menawarkan kontrol irama (pacing) yang presisi berdasarkan konteks pesan.
Selain itu, model ini kini unggul dalam skenario multi-karakter dan dialog, mampu mempertahankan konsistensi suara pembicara yang berbeda di 24 bahasa yang didukung, menjadikannya tools yang krusial bagi pengembang yang ingin membuat aplikasi dengan interaksi suara yang natural dan mulus.