Google resmi memperkenalkan TPU generasi kedelapan dengan pendekatan dua chip berbeda, yaitu TPU 8t untuk training dan TPU 8i untuk inference.
Strategi ini dibuat agar performa AI lebih efisien, dengan TPU 8t fokus pada pelatihan model besar dan TPU 8i dirancang untuk menjalankan jutaan agent secara bersamaan dengan latency rendah.
TPU 8t diklaim menghadirkan hampir tiga kali performa komputasi per pod dibanding generasi sebelumnya, Ironwood. Sementara itu, TPU 8i mampu menghubungkan hingga 1.152 TPU dalam satu pod untuk throughput besar dengan biaya lebih efisien.
Google menyebut chip baru ini menjadi bagian penting dari AI stack mereka, mulai dari hardware, model, developer tools, hingga aplikasi enterprise.