Google Cloud telah mengumumkan ketersediaan umum mesin virtual (VM) TPU untuk beban kerja kecerdasan buatan.
Rilis umum mencakup API penyematan TPU baru yang diklaim Google Cloud dapat mempercepat beban kerja rekomendasi dan peringkat berbasis ML skala besar
Menyematkan akselerasi dengan Cloud TPU dapat membantu bisnis mengurangi biaya yang terkait dengan kasus penggunaan peringkat dan rekomendasi yang sering mengandalkan menjalankan algoritme berbasis jaringan saraf dalam yang mahal, kata Google Cloud.
“Mereka cenderung menggunakan data dalam jumlah besar, yang bisa jadi sulit dan mahal untuk dilatih dan diterapkan menggunakan infrastruktur pembelajaran mesin tradisional,” kata Google Cloud dalam sebuah pernyataan. posting blog.
“Akselerasi embedding dengan Cloud TPU dapat mengatasi masalah ini dengan biaya lebih rendah. Embedding API dapat secara efisien memproses data dalam jumlah besar, seperti tabel yang disematkan, dengan secara otomatis membagi ratusan chip Cloud TPU dalam sebuah pod, yang semuanya melalui interkoneksi khusus. .”
Sementara itu, TPU VM dirancang untuk mendukung tiga kerangka kerja utama – TensorFlow, PyTorch, dan JAX – yang disediakan melalui tiga lingkungan untuk memfasilitasi penyiapan kerangka masing-masing.
Google Cloud menambahkan bahwa mesin virtual TPU memungkinkan pipeline data input untuk dieksekusi langsung di host TPU. Dengan fitur ini, pengguna dapat membangun operasi pelanggan mereka sendiri, seperti Teks TensorFlow, sehingga mereka tidak lagi terikat dengan rilis runtime TensorFlow.
Eksekusi lokal pada host menggunakan akselerator juga mendukung kasus penggunaan seperti pembelajaran penguatan terdistribusi.
“Dengan mesin virtual Cloud TPU, Anda dapat bekerja secara interaktif di host yang sama dengan perangkat keras TPU fisik yang terpasang,” kata Google Cloud.
“Komunitas pengguna TPU kami yang berkembang pesat telah dengan antusias mengadopsi mekanisme akses ini karena mekanisme ini tidak hanya memberikan pengalaman debug yang lebih baik, tetapi juga memungkinkan pengaturan pelatihan tertentu, seperti pembelajaran penguatan terdistribusi, yaitu Arsitektur Internet.”