Google Melatih Robot

Titik Kumpul Tekno – Dua ribu dua empat akan menjadi tahun besar bagi industri AI generatif/model dasar besar dan robotika. Ada banyak hype seputar potensi beragam aplikasi, mulai dari pembelajaran hingga desain produk.

Peneliti DeepMind Robotics Google adalah salah satu dari banyak tim yang mengeksplorasi potensi luar angkasa. Dikutip dari Techcrunch, tim tersebut menyoroti penelitian berkelanjutan yang dirancang untuk membantu para ahli robotik lebih memahami apa yang diinginkan manusia dari robot-robot tersebut.

Secara tradisional, robot fokus melakukan satu tugas berulang kali sepanjang hidup mereka. Robot dengan tujuan tunggal biasanya sangat baik dalam satu hal, tetapi bahkan mereka kesulitan ketika terjadi perubahan atau kesalahan acak dalam prosesnya.

AutoRT yang baru-baru ini diumumkan dirancang untuk memanfaatkan model dasar yang besar untuk berbagai tujuan. Dalam contoh standar yang diberikan oleh tim DeepMind, sistem dimulai dengan menggunakan Model Bahasa Visual (VLM) untuk kesadaran situasional yang lebih baik. 

AutoRT dapat menjalankan armada robot yang bekerja secara tandem dan dilengkapi kamera untuk memahami tata letak lingkungannya dan objek yang ada di dalamnya.

Sementara itu, model bahasa besar menyarankan tugas-tugas yang dapat diselesaikan oleh perangkat keras, termasuk pelaksana akhirnya. 

Banyak yang percaya LLM adalah kunci untuk membuka robotika yang secara efektif memahami lebih banyak perintah bahasa alami, sehingga mengurangi kebutuhan akan keterampilan coding yang sulit.

Sistem ini telah cukup banyak diuji selama tujuh bulan terakhir. AutoRT secara bersamaan dapat mengontrol 20 robot dan total 52 perangkat berbeda. Secara total, DeepMind mengumpulkan sekitar 77.000 tes, termasuk lebih dari 6.000 tugas.

Yang juga baru dari tim ini adalah RT-Trajectory, yang menggunakan input video untuk pelatihan robot. Banyak tim yang mengeksplorasi penggunaan video YouTube sebagai metode untuk melatih robot dalam skala besar, namun RT-Trajectory menambahkan lapisan yang menarik dengan melapisi video tersebut dengan sketsa tangan 2D.

Tim mencatat bahwa “lintasan ini, dalam bentuk gambar RGB, memberikan isyarat visual tingkat rendah yang praktis pada model saat model mempelajari kebijakan kendali robot.”

Menurut DeepMind, pelatihan tersebut memiliki tingkat keberhasilan dua kali lipat dari pelatihan RT-2, 63% dibandingkan dengan 29%, ketika diuji pada 41 tugas.

“RT-Trajectory memanfaatkan banyak informasi gerakan robot yang ada di semua kumpulan data robot tetapi saat ini kurang dimanfaatkan,” catat tim tersebut. 

“RT-Trajectory tidak hanya mewakili langkah lain dalam menciptakan robot yang dapat bergerak dengan presisi efisien dalam situasi baru, namun juga mengekstraksi pengetahuan dari kumpulan data yang ada,” tambahnya.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *