Ngademin Pegiat Teknologi

AI: Pola tidak ada dalam data, mereka ada di mesin

4 min read

ai pola tidak ada dalam data mereka ada di mesin
b21c7d8b-5465-4ff6-ad1e-a3aa0de5af4e.jpg

Jaringan saraf mengubah input (lingkaran di sebelah kiri) menjadi output di sebelah kanan. Bagaimana ini terjadi adalah transformasi dari bobot, pusat, dan pola yang sering membingungkan data itu sendiri.

Tiernan Ray untuk ZDNET

Ini adalah fenomena umum dari kecerdasan buatan untuk mengatakan bahwa pembelajaran mesin bergantung pada sejumlah besar data dan bekerja dengan mencari pola dalam data.

Faktanya, frasa “menemukan pola dalam data” telah menjadi pokok dalam hal-hal seperti penambangan data dan penemuan pengetahuan selama bertahun-tahun, dan diperkirakan bahwa pembelajaran mesin, terutama varian pembelajaran mendalamnya, melanjutkan tradisi menemukan pola ini .

Program AI memang menghasilkan pola, tetapi sama seperti kesalahan Brutus tidak terletak pada bintang kita tetapi pada diri kita sendiri, fakta dari pola itu tidak terletak pada data, tetapi program AI membuat data.

Hampir semua model pembelajaran mesin bekerja melalui aturan pembelajaran yang mengubah apa yang disebut bobot (juga disebut parameter) dari suatu program karena program tersebut diberi contoh data, dan mungkin label yang dilampirkan pada data tersebut. Nilai bobot dianggap “tahu” atau “mengerti”.

Pola yang ditemukan sebenarnya adalah pola bagaimana bobot berubah.Bobot mensimulasikan bagaimana neuron nyata dianggap “menyala”, sebuah prinsip yang dikembangkan oleh psikolog Donald O. Hebb, yang kemudian dikenal sebagai Belajar Herbalgagasan “neuron yang menyala bersama, terhubung bersama”.

Juga: Kecerdasan Buatan dalam 60 Detik

Pola perubahan bobot adalah model pembelajaran dan pemahaman dalam pembelajaran mesin, seperti yang ditekankan oleh para pendiri deep learning. Seperti yang diungkapkan hampir empat dekade lalu, dalam Parallel Distributed Processing Volume 1, salah satu teks dasar pembelajaran mendalam, James McClelland, David Rumelhart, dan Geoffrey Hinton menulis:

Yang tersimpan adalah kekuatan koneksi antar sel yang memungkinkan terciptanya pola-pola ini […] Jika pengetahuan adalah kekuatan koneksi, maka pembelajaran harus menemukan kekuatan koneksi yang tepat untuk menghasilkan pola aktivasi yang tepat dalam konteks yang tepat.

McClelland, Rumelhart, dan Hinton menulis untuk audiens tertentu, psikolog kognitif, dan ilmuwan komputer, dan mereka menulis di era yang sangat berbeda ketika orang tidak akan dengan mudah berasumsi bahwa segala sesuatu yang dilakukan komputer mewakili “pengetahuan”. Mereka bekerja pada saat program kecerdasan buatan tidak bisa berbuat banyak, dan mereka sebagian besar prihatin dengan bagaimana menghasilkan komputasi, komputasi apapun, dari pengaturan transistor yang cukup terbatas.

Kemudian, dengan munculnya chip GPU yang kuat sekitar 16 tahun yang lalu, komputer mulai menghasilkan perilaku yang menarik, dan kinerja penting ImageNet yang berkolaborasi dengan Hinton dengan mahasiswa pascasarjananya pada tahun 2012 menandai pematangan pembelajaran yang mendalam.

Karena pencapaian komputer baru, pemikiran populer mulai membangun berbagai mitos seputar kecerdasan buatan dan pembelajaran mendalam. Ada banyak berita utama yang sangat buruk yang menyamakan teknologi dengan kinerja manusia super.

Juga: Mengapa laporan AI sangat buruk?

Konsep kecerdasan buatan saat ini mengaburkan apa yang menjadi perhatian McClelland, Rumelhart, dan Hinton, yang merupakan mesin, dan bagaimana ia “menciptakan” pola, sebagaimana mereka menyebutnya. Mereka sangat akrab dengan mekanisme pembobotan pola bangunan dalam menanggapi data dalam input.

Mengapa semua ini penting? Jika mesin adalah pencipta pola, sebagian besar kesimpulan yang ditarik orang tentang AI mungkin salah. Kebanyakan orang berpikir bahwa program komputer memahami pola di dunia, yang dapat membuat orang menunda penilaian ke mesin. Jika menghasilkan hasil, idenya adalah bahwa komputer harus melihat apa yang tidak bisa dilihat manusia.

Kecuali bahwa mesin yang membuat skema tidak melihat apa pun secara eksplisit. Ini membangun sebuah pola. Ini berarti “melihat” atau “mengetahui” sesuatu yang berbeda dari bahasa sehari-hari yang orang katakan mereka tahu sesuatu.

Alih-alih memulai dengan pertanyaan yang berpusat pada manusia, apa yang diketahui mesin? Lebih baik memulai dengan pertanyaan yang lebih tepat, apa yang diwakili oleh program ini dalam kaitannya dengan bobotnya?

Tergantung pada tugas, jawaban atas pertanyaan ini mengambil banyak bentuk.

Pertimbangkan visi komputer. Jaringan saraf convolutional, dasar dari program pembelajaran mesin untuk pengenalan gambar dan persepsi visual lainnya, terdiri dari serangkaian bobot yang mengukur nilai piksel dalam gambar digital.

Kisi-kisi piksel sudah menjadi sistem koordinat dua dimensi yang diterapkan di dunia nyata. Dengan abstraksi grid koordinat yang ramah mesin, tugas representasi jaringan saraf bermuara pada pencocokan intensitas kumpulan piksel ke label yang ditentukan (seperti “burung” atau “burung biru”).

Dalam adegan yang menyertakan burung, atau khususnya burung biru, banyak yang bisa terjadi, termasuk awan, sinar matahari, dan orang yang lewat. Tapi seluruh adegan tidak seperti itu. Yang penting bagi program adalah kumpulan piksel yang paling mungkin menghasilkan label yang sesuai. Dengan kata lain, pola ini adalah perilaku reduktif fokus dan seleksi yang melekat pada aktivasi koneksi jaringan saraf.

Program-program seperti itu tidak “melihat” atau “memahami”, Anda mungkin berkata, tetapi menyaring.

Juga: Eksperimen baru: Apakah AI benar-benar memahami kucing atau anjing?

Hal yang sama berlaku dalam permainan, di mana AI telah menguasai catur dan poker. Dalam permainan catur informasi lengkap, untuk program AlphaZero DeepMind, Tugas pembelajaran mesin bermuara pada membuat skor probabilitas setiap saat Potensi gerakan selanjutnya pada akhirnya dapat menghasilkan kemenangan, kekalahan, atau seri.

Karena komputer tercepat sekalipun tidak dapat menghitung jumlah potensi konfigurasi papan di masa mendatang, bobot komputer mempersingkat pencarian gerakan dengan melakukan apa yang Anda sebut peringkasan. Jika seseorang melakukan beberapa gerakan ke arah tertentu, program merangkum kemungkinan keberhasilan dan kemudian membandingkan ringkasan itu dengan ringkasan tindakan yang mungkin dilakukan ke arah lain.

Sementara keadaan papan setiap saat—posisi bidak, dan bidak yang tersisa—mungkin “berarti” bagi seorang master catur manusia, untuk AlphaZero DeepMind, untuk tugas ringkasan seperti ini, Apakah kata “rata-rata” memiliki makna apa pun tidak jelas.

Program Pluribus juga menyelesaikan tugas ringkasan serupa Menaklukkan bentuk poker tersulit di tahun 2019, Tanpa Batas Texas Hold’em. Gim ini lebih kompleks, karena menampilkan pesan tersembunyi, kartu pemain menghadap ke bawah, dan elemen gertakan “acak” tambahan. Namun, representasi ini sekali lagi merupakan ringkasan dari kemungkinan untuk setiap putaran.

Bahkan dalam bahasa manusia, apa yang ada dalam bobot berbeda dari apa yang mungkin dibayangkan oleh pengamat biasa. GPT-3 adalah program bahasa teratas OpenAI yang menghasilkan output seperti manusia yang luar biasa dalam kalimat dan paragraf.

Apakah program “tahu” bahasanya? Bobotnya mewakili kemungkinan bagaimana kata-kata individual atau bahkan seluruh string teks akan ditemukan secara berurutan dengan kata dan string lain.

Anda dapat menyebut fungsi jaringan saraf ini seperti ringkasan AlphaGo atau Pluribus, karena masalahnya sangat mirip catur atau poker. Tetapi keadaan yang mungkin direpresentasikan sebagai koneksi dalam jaringan saraf tidak hanya sangat besar, tetapi juga tidak terbatas mengingat kombinatorialitas bahasa yang tidak terbatas.

Di sisi lain, mengingat bahwa output dari program bahasa seperti GPT-3 adalah kalimat, jawaban yang ambigu daripada skor diskrit, persyaratan “jawaban yang benar” agak lebih rendah daripada persyaratan menang atau kalah dalam catur atau poker. Anda juga dapat menyebut fitur GPT-3 dan program serupa ini sebagai “indeks” atau inventaris barang dalam bobot.

Juga: apa itu GPT-3?Semua yang perlu diketahui bisnis Anda tentang program bahasa AI terobosan OpenAI

Apakah manusia memiliki daftar atau indeks bahasa yang serupa? Sejauh ini, ilmu saraf tampaknya tidak memiliki indikasi tentang hal ini.Demikian pula, dalam ekspresi beri tahu penari dari tariannya, apakah GPT-3 menemukan beberapa tingkat kepentingan dalam frasa atau asosiasi? Tidak jelas apakah pertanyaan seperti itu masuk akal dalam konteks program komputer.

Dalam setiap kasus — papan catur, kartu, rangkaian kata — data terlihat seperti ini: substrat berbentuk dibagi dalam berbagai cara, satu set produk kertas persegi panjang plastik, satu set suara atau bentuk. Apakah penemuan semacam itu “berarti” bagi komputer hanyalah cara untuk mengatakan bahwa komputer merespons penyesuaian untuk tujuan tertentu.

Apa yang disarankan oleh data di mesin—filter, ringkasan, indeks, daftar, atau cara apa pun yang Anda inginkan untuk menggambarkan representasi itu—tidak pernah merupakan hal itu sendiri. Mereka adalah penemuan.

Juga: DeepMind: Mengapa AI sangat bagus dalam bahasa?Itu bahasanya sendiri

Tapi, Anda mungkin berkata, orang melihat kepingan salju dan melihat perbedaannya, dan mereka menyortir perbedaan itu jika mereka mau. Memang benar bahwa aktivitas manusia selalu berusaha menemukan pola dengan berbagai cara. Pengamatan langsung adalah salah satu cara termudah, dan dalam arti tertentu apa yang dilakukan dalam jaringan saraf adalah perpanjangan dari itu.

Anda dapat mengatakan bahwa jaringan saraf mengungkapkan sesuatu yang telah hadir dalam aktivitas manusia selama ribuan tahun, bahwa pola adalah sesuatu yang dipaksakan pada dunia, bukan sesuatu di dunia. Di dunia, kepingan salju memiliki bentuk, tetapi bentuk itu hanyalah pola bagi orang-orang yang mengumpulkan, mengindeks, dan menyortirnya. Dengan kata lain, itu adalah konstruksi.

Karena semakin banyak program yang menggunakan data dunia dan menyesuaikan bobotnya untuk membentuk koneksi, kami berharap dapat menciptakan representasi yang berguna, aktivitas membuat pola akan meningkat secara dramatis. Representasi seperti itu bisa sangat berguna. Mereka mungkin suatu hari menyembuhkan kanker. Namun, ingatlah bahwa pola yang mereka ungkapkan tidak ada di dunia, mereka berguna di mata pengamat.

Juga: “Gato” DeepMind biasa-biasa saja, mengapa mereka membuatnya?

Ngademin Pegiat Teknologi

Google menyediakan Earth Engine untuk semua bisnis dan pemerintah

Selama dekade terakhir, para peneliti di akademisi dan organisasi nirlaba telah memperoleh akses ke informasi yang semakin kompleks tentang permukaan bumi melalui Google Earth...
Ngademin
1 min read

Google menyediakan Earth Engine untuk semua bisnis dan pemerintah

Selama dekade terakhir, para peneliti di akademisi dan organisasi nirlaba telah memperoleh akses ke informasi yang semakin kompleks tentang permukaan bumi melalui Google Earth...
Ngademin
1 min read