Bagaimana internet akan berkembang dalam beberapa dekade mendatang?

Penulis fiksi telah menjajaki beberapa kemungkinan.

Dalam novelnya tahun 2019 “Jatuh”penulis fiksi ilmiah Neal Stephenson membayangkan masa depan di mana internet masih ada. Namun media ini sudah sangat tercemar dengan informasi yang salah, disinformasi, dan iklan sehingga sebagian besar media tersebut tidak dapat digunakan lagi.

Karakter dalam novel Stephenson mengatasi masalah ini dengan berlangganan “aliran edit” – berita dan informasi pilihan manusia yang dianggap dapat dipercaya.

Kelemahannya adalah hanya orang kaya yang mampu membeli layanan yang dipesan khusus tersebut, sehingga sebagian besar umat manusia mengonsumsi konten online berkualitas rendah dan tidak dikurasi.

Sampai batas tertentu, hal ini telah terjadi: Banyak organisasi berita, seperti The New York Times dan The Wall Street Journal, telah menempatkan konten hasil kurasi mereka di balik penghalang berbayar. Sementara itu, misinformasi semakin parah di platform media sosial seperti X dan TikTok.

Rekor Stephenson sebagai peramal sangat mengesankan – dia mengantisipasi metaverse dalam novelnya tahun 1992 “Kecelakaan Salju,” dan elemen plot utama dari “Zaman Berlian,” dirilis pada tahun 1995, adalah primer interaktif yang berfungsi mirip dengan chatbot.

Di permukaan, chatbots tampaknya memberikan solusi terhadap epidemi misinformasi. Dengan menyebarkan konten faktual, chatbots dapat menyediakan sumber alternatif informasi berkualitas tinggi yang tidak dibatasi oleh paywall.

Ironisnya, keluaran dari chatbot ini mungkin merupakan bahaya terbesar bagi masa depan web – hal yang telah diisyaratkan beberapa dekade sebelumnya oleh penulis asal Argentina. Jorge Luis Borges.

Munculnya chatbot

Saat ini, sebagian besar konten di internet masih memuat konten yang faktual dan seolah-olah benar, seperti artikel dan buku yang telah melalui tinjauan sejawat, pemeriksaan fakta, atau pemeriksaan dengan cara tertentu.

Pengembang model bahasa besar, atau LLM – mesin yang menggerakkan bot seperti ChatGPT, Copilot, dan Gemini – telah memanfaatkan sumber daya ini.

Namun, untuk melakukan keajaibannya, model-model ini harus menelan jumlah yang sangat besar teks berkualitas tinggi untuk tujuan pelatihan. Sejumlah besar kata-kata yang bertele-tele telah diambil dari sumber online dan dimasukkan ke LLM yang masih baru.

Masalahnya adalah web, betapapun besarnya, merupakan sumber daya yang terbatas. Teks berkualitas tinggi yang belum ditambang adalah menjadi langkamengarah pada apa yang The New York Times sebut sebagai “munculnya krisis konten.”

Hal ini memaksa perusahaan seperti OpenAI untuk melakukannya mengadakan perjanjian dengan penerbit untuk mendapatkan lebih banyak bahan mentah untuk bot mereka yang rakus. Namun menurut sebuah prediksi, kekurangan data pelatihan tambahan berkualitas tinggi mungkin akan terjadi pada awal tahun 2026.

Ketika keluaran chatbots berakhir online, teks-teks generasi kedua ini – lengkap dengan informasi buatan yang disebut “halusinasi,” serta kesalahan langsung, seperti saran untuk menempelkan lem pada pizza Anda – akan semakin mencemari web.

Dan jika chatbot bergaul dengan orang-orang yang salah secara online, chatbot tersebut dapat menangkap pandangan buruk mereka. Microsoft menemukan hal ini dengan susah payah pada tahun 2016, ketika itu harus menghentikan Taybot yang mulai berulang konten rasis dan seksis.

Seiring waktu, semua masalah ini dapat membuat konten online menjadi seimbang kurang dapat dipercaya dan kurang berguna dibandingkan saat ini. Selain itu, LLM yang diberi diet rendah kalori dapat menghasilkan keluaran yang lebih bermasalah yang juga berakhir di web.

Perpustakaan yang tak terbatas − dan tidak berguna

Tidak sulit untuk membayangkan putaran umpan balik yang menghasilkan proses degradasi yang berkelanjutan ketika bot memakan keluaran mereka yang tidak sempurna.

Makalah Juli 2024 diterbitkan di Nature mengeksplorasi konsekuensi dari pelatihan model AI pada data yang dihasilkan secara rekursif. Hal ini menunjukkan bahwa “cacat yang tidak dapat diperbaiki” dapat menyebabkan “keruntuhan model” untuk sistem yang dilatih dengan cara ini – seperti salinan gambar dan salinan dari salinan itu, dan salinan dari salinan itu, akan kehilangan keakuratannya terhadap gambar aslinya.

Seberapa buruk hal ini bisa terjadi?

Pertimbangkan cerita pendek Borges tahun 1941 “Perpustakaan Babel.” Lima puluh tahun sebelum ilmuwan komputer Tim Berners-Lee menciptakan arsitektur untuk web, Borges sudah membayangkan padanan analognya.

Dalam ceritanya yang terdiri dari 3.000 kata, penulis membayangkan sebuah dunia yang terdiri dari ruangan-ruangan heksagonal yang jumlahnya sangat besar dan mungkin tak terbatas. Rak buku di setiap ruangan memiliki volume seragam yang, menurut intuisi penghuninya, harus berisi setiap kemungkinan permutasi huruf dalam alfabet mereka.

Dalam perpustakaan konten imajiner Borges yang luas dan tak ada habisnya, menemukan sesuatu yang bermakna seperti menemukan jarum di tumpukan jerami.
gambar tayang/Momen melalui Getty Images

Pada awalnya, kesadaran ini memicu kegembiraan: Berdasarkan definisinya, harus ada buku yang memerinci masa depan umat manusia dan makna kehidupan.

Penduduk mencari buku-buku seperti itu, hanya untuk menemukan bahwa sebagian besar hanya berisi kombinasi huruf yang tidak berarti. Kebenarannya ada di luar sana – namun begitu pula segala kepalsuan yang bisa dibayangkan. Dan semua itu tertanam dalam omong kosong yang jumlahnya sangat banyak.

Bahkan setelah pencarian selama berabad-abad, hanya sedikit fragmen bermakna yang ditemukan. Meski begitu, tidak ada cara untuk menentukan apakah teks-teks yang koheren ini benar atau bohong. Harapan berubah menjadi keputusasaan.

Akankah web menjadi sangat tercemar sehingga hanya orang kaya yang mampu mendapatkan informasi yang akurat dan dapat dipercaya? Atau akankah chatbot yang jumlahnya tak terhingga menghasilkan begitu banyak kata-kata kotor sehingga menemukan informasi akurat secara online seperti mencari jarum di tumpukan jerami?

Internet sering digambarkan sebagai salah satu pencapaian besar umat manusia. Namun seperti sumber daya lainnya, penting untuk memikirkan secara serius bagaimana sumber daya tersebut dipelihara dan dikelola – jangan sampai kita menghadapi visi distopia yang dibayangkan oleh Borges.

Sumber

Krystian Wiśniewski
Krystian Wiśniewski is a dedicated Sports Reporter and Editor with a degree in Sports Journalism from He graduated with a degree in Journalism from the University of Warsaw. Bringing over 14 years of international reporting experience, Krystian has covered major sports events across Europe, Asia, and the United States of America. Known for his dynamic storytelling and in-depth analysis, he is passionate about capturing the excitement of sports for global audiences and currently leads sports coverage and editorial projects at Agen BRILink dan BRI.