OpenAI telah mulai meninjau alat baru bernama Operator yang dapat bernavigasi di dalam browser web. Menurut postingan blog diterbitkan hari Kamisperangkat lunak ini didukung oleh apa yang oleh perusahaan disebut Agen Penggunaan Komputer. “CUA dilatih untuk berinteraksi dengan antarmuka pengguna grafis (GUI) – tombol, menu, dan bidang teks yang dilihat orang di layar – sama seperti yang dilakukan manusia,” kata OpenAI tentang model tersebut. “Hal ini memberikan fleksibilitas untuk melakukan tugas-tugas digital tanpa menggunakan API khusus OS atau web.”
Rilis Operator saat ini dibangun berdasarkan model GPT-4o OpenAI. Ini menggabungkan kemampuan visi algoritma tersebut dengan “penalaran tingkat lanjut” yang dilatih melalui pembelajaran penguatan. Operator memiliki kemampuan untuk “memecah tugas menjadi rencana multi-langkah dan secara adaptif mengoreksi diri ketika tantangan muncul.” Menurut OpenAI, kemampuan tersebut mewakili tahap selanjutnya dalam pengembangan AI.
Seperti pratinjau penelitian sebelumnya, OpenAI memperingatkan bahwa Operator “masih dalam tahap awal dan memiliki keterbatasan,” dan bahwa ia belum “berkinerja andal dalam semua skenario.” Misalnya, bergantung pada kompleksitas tugas dan antarmuka yang terlibat, agen mendapatkan keuntungan besar jika pengguna meluangkan beberapa saat ekstra untuk menulis perintah yang lebih detail. Per TepiOperator akan memberikan kontrol kepada pengguna jika terjadi kebuntuan pada suatu tugas. Ini juga akan menyerahkan kendali kapan pun situs web meminta informasi sensitif, termasuk kredensial login. Perusahaan tersebut mengatakan bahwa mereka merancang alat tersebut untuk “menolak permintaan berbahaya dan memblokir konten yang tidak diizinkan.”
OpenAI menjadikan Operator pertama kali tersedia bagi pengguna langganan ChatGPT Pro senilai $200 per bulan. Ia juga bermitra dengan perusahaan seperti Instacart untuk menawarkan agen di platform mereka, meskipun sekali lagi Anda memerlukan langganan ChatGPT Pro untuk menguji integrasi.
Operator bergabung dengan daftar agen AI yang terus bertambah yang dapat menavigasi browser web atau seluruh sistem operasi. Anthropic adalah perusahaan pertama yang menawarkan kemampuan tersebut dengan merilis model Claude 3.5 Sonnet pada bulan Oktober, diikuti oleh Google dengan model Gemini 2.0 dan Project Mariner.
Jika Anda membeli sesuatu melalui tautan di artikel ini, kami dapat memperoleh komisi.