OpenAI telah mulai meninjau alat baru bernama Operator yang dapat bernavigasi di dalam browser web. Menurut postingan blog diterbitkan hari Kamisperangkat lunak ini didukung oleh apa yang oleh perusahaan disebut Agen Penggunaan Komputer. “CUA dilatih untuk berinteraksi dengan antarmuka pengguna grafis (GUI) – tombol, menu, dan bidang teks yang dilihat orang di layar – sama seperti yang dilakukan manusia,” kata OpenAI tentang model tersebut. “Hal ini memberikan fleksibilitas untuk melakukan tugas-tugas digital tanpa menggunakan API khusus OS atau web.”

Rilis Operator saat ini dibangun berdasarkan model GPT-4o OpenAI. Ini menggabungkan kemampuan visi algoritma tersebut dengan “penalaran tingkat lanjut” yang dilatih melalui pembelajaran penguatan. Operator memiliki kemampuan untuk “memecah tugas menjadi rencana multi-langkah dan secara adaptif mengoreksi diri ketika tantangan muncul.” Menurut OpenAI, kemampuan tersebut mewakili tahap selanjutnya dalam pengembangan AI.

Operator dapat berinteraksi dengan berbagai situs web, termasuk platform pemesanan Instacart.

peta instan

Seperti pratinjau penelitian sebelumnya, OpenAI memperingatkan bahwa Operator “masih dalam tahap awal dan memiliki keterbatasan,” dan bahwa ia belum “berkinerja andal dalam semua skenario.” Misalnya, bergantung pada kompleksitas tugas dan antarmuka yang terlibat, agen mendapatkan keuntungan besar jika pengguna meluangkan beberapa saat ekstra untuk menulis perintah yang lebih detail. Per TepiOperator akan memberikan kontrol kepada pengguna jika terjadi kebuntuan pada suatu tugas. Ini juga akan menyerahkan kendali kapan pun situs web meminta informasi sensitif, termasuk kredensial login. Perusahaan tersebut mengatakan bahwa mereka merancang alat tersebut untuk “menolak permintaan berbahaya dan memblokir konten yang tidak diizinkan.”

OpenAI menjadikan Operator pertama kali tersedia bagi pengguna langganan ChatGPT Pro senilai $200 per bulan. Ia juga bermitra dengan perusahaan seperti Instacart untuk menawarkan agen di platform mereka, meskipun sekali lagi Anda memerlukan langganan ChatGPT Pro untuk menguji integrasi.

Operator bergabung dengan daftar agen AI yang terus bertambah yang dapat menavigasi browser web atau seluruh sistem operasi. Anthropic adalah perusahaan pertama yang menawarkan kemampuan tersebut dengan merilis model Claude 3.5 Sonnet pada bulan Oktober, diikuti oleh Google dengan model Gemini 2.0 dan Project Mariner.

Jika Anda membeli sesuatu melalui tautan di artikel ini, kami dapat memperoleh komisi.

Sumber

Reananda Hidayat
reananda Permono reananda is an experienced Business Editor with a degree in Economics from a Completed Master’s Degree from Curtin University, Perth Australia. He is over 9 years of expertise in business journalism. Known for his analytical insight and thorough reporting, Reananda has covered key economic developments across Southeast Asia. Currently with Agen BRILink dan BRI, he is committed to delivering in-depth, accurate business news and guiding a team focused on high-quality financial and market reporting.