Ketika browser menjadi medan perang berikutnya bagi AI, siapa yang akan tereliminasi?

Masa depan AI terletak pada agen yang dapat menavigasi halaman web secara mandiri. Perusahaan teknologi berinvestasi dalam pengembangan proxy browser untuk mengotomatiskan tugas web dan meningkatkan produktivitas. Artikel ini mengeksplorasi kasus penggunaan, tantangan saat ini, dan peluang yang disajikan oleh skenario Web3-native. Artikel ini ditulis oleh Mario Chow dan Figo, @IOSG, dan dikompilasi, dikompilasi, dan disumbangkan oleh BlockBeats. OpenAI Sam Altman: Saya tertarik untuk mengakuisisi Google Chrome!) Pertempuran browser terbesar di pasar yang berpartisipasi) (Latar belakang ditambahkan: Perplexity menawarkan $34,5 miliar untuk mengakuisisi browser Chrome, minion mesin pencari AI memerangi raksasa pertempuran) Selama 12 bulan terakhir, hubungan antara browser web dan otomatisasi telah berubah secara dramatis. Hampir semua perusahaan teknologi besar berebut untuk membangun (browser agent) proxy browser mereka sendiri. Mulai akhir tahun 2024, tren ini menjadi lebih jelas: OpenAI meluncurkan mode Agen pada bulan Januari, Anthropic merilis "penggunaan komputer" untuk model Claude, Google DeepMind meluncurkan Project Mariner, Opera mengumumkan browser proxy Neon, dan Perplexity AI meluncurkan browser Comet. Sinyalnya jelas: masa depan AI terletak pada agen yang dapat menavigasi halaman web secara mandiri. Tren ini bukan hanya tentang menambahkan chatbot yang lebih pintar ke browser, ini adalah perubahan mendasar dalam cara mesin berinteraksi dengan lingkungan digital. Agen browser adalah sistem AI yang "melihat" halaman web dan mengambil tindakan: mengklik tautan, mengisi formulir, menggulir halaman, memasukkan teks: seperti pengguna manusia. Model ini menjanjikan untuk membuka produktivitas dan nilai ekonomi yang sangat besar dengan mengotomatiskan tugas-tugas yang masih manual atau terlalu rumit untuk skrip tradisional. ▲ Demo GIF: Agen browser AI beraksi: ikuti petunjuk, navigasikan ke halaman kumpulan data target, ambil tangkapan layar secara otomatis dan ekstrak data yang diperlukan. Siapa yang akan memenangkan perang browser AI? Hampir semua perusahaan teknologi besar ( serta beberapa startup ) mengembangkan agen AI browser mereka sendiri. Berikut adalah beberapa proyek yang paling representatif: OpenAI – Mode Agen Mode Agen OpenAI ( sebelumnya dikenal sebagai Operator, diluncurkan pada Januari 2025 ) adalah agen AI dengan browsernya sendiri. Operator dapat menangani berbagai tugas online yang berulang: mengisi formulir web, memesan bahan makanan, menjadwalkan rapat: semuanya melalui antarmuka web standar yang biasa digunakan oleh manusia. ▲ Agen AI menjadwalkan rapat seperti asisten profesional: periksa kalender, temukan slot waktu yang tersedia, buat acara, kirim konfirmasi, dan buat dokumen .ics untuk Anda. Anthropic – "Penggunaan Komputer" Claude Pada akhir tahun 2024, Anthropic memperkenalkan fitur "Penggunaan Komputer ( )Use Komputer" baru untuk Claude 3.5, memberikannya kemampuan untuk mengoperasikan komputer dan browser seperti manusia. Claude dapat melihat layar, menggerakkan kursor, mengklik tombol, dan memasukkan teks. Ini adalah alat proxy model besar pertama dari jenisnya yang memasuki beta publik, memungkinkan pengembang untuk membiarkan Claude menavigasi situs web dan aplikasi secara otomatis. Anthropic memposisikannya sebagai fitur eksperimental dengan tujuan utama mengotomatiskan alur kerja multi-langkah di halaman web. Kebingungan – Startup Comet AI Perplexity ( terkenal dengan mesin Q&A-nya ) meluncurkan browser Comet pada pertengahan 2025 sebagai alternatif bertenaga AI untuk Chrome. Pada intinya, Comet adalah mesin pencari AI percakapan yang dibangun ke dalam (omnibox) bilah URL yang menyediakan Tanya Jawab dan ringkasan instan alih-alih tautan pencarian tradisional. Selain itu, Comet memiliki Comet Assistant bawaan, agen residen sidebar yang mengotomatiskan tugas rutin di seluruh situs. Misalnya, ini dapat meringkas pesan yang Anda buka, menjadwalkan rapat, mengelola penomoran halaman browser, atau menelusuri dan merayapi informasi web atas nama Anda. Memungkinkan agen untuk mengetahui konten web saat ini melalui antarmuka sidebar, Comet bertujuan untuk memadukan penjelajahan dengan asisten AI dengan mulus. Skenario aplikasi dunia nyata dari proxy browser Pada artikel sebelumnya, kami telah meninjau bagaimana ( perusahaan teknologi besar seperti )OpenAI, Anthropic, Perplexity, dll telah (browser proxy browser melalui berbagai bentuk produk agents) Fungsionalitas injeksi. Untuk memahami nilainya secara lebih intuitif, kita dapat melihat lebih dekat bagaimana kemampuan ini dapat diterapkan pada kehidupan sehari-hari dan alur kerja perusahaan dalam skenario dunia nyata. Otomatisasi Web Harian # E-commerce & Belanja Pribadi Skenario yang sangat praktis adalah mendelegasikan tugas belanja dan pemesanan kepada agen. Agen dapat secara otomatis mengisi keranjang belanja online Anda dan melakukan pemesanan berdasarkan daftar tetap, atau mereka dapat menemukan harga terendah di beberapa pengecer dan menyelesaikan proses checkout atas nama Anda. Untuk perjalanan, Anda dapat meminta AI untuk melakukan tugas-tugas seperti: "Pesan saya penerbangan ke Tokyo bulan depan ( tarif di bawah $800 ) dan pesan hotel dengan Wi-Fi gratis." Agen menangani seluruh proses: mencari penerbangan, membandingkan opsi, mengisi informasi penumpang, menyelesaikan reservasi hotel, semuanya melalui situs web maskapai penerbangan dan hotel. Tingkat otomatisasi ini jauh melampaui robot perjalanan yang ada: tidak hanya merekomendasikan, tetapi secara langsung mengeksekusi pembelian. # Meningkatkan efisiensi kantor Proxy mampu mengotomatiskan banyak tindakan bisnis berulang yang dilakukan orang di browser mereka. Misalnya, atur email dan ekstrak daftar tugas, atau periksa celah di beberapa kalender dan jadwalkan rapat secara otomatis. Asisten Komet Perplexity sudah dapat meringkas isi kotak masuk Anda atau menambahkan agenda untuk Anda melalui antarmuka web. Agen juga dapat masuk ke alat SaaS untuk membuat laporan rutin, memperbarui spreadsheet, atau mengirimkan formulir setelah diizinkan oleh Anda. Bayangkan seorang agen SDM yang dapat secara otomatis masuk ke papan pekerjaan yang berbeda untuk memposting pekerjaan; Atau agen penjualan yang dapat memperbarui profil prospek untuk sistem CRM. Tugas-tugas biasa ini akan menghabiskan banyak waktu karyawan, tetapi AI dapat melakukannya dengan mengotomatiskan formulir web dan tindakan halaman. Selain satu tugas, agen dapat menghubungkan alur kerja lengkap di beberapa sistem jaringan. Semua langkah ini perlu dilakukan di antarmuka web yang berbeda, yang merupakan kekuatan agen browser. Agen dapat masuk ke berbagai dasbor untuk pemecahan masalah dan bahkan mengatur proses seperti orientasi karyawan baru ( membuat ) akun di beberapa situs SaaS. Pada dasarnya, setiap operasi multi-langkah yang saat ini memerlukan klik pada beberapa situs dapat dilakukan oleh agen. Tantangan dan keterbatasan saat ini Terlepas dari potensinya, proxy browser saat ini masih jauh dari sempurna. Implementasi saat ini mengungkapkan beberapa tantangan teknis dan infrastruktur yang sudah berlangsung lama: Arsitektur tidak cocok Modern...

AGENT-5.84%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)