Baru-baru ini, seiring perkembangan teknologi kecerdasan buatan, kebutuhan akan data pelatihan berkualitas tinggi meningkat secara signifikan. Babel Audio di bawah David AI Labs adalah platform proyek yang berfokus pada pengumpulan data suara, yang menyediakan kumpulan data multimodal bagi para pengembang. Platform ini merekrut pekerja jarak jauh dari seluruh dunia untuk berpartisipasi dalam perekaman suara, sehingga mendorong optimalisasi model generasi dan pengenalan suara. Pola “AI kerja lepas” yang muncul ini menghadirkan peluang pendapatan yang fleksibel bagi pasar tenaga kerja; upah per jam mulai dari 17 dolar terdengar sangat menarik. Namun, model bisnis semacam ini juga disertai risiko potensial terkait penyerahan privasi data dan kurangnya perlindungan ketenagakerjaan.
Mekanisme bisnis Babel Audio dan layanan utamanya
Hanya dalam dua tahun sejak didirikan, David AI Labs berfokus pada penyediaan kumpulan data multimodal bagi pengembang model. Proyek Babel Audio di bawahnya terutama mengumpulkan data suara alami melalui skema crowdsourcing; ia memasangkan orang asing yang anonim untuk melakukan rekaman percakapan, lalu mengemas rekaman tersebut menjadi data pelatihan yang digunakan oleh perusahaan-perusahaan kecerdasan buatan. Para peserta tidak perlu memiliki latar belakang teknis yang mendalam—cukup terhubung dari jarak jauh, lalu melakukan perekaman percakapan atau penilaian sistem sesuai instruksi. Berdasarkan laporan Bloomberg, setelah pengguna mengirimkan cuplikan audio singkat, mereka dapat langsung mulai mendaftar proyek melalui proses penyaringan awal, dengan harga mulai dari upah per jam 17 dolar. Kualitas rekaman akan dinilai berdasarkan kualitas audio dan serangkaian faktor lainnya; semakin tinggi penilaiannya, semakin banyak kompensasi yang diterima pengguna, dan mereka juga dapat mengajukan proyek dengan bayaran lebih tinggi. Tujuan utamanya adalah mengisi celah teknis AI dalam memahami intonasi dan konteks melalui interaksi manusia yang nyata.
Daya dorong makro ekonomi dari ekonomi kerja lepas AI
Melatih mesin melalui percakapan dengan manusia adalah jenis pekerjaan khusus yang muncul di era kecerdasan buatan, dan permintaannya sangat besar. Dari sudut pandang ekonomi makro, kebangkitan Babel Audio mencerminkan perluasan struktural pasar penandaan data (Data Annotation). Saat ini, model bahasa besar dan teknologi generasi suara sangat bergantung pada “reinforcement learning dari umpan balik manusia (RLHF)”, untuk memastikan hasil yang sesuai dengan logika dan norma manusia. Untuk mengendalikan biaya riset dan pengembangan yang sangat besar, perusahaan teknologi memecah pekerjaan penandaan ke dalam ekosistem ekonomi kerja lepas di seluruh dunia. Melalui pola ini, perusahaan dapat memperoleh data dalam jumlah besar dengan biaya yang lebih rendah, sekaligus memastikan data memiliki keragaman lintas wilayah.
Kerja lepas AI? Dampaknya bagi pasar tenaga kerja dan para peserta
Pekerjaan lepas untuk pelatihan suara AI menawarkan pilihan kerja paruh waktu yang sangat fleksibel bagi masyarakat. Ini cocok bagi kelompok yang mencari pekerjaan jarak jauh. Namun, hubungan kerja semacam ini bersifat kontrak borongan, sehingga peserta tidak dapat menikmati perlindungan manfaat seperti asuransi kesehatan atau pesangon sebagaimana diatur dalam hukum ketenagakerjaan tradisional. Selain itu, platform sangat bergantung pada algoritma yang tidak transparan untuk menilai kualitas pekerjaan dan mendistribusikan tugas. Peserta menghadapi risiko kehilangan kelayakan untuk menerima proyek tanpa peringatan jika penilaian sistem berubah, yang menunjukkan kekurangan bawaan ekonomi kerja lepas dalam hal stabilitas pendapatan.
Pertimbangan hak privasi dan hak atas data biometrik
Pelatih audio berbasis kecerdasan buatan juga kerap menghadapi beberapa masalah kelangsungan hidup yang berkaitan dengan privasi pribadi: apakah mereka bersedia mengorbankan terlalu banyak diri mereka—yaitu suara mereka dan kisah hidup mereka—demi melatih teknologi yang mungkin menggantikan banyak mata pencaharian lain.
Saat berpartisipasi dalam proyek data suara seperti Babel Audio, penyerahan hak privasi adalah isu kunci. Berdasarkan kontrak standar yang berlaku pada platform jenis ini, pekerja biasanya harus menyetujui pemberian kepada platform hak penggunaan permanen dan bersifat global atas data biometrik seperti sidik suara (Voiceprint). Ini berarti perusahaan dapat menggunakan data untuk pelatihan komersial atau membangun model suara, tanpa perlu membayar royalti lanjutan. Di tengah tren regulasi perlindungan data yang semakin ketat, peserta perlu menilai dengan saksama potensi risiko bahwa data biometrik pribadi mereka akan digunakan secara luas saat menerima kompensasi jangka pendek.
Apa itu Babel Audio, yang bisa kerja lepas di tengah gelombang AI—mengobrol saja bisa dapat upah per jam 17 dolar? Artikel ini pertama kali muncul di Linked News ABMedia.