Proyek yang berakar pada kecerdasan buatan (AI) dengan cepat menjadi bagian integral dari paradigma teknologi modern, membantu proses pengambilan keputusan di berbagai industri, mulai dari keuangan hingga perawatan kesehatan. Namun, terlepas dari kemajuan yang signifikan, sistem AI bukannya tanpa kekurangan. Salah satu masalah paling kritis yang dihadapi AI saat ini adalah bias data, yang mengacu pada adanya kesalahan sistemik dalam kumpulan informasi tertentu yang mengarah pada hasil yang miring saat melatih model pembelajaran mesin.
Karena sistem AI sangat bergantung pada data; kualitas input data sangat penting karena segala jenis informasi bias dapat menyebabkan bias dalam sistem, yang selanjutnya dapat melanggengkan diskriminasi dan ketidaksetaraan dalam masyarakat. Oleh karena itu, sangat penting untuk memastikan integritas dan objektivitas data.