Mengapa Generator Gambar-ke-Teks Baru Sebuah Home Run Aksesibilitas

  • Alat baru Midjourney dapat membuat deskripsi yang kaya dari gambar.
  • Deskripsi teks diperlukan untuk perangkat lunak pembaca layar yang digunakan oleh orang buta dan tunanetra.
  • AI dapat membuka lebih banyak area aksesibilitas.

Gambar Pexels / Mockup



Alih-alih mengubah prompt teks menjadi gambar, perusahaan pembuat gambar AI Midjourney sekarang dapat mengubah gambar menjadi teks.


Ayo pergi sekarang AI memberikan sentuhan cerdas pada perangkat lunak gambarnyamenggunakan algoritme pembelajaran mesin yang kuat untuk menghasilkan teks dari gambar yang ada. Sejak saat itu, gambar individu dapat membuat gambar bergerak menjadi sangat mudah dan benar-benar mengubah permainan bagi penyandang tunanetra dalam hal gambar.


“Media gambar baru untuk pembuat teks merupakan pengembangan utama dalam aksesibilitas. Teknologi ini memungkinkan orang tunanetra untuk mengalami konten visual dengan cara imajinatif dengan menghasilkan deskripsi gambar yang sebelumnya tidak dapat diakses oleh mereka. Ini berarti bahwa orang yang buta atau memiliki keterbatasan vision sekarang dapat berpartisipasi penuh dalam konten visual, seperti media sosial, artikel web, dan bahkan belanja online.” Dan Trichterkoperator Pemeriksa Aksesibilitasmereka memberi tahu Lifewire melalui email.



Deskripsi Gambar Bagus Penting

Jika Anda memposting gambar di Twitter atau Mastodon, gambar tersebut tidak dapat dilihat oleh siapa pun yang tidak dapat melihatnya. Praktik terbaik adalah mendeskripsikan gambar dan menambahkan deskripsi tersebut ke gambar sebagai elemen “alt” yang mengaitkan deskripsi dengan gambar. Deskripsi ini kemudian dapat digunakan oleh perangkat lunak aksesibilitas.



Pembaca terpasang di layar iPhone, misalnya, berbicara dengan pengguna untuk menunjukkan apa yang sedang dilewati jari, dari tombol dan kontrol lain hingga teks dan, tentu saja, deskripsi gambar.


“Memiliki deskripsi gambar yang baik penting untuk aksesibilitas, karena memberikan kesempatan yang sama untuk semua konten untuk dipahami dan dinikmati. Tanpa deskripsi, tunanetra akan dikecualikan dari informasi visual, membatasi akses ke informasi, hiburan, dan interaksi sosial,” kata Trichter.


Tentu saja, hampir tidak ada orang yang menambahkan deskripsi ini. Bahkan di Mastodon, di mana perangkat lunak memudahkan untuk meningkatkannya dan, dalam banyak kasus, bahkan menyarankan Anda melakukannya, itu tetap merupakan upaya. Dan sejujurnya, itu adalah sesuatu yang tidak boleh dilakukan orang. Jenis pekerjaan ini harus dilakukan oleh komputer, kecuali sampai sekarang belum begitu bagus.


Jika alat gambar-ke-teks baru Midjourney dapat dengan mudah dimasukkan ke dalam aplikasi media sosial, mesin blog seperti WordPress, dan bahkan aplikasi perpustakaan foto seperti yang ada di ponsel kita, maka deskripsi terperinci dapat ditambahkan ke setiap foto yang Anda unggah ke Internet. secara otomatis Dan karena teks membutuhkan lebih sedikit ruang penyimpanan daripada gambar, tajuknya tidak sensitif.


Ini berarti bahwa orang-orang yang buta atau memiliki daya penglihatan rendah sekarang dapat berpartisipasi penuh dalam pengalaman visual…


Lebih Banyak Aksesibilitas AI

Keterangan gambar dapat bermanfaat untuk semua hal, bukan hanya pembaca layar. Kami sudah terbiasa mencari perpustakaan foto kami untuk anjing, sepeda, tanaman, dan sebagainya, dan setiap tahun pencarian iPhone, misalnya, tampaknya semakin menambah kedalaman pencarian ini.


Tapi bayangkan jika penelitian ini bisa menangkap celah yang sama yang telah ditambahkan AI ke generasi gambar di tahun lalu. Foto Anda berisi deskripsi yang mendalam dan mendetail, jadi Anda tidak perlu menelusuri ribuan foto lagi untuk menemukan hidangan pasta luar biasa yang pernah Anda coba. Bahkan bukan hanya dirinya sendiri. AI juga dapat membantu aksesibilitas dengan cara lain.


“Ya, AI pasti dapat membantu meningkatkan aksesibilitas dengan cara selain deskripsi gambar. Misalnya, AI dapat digunakan untuk secara otomatis menghasilkan teks untuk video yang dapat bermanfaat bagi penyandang tunarungu atau gangguan pendengaran. Proses yang dapat bermanfaat bagi orang yang mengalami kesulitan mengetik atau menggunakan mouse.” konselor pelatihan” Johnson Adegoke katanya kepada Lifewire melalui email.


Glenn Carstens-Peters / Unsplash



Sejauh ini, kami hanya melihat aspek terburuk AI dalam hal memproses atau membuat gambar, video, dan audio – memanen karya berhak cipta tanpa izin pencipta dan menggunakannya untuk membuat pencipta kehilangan pekerjaannya. Tetapi jenis alat AI yang sama, seperti yang telah kita lihat, juga dapat memiliki kegunaan yang baik dan sah.


Satu harapan adalah Apple, yang memiliki alat aksesibilitas yang sangat baik melalui tabletnya, akan membangun sesuatu yang mirip dengan suaranya melalui alat, menghasilkan deskripsi gambar dengan cepat.


Manfaat aktivitas AI jelas dan mendalam. Sayang sekali kita membiarkan diri kita bergaul dengan semua hal baik lainnya.

Source link