Переводчик Google оказался сексистом

Бразильские исследователи обнаружили, что алгоритмы сервиса Google Translate предвзяты при переводе предложений с языка без грамматической категории рода. При переводе нескольких тысяч предложений с 12 таких языков на английский оказалось, что технические профессии гораздо реже относят к женщинам, чем профессии в сфере здравоохранения, сообщают СМИ. В препринте, опубликованномна arXiv, также сообщается, что распределение представителей определенного пола в профессиях не соответствует реальной статистике трудоустройства.

Ученые из Федерального университета Риу-Гранди-ду-Сул под руководством Луиса Ламба (Luis Lamb) отобрали 12 языков, в которых отсутствует грамматическая категория рода (среди них — венгерский, финский, суахили, йоруба, армянский и эстонский), и составили несколько предложений формата «X is a Y», где X — местоимение третьего лица, а Y — существительное, выражающее профессию. Во всех выбранных языках местоимение третьего лица выражается единым словом (гендерно-нейтральным): к примеру, в эстонском и «он», и «она» переводится как «ta», а в венгерском — «ő». Выбранные существительные также были безродовыми: среди них были такие профессии как «врач», «программист» и «организатор свадеб». Всего исследователи использовали 1019 профессий из 22 разных категорий. Полученные предложения перевели на английский язык.

Исследователи заметили, что предложения с невыраженным родом Google Translate переводит по-разному: к примеру, фразу «ő egy ápoló» («он/она медсестра/медбрат») сервис перевел как «she is a nurse», а вот «ő egy tudós» («он/она ученый») как «he is a scientist».

Поделиться