Навукоўцы высветлілі, што сістэмы распазнання мовы найбуйнейшых кампаній апрацоўваюць гаворку цемнаскурых амерыканцаў горш, чым светласкурых, а мужчын-афраамерыканцаў горш, чым жанчын. Гэта звязана з асаблівасцямі афраамерыканскай англійскай мовы: алгарытмы горш настроены на разуменне асаблівасцяў вымаўлення і інтанацыі гэтага дыялекту, лічаць аўтары працы. Артыкул апублікаваны ў часопісе Proceedings of the National Academy of Sciences.
Сістэмы распазнання мовы павінны быць даступнымі і універсальнымі. Для гэтага неабходна навучаць алгарытмы на узорах слоў людзей усіх папуляцыі ў роўнай меры, аднак гэта не заўсёды ўдаецца, і любыя віды дыскрымінацыі, якія ўзнікаюць у выніку нераўнамернасці зыходных дадзеных, становяцца прыкметнымі, а часам і небяспечнымі. Так, некаторыя даследчыкі адзначаюць расавую няроўнасць у сістэмах распазнання асоб, ацэнкі рызыкі ў крымінальным правасуддзі, рэкламы ў інтэрнэце. Існуюць падазрэнні і аб расавай дыскрымінацыі ў распазнанні мовы, так як для кожнай мовы існуе мноства дыялектаў і акцэнтаў, якія ўплываюць на якасць распазнавання.
Элісан Коенеке (Allison Koenecke) з Стэнфардскага універсітэта і яе калегі ацанілі расавую няроўнасць у сістэмах распазнання прамовы пяці кампаній: Amazon, Apple, Google, IBM і Microsoft. Для гэтага алгарытмы ўжылі да ўзораў мовы з шырокіх зборнікаў інтэрв’ю цемнаскурых і светласкурых амерыканцаў. Тэкст, што яны атрымалі ў выніку аўтаматычнага распазнавання, параўналі з расшыфроўкай экспертаў і падлічылі частату памылак.
Навукоўцы ацанілі, наколькі ўзровень памылак распазнання звязаны з дыялектам будуць размаўляць. Ва ўзорах прамовы падлічылі частату сустракаемасці фанетычных і граматычных асаблівасцяў афраамерыканскай разнавіднасці англійскай мовы.
Каб зразумець, у чым прычына расавай няроўнасці, праверылі дзве гіпотэзы. Першая – што алгарытмы распазнання мовы настроены на лексіку і граматыку стандартнага ангельскай і горш даведаюцца характэрных афраамерыканскіх канструкцый.
Другая гіпотэза – што праблема заключаецца ў акустычнай адчувальнасці праграм: алгарытм ведае слова і лексічныя канструкцыі, але не можа пачуць іх
Сучасныя тэхналогіі часта аказваюцца ў цэнтры спрэчак аб паліткарэктнасці. Так, навукоўцы заўважылі, што ў цёмнага робата людзі страляюць больш рашуча, чым у светлага, а алгарытмы машыннага навучання пераймаюць ад людзей шавіністычныя схільнасці.