Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
40_алгоритмов_Python.pdf
Скачиваний:
10
Добавлен:
07.04.2024
Размер:
13.02 Mб
Скачать

356

Глава 14. Практические рекомендации

не доказана из-за недостатка имеющихся данных. Аналогичным образом, мож­ но найти несколько неубедительных доказательств того, что конкретный поч­ товый индекс в определенном городе с большой вероятностью причастен к мошенничеству­. Нужно крайне осторожно оценивать результаты работы ал­ горитмов, использующих такие ограниченные данные.

Решения, основанные на неубедительных доказательствах, могут при­ вести к неправомерным действиям.

Трассируемость

Разрыв между этапами обучения и тестирования в алгоритмах МО означает, что, если алгоритм наносит какой-либо вред, проблему очень трудно отследить и устранить. Кроме того, трудно определить людей, которых она затронула.

Искажения в данных

Алгоритмы — это математические формулировки, основанные на данных. Принцип

GIGO (Garbage-in, Garbage-out; «мусор на входе» = «мусор на выходе») означает, что результаты работы алгоритма надежны ровно настолько, насколько достовер­ ны входные данные. Если в данных есть искажения, это отразится и на результате.

Несправедливые результаты

Использование алгоритмов может привести к нанесению ущерба уязвимым сообществам и группам, которые уже находятся в невыгодном положении.

Кроме того, не раз было доказано, что алгоритмы распределения финансирова­ ния исследований проявляют предвзятость в пользу мужчин. Алгоритмы, ис­ пользуемые для предоставления возможности иммиграции, иногда предвзяты в отношении уязвимых групп населения.

Несмотря на использование высококачественных данных и сложных матема­ тических формулировок, результат может оказаться несправедливым. И тогда все эти усилия принесут больше вреда, чем пользы.

СНИЖЕНИЕ ПРЕДВЗЯТОСТИ В МОДЕЛЯХ

В современном мире существуют известные, документально подтвержденные общие предубеждения, основанные на поле, расе и сексуальной ориентации. Это означает, что собранные нами данные будут содержать такие предубеждения