Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
40_алгоритмов_Python.pdf
Скачиваний:
8
Добавлен:
07.04.2024
Размер:
13.02 Mб
Скачать

Решение NP-трудных задач

357

(если только мы не имеем дело со средой, в которой были предприняты усилия для устранения таких искажений до сбора данных).

Алгоритмическая предвзятость прямо или косвенно обусловлена человечески­ ми предубеждениями. Они могут быть отражены либо в данных, используемых алгоритмом, либо в описании самого алгоритма. Для типичного проекта машин­ ного обучения, следующего жизненному циклу CRISP-DM, который был описан в главе 6, предвзятость выглядит следующим образом (рис. 14.4).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 14.4

 

 

При снижении предвзятости труднее всего в первую очередь выявить и лока­ лизовать невольное (неосознаваемое) предубеждение.

РЕШЕНИЕ NP-ТРУДНЫХ ЗАДАЧ

NP-трудные задачи подробно обсуждались в главе 4. Некоторые задачи этого класса крайне важны, а значит, необходимо разрабатывать алгоритмы для их решения.

358

Глава 14. Практические рекомендации

Если NP-трудная задача кажется нерешаемой из-за сложности или ограничен­ ности имеющихся ресурсов, можно воспользоваться одним из следующих под­ ходов:

zz упрощение задачи;

zz адаптация известного решения аналогичной задачи; zzвероятностный метод.

Давайте рассмотрим каждый подход.

Упрощение задачи

Задачу можно упростить, приняв определенные допущения. В этом случае ре­ шение будет хотя и не идеальным, но приемлемым и все равно полезным. Что­ бы это сработало, допущения должны быть как можно менее ограничивающими.

Пример

Взаимосвязь между признаками и метками в задачах регрессии редко бывает идеально линейной. Но ее можно считать линейной в пределах нашего обычного рабочего диапазона. Такая аппроксимация значительно упрощает алгоритм

ивесьма широко применяется. Однако это отрицательно влияет на точность ал­ горитма. Нужно тщательно изучить компромисс между допущениями и точностью

ивыбрать оптимальное соотношение, подходящее для заинтересованных сторон.

Адаптация известного решения аналогичной задачи

Если существует решение похожей задачи, то его можно использовать в качестве отправной точки и адаптировать для новой задачи. Идея переноса обучения основана именно на этом принципе. Результат работы уже обученных моделей используется в качестве стартовой точки для разработки нового алгоритма.

Пример

Предположим, нам нужно обучить бинарный классификатор, который во время корпоративного обучения различает ноутбуки Apple и Windows на видеотранс­ ляции, используя распознавание объектов. На первом этапе мы научим модель определять на видео различные объекты и выявлять ноутбуки. После этого можно перейти ко второму этапу — разработке правил, которые помогут раз­ личать ноутбуки Apple и Windows.