Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
40_алгоритмов_Python.pdf
Скачиваний:
9
Добавлен:
07.04.2024
Размер:
13.02 Mб
Скачать

144

Глава 5. Графовые алгоритмы

Простой анализ мошенничества

Простая техника анализа мошенничества основана на предположении, что на поведение человека влияют люди, с которыми он связан. Две вершины в сети

сбольшей вероятностью будут вести себя одинаково, если они связаны друг

сдругом.

Основываясь на этом предположении, разработаем простую методику. Нам нужно определить вероятность того, что узел a является F. Представим эту ве­ роятность как P(F/q) и вычислим ее следующим образом:

Применим это к предыдущему рисунку, где Neighborhoodn представляет собой окрестность вершины n, а w (n, nj) — вес связи между n и nj.

Кроме того, degreeq — это степень узла q. Далее вероятность рассчитывается следующим образом:

Как мы видим, вероятность того, что этот человек замешан в мошенничестве, составляет 67 %. Нам нужно задать порог. Если пороговое значение составляет 30 %, то мы можем с уверенностью пометить данную вершину как F.

Обратите внимание, что этот процесс необходимо повторять для каждой новой вершины в сети.

Теперь рассмотрим продвинутый способ анализа мошенничества.

Анализ мошенничества методом сторожевой башни

Простой метод анализа мошенничества, представленный ранее, имеет два огра­ ничения:

zz Он не оценивает важности каждой вершины в социальной сети. Отношения с человеком, находящимся в центре сети, означают более высокую степень вовлеченности в мошенничество, нежели отношения с человеком на пери­ ферии сети.

Практический пример — выявление мошенничества

145

zzКогда мы помечаем кого-то как вовлеченного в известный случай мошенни­ чества в существующей сети, мы не учитываем тяжесть преступления.

Методология анализа мошенничества по принципу сторожевой башни устра­ няет эти два ограничения. Прежде всего рассмотрим две концепции.

Оценка негативного воздействия

Если человек причастен к мошенничеству, считается, что с этим человеком связано негативное воздействие (negative outcome). Не каждое негативное воз­ действие одинаково серьезно или опасно. Человек, который выдает себя за другого, оказывает более серьезное негативное воздействие по сравнению с тем, кто просто пытается использовать просроченную подарочную карту на 20 дол­ ларов.

Мы будем оценивать негативное воздействие баллами от 1 до 10 следующим образом (табл. 5.1).

Таблица 5.1

Негативное воздействие

Оценка негативного воздействия

 

 

Выдача себя за другого

10

 

 

Причастность к краже кредитных карт

8

 

 

Отправка поддельного чека

7

 

 

Судимость

6

 

 

Отсутствие судимости

0

 

 

Наша оценка основывается на ретроспективном анализе случаев мошенничества и их последствий.

Степень подозрения (DOS)

Степень подозрения (degree of suspicion, DOS) количественно определяет веро­ ятность причастности человека к мошенничеству. Нулевое значение DOS озна­ чает низкую вероятность совершения преступления человеком, а значение DOS, равное 9, — высокую вероятность.

Анализ исторических данных показывает, что профессиональные мошенники занимают важное положение в собственных социальных сетях. Чтобы учесть этот факт, мы вычислим все четыре показателя центральности для каждой вер­

146

Глава 5. Графовые алгоритмы

шины в нашей сети. Затем мы возьмем среднее значение этих вершин. Это и будет показывать важность конкретного человека в сети.

Если человек, связанный с вершиной, замешан в мошенничестве, мы проиллю­ стрируем негативное воздействие, оценив его с помощью заранее определенных значений из таблицы выше (табл. 5.1). Это делается для того, чтобы тяжесть преступления отражалась в значении каждого отдельного DOS.

Наконец, чтобы получить значение DOS‚ перемножим среднее значение пока­ зателей центральности и оценку негативного воздействия. Нормализуем DOS, разделив его на максимальное значение DOS в сети.

Давайте рассчитаем DOS для каждой из девяти вершин указанной сети (табл. 5.2).

Таблица 5.2

 

Вер-

Вер-

Вер-

Вер-

Вер-

Вер-

Вер-

Вер-

Вер-

 

ши-

ши-

ши-

ши-

ши-

ши-

ши-

ши-

ши-

 

на 1

на 2

на 3

на 4

на 5

на 6

на 7

на 8

на 9

 

 

 

 

 

 

 

 

 

 

Степень

0.25

0.5

0.25

0.25

0.25

0.13

0.63

0.13

0.13

центрально­

 

 

 

 

 

 

 

 

 

сти

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Посредниче­

0.25

0.47

0

0

0

0

0.71

0

0

ство

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Близость

0.5

0.61

0.53

0.47

0.47

0.34

0.72

0.4

0.4

 

 

 

 

 

 

 

 

 

 

Влиятель­

0.24

0.45

0.36

0.32

0.32

0.08

0.59

0.16

0.16

ность

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Среднее

0.31

0.51

0.29

0.26

0.26

0.14

0.66

0.17

0.17

значение

 

 

 

 

 

 

 

 

 

центрально­

 

 

 

 

 

 

 

 

 

сти

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Оценка

0

6

0

0

7

8

10

0

0

негативного

 

 

 

 

 

 

 

 

 

воздействия

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

DOS

0

3

0

0

1.82

1.1

6.625

0

0

 

 

 

 

 

 

 

 

 

 

Нормализо­

0

0.47

0

0

0.27

0.17

1

0

0

ванный DOS

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Каждая из вершин и ее нормализованный DOS показаны на рис. 5.20.

Практический пример — выявление мошенничества

147

 

 

 

 

 

 

 

 

DOS=0.17

 

?

 

 

 

 

6 F

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 NF

 

 

 

DOS=0.27

 

 

 

 

 

 

5 F

 

 

 

DOS=0

 

 

 

 

 

 

 

7 F

4 NF

 

 

 

 

 

 

 

 

 

 

3 NF

DOS=1 DOS=0

 

 

 

DOS=0

 

 

 

 

 

 

 

2 F

DOS=0.47

 

 

 

 

 

 

 

 

9 NF DOS=0

 

8 NF DOS=0

 

 

 

 

 

 

 

 

 

Рис. 5.20

Для расчета DOS новой добавленной вершины будем использовать следующую формулу:

Используя соответствующие значения, рассчитаем DOS:

Полученное значение указывает на риск мошенничества, связанный с новой вершиной, добавленной в систему. Это означает, что по шкале от 0 до 1 данный человек имеет значение DOS 0.42. Мы можем создать несколько подборок DOS, как показано в табл. 5.3.

Таблица 5.3

Значение DOS

Классификация риска

 

 

DOS = 0

Никакого риска

 

 

0 < DOS 0.10

Низкий риск

 

 

0.10 < DOS 0.3

Умеренный риск

 

 

DOS > 0.3

Высокий риск