Добавил:

dipro Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

МИРЭА - Российский технологический университет

Предмет:

Программирование на Python

Файл:

40_алгоритмов_Python.pdf

Скачиваний:

Добавлен:

07.04.2024

Размер:

13.02 Mб

Скачать

☆

<<< < Предыдущая 31 32 33 34 35 36 37 38 39 40 41 4243 / 11143 44 45 46 47 48 49 50 51 52 53 54 55 > Следующая >>>

144	Глава 5. Графовые алгоритмы

Простой анализ мошенничества

Простая техника анализа мошенничества основана на предположении, что на поведение человека влияют люди, с которыми он связан. Две вершины в сети

сбольшей вероятностью будут вести себя одинаково, если они связаны друг

сдругом.

Основываясь на этом предположении, разработаем простую методику. Нам нужно определить вероятность того, что узел a является F. Представим эту ве роятность как P(F/q) и вычислим ее следующим образом:

Применим это к предыдущему рисунку, где Neighborhoodn представляет собой окрестность вершины n, а w (n, nj) — вес связи между n и nj.

Кроме того, degreeq — это степень узла q. Далее вероятность рассчитывается следующим образом:

Как мы видим, вероятность того, что этот человек замешан в мошенничестве, составляет 67 %. Нам нужно задать порог. Если пороговое значение составляет 30 %, то мы можем с уверенностью пометить данную вершину как F.

Обратите внимание, что этот процесс необходимо повторять для каждой новой вершины в сети.

Теперь рассмотрим продвинутый способ анализа мошенничества.

Анализ мошенничества методом сторожевой башни

Простой метод анализа мошенничества, представленный ранее, имеет два огра ничения:

zz Он не оценивает важности каждой вершины в социальной сети. Отношения с человеком, находящимся в центре сети, означают более высокую степень вовлеченности в мошенничество, нежели отношения с человеком на пери ферии сети.

Практический пример — выявление мошенничества

145

zzКогда мы помечаем кого-то как вовлеченного в известный случай мошенни чества в существующей сети, мы не учитываем тяжесть преступления.

Методология анализа мошенничества по принципу сторожевой башни устра няет эти два ограничения. Прежде всего рассмотрим две концепции.

Оценка негативного воздействия

Если человек причастен к мошенничеству, считается, что с этим человеком связано негативное воздействие (negative outcome). Не каждое негативное воз действие одинаково серьезно или опасно. Человек, который выдает себя за другого, оказывает более серьезное негативное воздействие по сравнению с тем, кто просто пытается использовать просроченную подарочную карту на 20 дол ларов.

Мы будем оценивать негативное воздействие баллами от 1 до 10 следующим образом (табл. 5.1).

Таблица 5.1

Негативное воздействие	Оценка негативного воздействия

Выдача себя за другого	10

Причастность к краже кредитных карт	8

Отправка поддельного чека	7

Судимость	6

Отсутствие судимости	0

Наша оценка основывается на ретроспективном анализе случаев мошенничества и их последствий.

Степень подозрения (DOS)

Степень подозрения (degree of suspicion, DOS) количественно определяет веро ятность причастности человека к мошенничеству. Нулевое значение DOS озна чает низкую вероятность совершения преступления человеком, а значение DOS, равное 9, — высокую вероятность.

Анализ исторических данных показывает, что профессиональные мошенники занимают важное положение в собственных социальных сетях. Чтобы учесть этот факт, мы вычислим все четыре показателя центральности для каждой вер

146	Глава 5. Графовые алгоритмы

шины в нашей сети. Затем мы возьмем среднее значение этих вершин. Это и будет показывать важность конкретного человека в сети.

Если человек, связанный с вершиной, замешан в мошенничестве, мы проиллю стрируем негативное воздействие, оценив его с помощью заранее определенных значений из таблицы выше (табл. 5.1). Это делается для того, чтобы тяжесть преступления отражалась в значении каждого отдельного DOS.

Наконец, чтобы получить значение DOS‚ перемножим среднее значение пока зателей центральности и оценку негативного воздействия. Нормализуем DOS, разделив его на максимальное значение DOS в сети.

Давайте рассчитаем DOS для каждой из девяти вершин указанной сети (табл. 5.2).

Таблица 5.2

	Вер-	Вер-	Вер-	Вер-	Вер-	Вер-	Вер-	Вер-	Вер-
	ши-	ши-	ши-	ши-	ши-	ши-	ши-	ши-	ши-
	на 1	на 2	на 3	на 4	на 5	на 6	на 7	на 8	на 9

Степень	0.25	0.5	0.25	0.25	0.25	0.13	0.63	0.13	0.13
центрально
сти

Посредниче	0.25	0.47	0	0	0	0	0.71	0	0
ство

Близость	0.5	0.61	0.53	0.47	0.47	0.34	0.72	0.4	0.4

Влиятель	0.24	0.45	0.36	0.32	0.32	0.08	0.59	0.16	0.16
ность

Среднее	0.31	0.51	0.29	0.26	0.26	0.14	0.66	0.17	0.17
значение
центрально
сти

Оценка	0	6	0	0	7	8	10	0	0
негативного
воздействия

DOS	0	3	0	0	1.82	1.1	6.625	0	0

Нормализо	0	0.47	0	0	0.27	0.17	1	0	0
ванный DOS

Каждая из вершин и ее нормализованный DOS показаны на рис. 5.20.

Практический пример — выявление мошенничества						147

	DOS=0.17			?
	6 F			?
	6 F
		1 NF				DOS=0.27
		1 NF				5 F
		DOS=0				5 F
		DOS=0		7 F		4 NF
				7 F
			3 NF	DOS=1 DOS=0
		DOS=0	3 NF
		DOS=0		2 F	DOS=0.47
				2 F	DOS=0.47
		9 NF DOS=0				8 NF DOS=0

Рис. 5.20

Для расчета DOS новой добавленной вершины будем использовать следующую формулу:

Используя соответствующие значения, рассчитаем DOS:

Полученное значение указывает на риск мошенничества, связанный с новой вершиной, добавленной в систему. Это означает, что по шкале от 0 до 1 данный человек имеет значение DOS 0.42. Мы можем создать несколько подборок DOS, как показано в табл. 5.3.

Таблица 5.3

Значение DOS	Классификация риска

DOS = 0	Никакого риска

0 < DOS ≤ 0.10	Низкий риск

0.10 < DOS ≤ 0.3	Умеренный риск

DOS > 0.3	Высокий риск

<<< < Предыдущая 31 32 33 34 35 36 37 38 39 40 41 4243 / 11143 44 45 46 47 48 49 50 51 52 53 54 55 > Следующая >>>

Соседние файлы в предмете Программирование на Python

#
07.04.202413.02 Mб940_алгоритмов_Python.pdf
#
07.04.20247.83 Mб2Elementary Mechanics Using Python- 2015.pdf
#
07.04.20246.11 Mб2Parvez Ahmed - The Ultimate Python Quiz Book - 2024.pdf
#
07.04.202411.31 Mб2primer_on_scientific_programming_with_python.pdf
#
07.04.202414.71 Mб6Python. Полное руководство [2022] Кольцов Д.М..pdf
#
07.04.202420.51 Mб3Бэрри П. - Изучаем программирование на Python (Мировой компьютерный бестселлер) - 2022.pdf