Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
книги хакеры / Майкл_Сикорски,_Эндрю_Хониг_Вскрытие_покажет!_Практический_анализ.pdf
Скачиваний:
18
Добавлен:
19.04.2024
Размер:
17.17 Mб
Скачать

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

w

 

 

to

 

 

314  Часть IV  •  Возможности вредоносного ПО

w Click

 

 

 

 

 

 

 

 

 

 

 

o

m

 

w

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-x cha

 

 

 

 

поэтому на рис. 13.13 проиллюстрирована диаграмма для файла, который мы рассматривали выше.

Карта энтропии, представленная на рис. 13.13, была сгенерирована с тем же размером отрезка (64). Здесь показаны только самые высокие значения в диапазоне от 4,8 до 6,2. Как вы помните, максимальный показатель для отрезков этого размера равен 6.

Обратите внимание на скачок в районе числа 25 000. Это тот участок файла, который содержит константы DES и выделен на рис. 13.10 и 13.12.

Рис. 13.13. Карта энтропии для вредоносного исполняемого файла

Можно выделить еще несколько особенностей. Например, стабильные результаты между блоками 4000 и 22 000. Код обычно размещен в одном месте, поэтому он формирует последовательность пиковых значений.

Более интересным представляется выступ в конце, достигающий значения 5,5. Тот факт, что достаточно высокий уровень находится отдельно от других, делает его особенным. В результате анализа оказалось, что это конфигурационные данные вредоноса, зашифрованные методом DES, чтобы скрыть сведения о внешнем управлении.

Нестандартное кодирование

Во вредоносном программном обеспечении часто используются самодельные методы кодирования. Примером может служить наложение примитивных алгоритмов шифрования. Скажем, вредонос производит гаммирование, а полученный результат кодирует с помощью Base64. Кроме того, могут создаваться нестандартные алгоритмы, основанные на известных криптографических методиках.

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

Глава 13. Кодирование данных  315

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-x cha

 

 

 

 

Обнаружение нестандартного кодирования

Есть много способов обнаружить во вредоносном коде распространенные криптографические и кодирующие функции, используя легко опознаваемые строки и константы. Во многих ситуациях эти приемы помогут вам в поиске нестандартных криптографических подходов. Но, если очевидных признаков нет, задача становится намного сложнее.

Представьте, к примеру, что вы обнаружили вредоносную программу, в одном каталоге с которой находится множество зашифрованных файлов размером примерно 700 Кбайт каждый. В листинге 13.6 показаны начальные байты одного из этих файлов.

Листинг 13.6. Начальные байты зашифрованного файла

 

 

 

88

5B

D9

02

EB 07

5D 3A

8A

06 1E 67

D2

16

93 7F

.[....

]:...

g....

43

72

1B

A4

BA B9

85

B7

74

1C

6D

03

1E

AF 67

AF

Cr......

t.m

...g.

98

F6

47

36

57

AA

8E

C5

1D

70

A5

CB

38

ED 22

19

..G6W....

p..8.".

86

29

98

2D

69

62

9E

C0

4B

4F

8B

05

A0

71

08

50

.).-ib..KO...q.P

92

A0

C3

58

4A

48

E4

A3

0A

39

7B

8A

3C

2D

00

9E

...XJH

...9{.<-..

Инструменты, рассмотренные до сих пор, не позволяют получить однозначный ответ. Здесь нет строк, которые бы указывали на применение криптографии. Ни FindCrypt2, ни KANAL не смогли найти криптографические константы. Проверка на повышенную энтропию не показала ничего необычного. Единственное, что мы на­ шли, — это признак гаммирования на основе единственной инструкции xor ebx, eax. Но ради спортивного интереса мы пока проигнорируем эту деталь.

Нам остается пойти сложным путем — выполнить трассировку потока выполнения в момент ввода или вывода подозрительных данных. Ввод и вывод можно считать универсальными категориями. Отправленный сетевой пакет, записанный файл или направление информации в stdout — все это считается выводом. И если вывод содержит зашифрованные данные, шифрование происходит перед их генерацией.

Вто же время декодирование происходит после ввода. Допустим, вы нашли входную функцию. Первым делом нужно определить элементы данных, на которые влияет ввод, и затем отследить цепочку выполнения, обращая внимание только на новые функции, имеющие доступ к этим элементам. Если вы достигли конца функции, следует продолжить с того места, где произошел вызов, отмечая местоположение данных. В большинстве случаев функция дешифрования будет недалеко от функции ввода. Похожим образом следует анализировать и функции вывода, только трассировку нужно проводить в обратном направлении.

Внашем примере предполагается, что на вывод подаются зашифрованные файлы, которые мы нашли в одном каталоге с вредоносом. Если исследовать импортированные символы исполняемого файла, можно найти вызовы CreateFileA и WriteFile, содержащиеся внутри функции, помеченной как sub_4011A9. Эта же функция, как выясняется, содержит ту самую единственную операцию XOR.

На рис. 13.14 показана диаграмма вызовов для ответвления sub_4011A9. Обрати-

те внимание на вызов WriteFile в блоке loc_40122a справа. Также стоит отметить

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

w

 

 

to

 

 

316  Часть IV  •  Возможности вредоносного ПО

w Click

 

 

 

 

 

 

 

 

 

 

 

o

m

 

w

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-x cha

 

 

 

 

инструкцию xor ebx, eax в цикле, который может выполниться прямо перед блоком записи (loc_40122a).

В блоке слева находится вызов sub_40112F, а ближе к концу можно видеть инкремент счетчика на 1 (счетчик помечен как var_4). После выполнения sub_40112F видно, что возвращенное значение, сохраненное в EAX, используется в сочетании с регистром EBX в операции XOR. На этом этапе результат функции XOR находится в переменной bl (младший байт регистра EBX). Затем содержимое bl записывается в буфер (по адресу lpBuffer плюс текущее значение счетчика).

Если собрать все эти признаки воедино, можно с большой долей вероятности утверждать, что вызов sub_40112F совершается для получения единственного псевдослучайного байта, к которому в сочетании с текущим байтом буфера применяется исключающее ИЛИ. Буфер помечен как lpBuffer, потому что он позже используется

вфункции WriteFile. Вызов sub_40112F не принимает аргументов и возвращает

вEAX лишь 1 байт.

Рис. 13.14. Диаграмма функций, демонстрирующая зашифрованную запись

На рис. 13.15 показаны отношения между функциями шифрования. Обратите внимание на функции sub_40106C и sub_40112F, у которых есть общее ответвление. sub_40106C не принимает параметров и всегда выполняется до вызова sub_40112F.

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

Глава 13. Кодирование данных  317

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-x cha

 

 

 

 

Если функция sub_40106C занимается инициализацией процедуры шифрования, она должна иметь общие глобальные переменные с sub_40112F.

Рис. 13.15. Связи внутри процедуры шифрования

Входе дальнейшего исследования обнаруживается, что функции sub_40106C

иsub_40112F содержат множественные ссылки на три глобальные переменные: два значения DWORD и один массив размером 256 байт. Это подтверждает наше предположение о том, что первая из них выполняет инициализацию, а вторая представляет собой потоковый шифр (потоковый шифр генерирует поток псевдослучайных битов, которые можно наложить на обычный текст с помощью исключающего ИЛИ). У этого примера есть одна особенность: функция инициализации не принимает пароль в качестве аргумента и содержит лишь ссылки на два значения DWORD и указатель на пустой 256-байтный массив.

Здесь нам повезло. Функции кодирования оказались довольно близко к процедуре вывода, которая записывает зашифрованные данные, поэтому найти их было легко.

Преимущества нестандартного кодирования с точки зрения злоумышленника

Злоумышленники ценят нестандартные методы кодирования. Чаще всего дело в том, что они сохраняют характеристики примитивных алгоритмов (небольшой размер и не слишком очевидные признаки применения шифрования) и усложняют обратное проектирование (обнаружение процесса кодирования и создание декодера). Хотя последний аспект считается спорным.

Во многих случаях написание декодера для стандартных методов криптографии оказывается довольно тривиальной задачей — при условии, что был найден