- •Сергей Кузнецов, Александр Константинов, Николай Скворцов Ценность ваших данных
- •Предисловие
- •Введение
- •Глава 1. Цифровое многообразие
- •1.1. В чем ценность данных
- •1.2. Данные для науки
- •1.3. Данные для бизнеса
- •1.4. Данные для торговых сетей
- •1.5. Данные для государства
- •Литература к главе 1
- •Глава 2. От данных к мудрости
- •2.1. Данные и информация
- •2.2. Информационная иерархия
- •2.3. Внутри пирамиды знаний
- •2.4. Разрыв между данными и информацией
- •Глава 3. От побочного продукта к стратегическому ресурсу
- •3.1. Эволюция концепций стратегического менеджмента
- •3.2. Ресурсный подход к фирме
- •3.3. Концепция динамических способностей
- •3.4. Взгляд на фирму, основанный на знаниях
- •3.5. Данные как ресурс: ресурсоориентированный взгляд на данные и информацию
- •Литература к главе 3
- •Глава 4. Данные как ресурс: особенности и подходы к управлению
- •4.1. Свойства данных как ресурса
- •4.2. Особенности управления данными как ресурсом
- •4.3. Концепция управления информационными ресурсами
- •Литература к главе 4
- •Глава 5. От стратегического ресурса к ценнейшему активу
- •5.1. Повестка дня для совета директоров: развитие концепции управления информационными ресурсами
- •5.2. Данные как актив
- •5.3. Семь законов информации
- •5.4. Модели оценки информационных активов
- •5.5. Три уровня ценности информационных активов
- •Литература к главе 5
- •Глава 6. Данные как актив: барьеры и ошибки на пути извлечения ценности
- •6.1. Барьеры на пути развертывания информационных активов и Лидерский манифест о данных
- •6.3. Доктрина в области данных (версия 2)
- •6.5. Семь «смертных грехов» в области работы с данными
- •Литература к главе 6
- •Глава 7. Построение цепочек
- •7.1. Цепочка ценности данных
- •7.2. Цепочка поставок данных
- •7.3. Дата-центричная организация и организация, управляемая на основе данных
- •7.4. Управление информационными активами и управление корпоративной информацией: в чем разница?
- •7.5. Управление корпоративной информацией: необходимость актуализации повестки дня для совета директоров
- •7.6. Управление корпоративной информацией: сегодняшняя повестка дня для совета директоров
- •7.7. Управление корпоративной информацией: выгоды от внедрения и чек-лист для совета директоров
- •Литература к главе 7
- •Глава 8. Данные как объект управления
- •8.1. Источники данных и виды информационных активов
- •8.2. Классификация данных
- •8.3. Жизненный цикл данных, цепочка данных и происхождение данных
- •8.4. Системы и люди (организации, подразделения, сотрудники) в процессах управления данными
- •8.5. Эволюция управления данными в организациях и референтные модели
- •Литература к главе 8
- •Глава 9. Управление данными: принципы и структуры
- •9.1. Методология DAMA-DMBOK
- •9.2. Принципы создания системы управления данными
- •9.3. Модель зрелости управления данными
- •Литература к главе 9
- •Глава 10. Руководство данными
- •10.1. Руководство данными и его ключевая роль в управлении данными
- •10.2. Стратегия работы с данными
- •10.3. Программа руководства данными
- •10.4. Распоряжение данными
- •10.5. Организационная система руководства и управления данными
- •10.6. Контекстная диаграмма области знаний и уровни зрелости функции «Руководство данными»
- •Литература к главе 10
- •Глава 11. Планирование и проектирование данных
- •11.1. Архитектура данных
- •11.2. Моделирование и проектирование данных
- •Литература к главе 11
- •Глава 12. Обеспечение доступности и обслуживание данных: основы
- •12.1. Хранение и операции с данными
- •12.2. Интеграция и интероперабельность данных
- •12.3. Управление справочными и основными данными
- •Литература к главе 12
- •Глава 13. Управление основными данными: практика внедрения
- •13.1. Две стратегии внедрения MDM
- •13.3. MDM-проекты
- •13.5. Описание модели
- •13.6. Примеры MDM-проектов
- •13.7. Сопоставление существующих и описанного подходов
- •13.8. Пример архитектуры информационных систем, основанной на комплексном MDM-решении
- •Литература к главе 13
- •Глава 14. Обеспечение доступности и обслуживание данных: развитие
- •14.1. Ведение хранилищ данных и бизнес-аналитика
- •14.2. Управление документами и контентом
- •14.3. Большие данные и наука о данных
- •Литература к главе 14
- •Глава 15. Базовая поддержка жизненного цикла данных
- •15.1. Управление безопасностью данных
- •15.2. Управление метаданными
- •15.3. Управление качеством данных
- •Литература к главе 15
- •Глава 16. Организационные аспекты управления данными
- •16.1. Операционные модели руководства данными и управления данными
- •16.2. Роли, относящиеся к руководству и управлению данными
- •16.3. Ключевые первоначальные шаги
- •Литература к главе 16
- •Глава 17. Использование данных и расширение возможностей применения
- •17.1. Использование основных данных
- •17.2. Бизнес-аналитика
- •17.3. Наука о данных
- •17.4. Развитие платформенных решений в области управления данными
- •Литература к главе 17
- •Глава 18. Основные тренды будущего
- •18.1. Основные тренды на ближайшую перспективу
- •18.2. Ценность данных в различных областях
- •Литература к главе 18
- •Заключение
- •Сноски
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-xcha |
|
|
|
|
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-x cha |
|
|
|
|
Глава 2. От данных к мудрости
2.1. Данные и информация
Прежде чем начать разбираться в вопросах управления и извлечения ценности из данных, стоит подробнее остановиться на терминах «данные» (data) и «информация» (information) и их значениях. Применительно к сфере управления данными эти термины часто используют как синонимы, но во многих случаях значения различают[27][28]. Понять разницу поможет экскурс в историю их происхождения.
В английском языке слово information появилось гораздо раньше, чем слово data, – в конце XIV века. Слово пришло из старофранцузского языка. Французские information, informateur – производные от informer – «осведомлять, сообщать, делать известным». Первоисточник – латинское informatio – «разъяснение, истолкование, сообщение». От in – «в, к, в направлении» + forma – «форма». Истоки слова «форма» неизвестны[29][30].
Во второй половине XV века за словом information закрепилось значение «переданные сведения, относящиеся к определенной теме». Сфера применения постепенно расширялась. В частности, в XX веке слово стало появляться в документальных источниках в связи с передачей телевизионных сигналов – с 1937 года, применением перфокарт – c 1944-го, анализом ДНК – с 1953-го. Термин «теория информации» (information theory) используется с 1950 года, «информационная технология» (information technology) – с 1958-го
(впервые появился в журнале Harvard Business Review), «информационная революция» (information revolution) – с 1966-го, «информационная перегрузка» (information overload) – с 1967-го.
В русский язык слово «информация» пришло из западноевропейских языков при Петре I – в начале XVIII века (но в словарях появляется лишь во второй половине XIX века). Основные значения – «сообщения, сведения, пояснения».
Что же касается слова data, то оно в английском языке стало использоваться (в значении, близком к сегодняшнему) в 1640-х годах –
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-xcha |
|
|
|
|
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-x cha |
|
|
|
|
более чем на два столетия позже слова information.
Слово data произошло от латинского datum – «данная вещь» (от латинского dare – «давать»). Оно применяется как во множественном, так и в единственном числе, однако в научной литературе для единственного числа может использоваться термин datum.
1640-е годы – время начала Английской гражданской войны, открывшей путь к промышленной революции XVIII–XIX веков. Одновременно это было время осуществления первой научной революции и возникновения классической европейской науки. Слова data и datum в значении «данные или предоставленные факты» впервые появились в работах английского священника Генри Хаммонда (Henry Hammond), который, как и многие представители его профессии в то время, участвовал в формировании основ классической науки[31][32].
Начиная с работ Хаммонда слово information стало все чаще и чаще дублироваться словом data, чему способствовала научная революция, наступление «Века разума» (The Age of Reason) и эпохи Просвещения. Появилось (благодаря быстрому распространению книгопечатания, изобретенного Гуттенбергом в 1450 году) большое количество книг по уже существовавшим и вновь появляющимся отраслям науки. Таким образом, был создан и активно обрабатывался огромный объем совместно используемых сведений. Для обозначения таких сведений, предоставляемых для обсуждения и осмысления, начал применяться термин data (сначала в классическом значении – «факты, данные в качестве основы для вычислений при решении математических задач»), более подходящий в данном случае, чем термин information[33].
Необходимо отметить еще одно важное слово, появление которого оказало существенное влияние на дальнейшее распространение термина «данные». В 1798 году Джон Синклер[34] в своем «Статистическом отчете о Шотландии» ввел в английский язык термин «статистика». По определению Синклера, статистика – это собрание фактов, которые совершенно не обязательно должны были быть представлены (и даже в основном не были представлены) в числовом виде. Однако с 1829 года слово statistics стало употребляться в английских документальных источниках в более строгом значении – «собранные и классифицированные числовые данные». С этого
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-xcha |
|
|
|
|
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-x cha |
|
|
|
|
момента изучение любого предмета стало сопровождаться проведением всеобъемлющих подсчетов[35].
Широкое распространение статистических методов привело к тесной смысловой привязке термина data к термину statistics. В 1897 году в документальных источниках на английском языке слово data стало использоваться в новом значении – «факты в числовом виде, собранные для дальнейшего использования».
ВXX веке спектр значений cлова data существенно расширился.
В1946 году появилось значение «передаваемая и хранимая информация, с помощью которой осуществляется выполнение
компьютерных операций»[36].
Стали использоваться новые термины: «обработка данных» (data processing) – с 1954 года, «база данных» (database) – с 1962 года, «ввод данных» (data entry) – с 1970 года[37].
В русском языке слово «данные» – производное от «дать», «давать». Родственно древнеиндийскому слову datis – «дар». Данные – то, что дано, найдено. В толковом словаре Даля «данныя, данности – известное, бесспорное, очевидное, верное, все, что служит основанием для какого-либо вывода, расчета, заключения»[38]. В энциклопедическом словаре Брокгауза и Ефрона приведено следующее определение: «В вопросах математики данные суть величины, значения которых известны или предполагаются известными; зная их, требуется в рассматриваемом вопросе определить искомые неизвестные величины.
Данные (Δεδόμενα) есть заглавие одного из сочинений Эвклида, составляющего продолжение его “Элементов”. Можно указать несколько изданий этой книги: Гарди в 1625 году с греческим текстом и Баррова в 1659 году Эвклид называет данным все то, что на основании теорем, заключающихся в элементах, непосредственно следует из условий задачи. Например, если проводим из данной точки прямую, касательную к данному кругу, то эта прямая есть данная по величине и положению»[39].
Приведем несколько современных определений.
Согласно «Оксфордскому словарю современного английского языка»[40]:
● Data: 1) Известные факты, используемые для вывода или расчета. 2) Числовые и нечисловые значения характеристик кого-либо
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-xcha |
|
|
|
|
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-x cha |
|
|
|
|
(чего-либо), с которыми выполняет операции компьютер или какоенибудь другое подобное устройство.
● Information: 1) a) Что-то, что было сообщено; знания. б) Элементы знаний; новости. 2) Обвинение или жалоба, поданная в суд и т. п.
Согласно «Новому словарю русского языка»[41]:
●Данные: 1) Сведения, факты, характеризующие кого-либо, чтолибо, необходимые для каких-либо выводов, решений. 2) Свойства, способности, качества как условия или основания, необходимые для чего-либо.
●Информация: 1) Сообщение о положении дел где-либо, о состоянии чего-либо. 2) а) Сведения об окружающем мире и протекающих в нем процессах, воспринимаемые человеком или специальными устройствами. б) Обмен такими сведениями между людьми и специальными устройствами. в) Обмен сигналами в животном и растительном мире. 3) То же, что: информирование.
Все это позволяет понять разницу между понятиями «данные» и «информация» и очертить преимущественные сферы их применения.
Следует заметить, что здесь в отношении термина «информация» мы ограничиваемся его общепринятыми нестрогими определениями и не обсуждаем научные определения, используемые в теории связи, теории информации и кибернетике и связанные с понятием количества информации. Отметим только, что известны два основных сугубо
научных подхода к определению этого термина[42].
Согласно первому, информация – это внешнее описание объекта, содержащееся в передаваемом сообщении. Количество информации определяется как мера неопределенности, снимаемой полученным сообщением. Такое представление в 1948 году ввел Клод Шеннон[43] в своей статье «Математическая теория связи», попутно предложив для обозначения наименьшей единицы информации использовать слово
«бит».
Согласно второму подходу, информация не связывается с передаваемым сообщением. Она относится к объекту и есть мера его разнообразия. Автор этого представления – Уильям Эшби[44].
Указанные научные определения в дальнейшем в этой книге не используются, поскольку ценность информации слабо связана с ее количеством. Важность информации субъективна и зависит от цели ее