Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Пермский национальный исследовательский политехнический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги / Современные информационные технологии в управлении знаниями

..pdf

Скачиваний:

Добавлен:

12.11.2023

Размер:

3.03 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 207 8 9 10 11 12 13 14 15 16 17 18 19 20 > Следующая >>>

Рис. 28. Вид презентации у приглашенного участника

Для того чтобы начать вебинар, достаточно зарегистрироваться в системе и разослать приглашения с уникальными ссылками. Скачивать никому ничего не нужно, достаточно современного браузера. На рис. 28 представлен вид окна у приглашенного участника (сервис видеоконференций). Для участия в вебинаре участнику достаточно нажать кнопку «начать».

2.3.12. RSS-каналы

Многие современные браузеры умеют работать с RSSлентами. Кроме того, существуют специализированные приложения, собирающие и обрабатывающие информацию RSS-каналов. Интернет-ресурс в формате RSS называется RSS-каналом, RSSлентой или RSS-фидом. RSS даёт краткое описание новой информации, появившейся на сайте, и ссылку на еёполную версию.

С помощью RSS очень удобно подписываться на новости любимых сайтов. Одним из лучших для работы с RSS-потоками является сервис Google Reader38.

38 URL: http://www.google.ru/reader/view/#overview-page

Сервис Google Reader доступен только зарегистрированным пользователям Google. Один из способов быстро добавить каналы из имеющегося списка источников – подписаться на один из готовых пакетов (добавить или удалить отдельные каналы можно позднее). На рис. 29 показаны 3 пакета из 36.

Рис. 29. Пакеты от Google

Приложения Web 2.0 развиваются беспрерывно. Обновление приложений не требует никаких действий со стороны пользователя. В монографии представлены наиболее распространенные на сегодняшний день сервисы. Нет сомнения в том, что уже появляются и будут появляться новые сервисы.

Современные технологии управления знаниями основаны на использовании рассмотренных нами инновационных технологий Web 2.0. Об этом следующий раздел монографии.

3.ИНФОРМАЦИОННЫЕ И КОММУНИКАЦИОННЫЕ ТЕХНОЛОГИИ

ВУПРАВЛЕНИИ ЗНАНИЯМИ

Выделяют две составляющие системы управления знаниями компании: организационную (сотрудники и их мотивация) и технологическую (информационные и коммуникационные технологии). В этом разделе монографии рассмотрим технологическую составляющую.

На рис. 30 представлен цикл управления знаниями [54].

Рис. 30. Цикл управления знаниями

Рассмотрим его элементы.

3.1. Извлечение и формализация знаний

Существуют два объекта извлечения: неявные знания и формализованные знания персонала.

Методы извлечения знаний

Для извлечения неявных знаний используются:

– экспертное интервью. Это может быть интервью, проводимое сотрудником по знаниям с целью формализации знаний; интервью при увольнении сотрудника с целью сохранения знаний; обучающее интервью;

–заполнение специально разработанных анкет и форм учета знаний;

–формализация экспертных дискуссий (сотрудник по знаниям может преобразовать дискуссию, прошедшую на форуме или совещании, в отчет или справку);

–наблюдение.

Для полученных таким образом знаний необходимо разработать соответствующуюсистему организациихранения иучета.

Формализованные знания находятся в базах данных, накопленных в компании. Для их извлечения можно использовать две основные группы инструментов:

–алгоритмы статистического анализа. Здесь важно правильно выделить критерии анализа;

–алгоритмы искусственного интеллекта.

Результат, полученный в ходе применения приведенных алгоритмов, можно будет использовать как конкретное знание только при условии, что запрос сформулирован четко, а необходимые данные для выполнения запроса есть в базе данных.

Рис. 31. Уровни знаний, извлекаемых из данных

Новый виток в развитии средств и методов обработки данных привел к возникновению новых терминов: data mining, text mining, web mining, нейронные сети и др. К обществу пришло понимание, что сырые данные (raw data) содержат глубинный пласт знаний, при грамотной раскопке которого могут быть обнаружены настоящие «самородки» (рис. 31) [26].

Data Mining

Data Mining – это буквально «раскопки данных, или добыча чего-то из данных». По определению Григория ПиатецкогоШапиро39, это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретаций знаний, необходимых для принятия решений в различных сферах человеческой деятельности [27]. Суть и цель технологии Data Mining можно охарактеризовать так: это технология, которая предназначена для поиска в больших объемах данных неочевидных, объективных и полезных на практике закономерностей. Неочевидных – означает, что найденные закономерности не обнаруживаются стандартными методами обработки информации или экспертным путем. Объективных – означает, что обнаруженные закономерности будут полностью соответствовать действительности, в отличие от экспертного мнения, которое всегда является субъективным. Практически полезных – означает, что выводы имеют конкретное значение, которому можно найти практическое применение [27].

В основу современной технологии Data Mining (датамайнинг) положена концепция шаблонов (паттернов), отражающих фрагменты многоаспектных взаимоотношений в данных. Эти шаблоны представляют собой закономерности, свойственные подвыборкам данных, которые могут быть компактно выражены в понятной человеку форме. Примеры заданий на такой поиск при использовании Data Mining и OLAP40 приведены ниже [26].

39Основатель и председатель SIGKDD (группа особых интересов, посвя-

щенная «открытию знаний в данных» (Knowledge Discovery in Data)

40OLAP (англ. online analytical processing, аналитическая обработка в реальном времени) — технология обработки информации, включающая составление и динамическую публикацию отчётов и документов. Используется аналитиками для быстрой обработки сложных запросов к базе данных.

OLAP			Data Mining
Каковы средние показатели			Встречаются		ли точные
травматизма для курящих и не-			шаблоны в описаниях людей,
курящих?			подверженных	повышенному
			травматизму?
Каковы	средние	размеры	Имеются ли		характерные
телефонных	счетов	сущест-	портреты клиентов, которые, по
вующих клиентов в сравнении			всей вероятности,		собираются
со счетами бывших клиентов,			отказаться от услуг телефонной
отказавшихся от услуг теле-			компании?
фонной компании?
Какова	средняя	величина	Существуют ли стереотип-
ежедневных покупок по укра-			ные схемы покупок для случаев
денной и не украденной кре-			мошенничества	с	кредитными
дитной карточке?			карточками?

Датамайнинг широко применяется в больших компаниях, особенно работающих в электронной коммерции. Ниже приведен неполный список областей применения этой технологии:

–Реклама.

–Связь с клиентами (CRM).

–Маркетинг.

–Выявление мошенничества.

–Электронная коммерция.

–Телекоммуникации.

–Изучение веба.

Например, рекомендации на многих сайтах магазинов в виде «покупатели, купившие/искавшие/посмотревшие Х, купили также Z» приводят к огромному росту продаж. Высококачественные рекомендации такого типа обеспечили успех компании «Netflix»41, занимающейся прокатом видео. «Netflix» придавала такое значение датамайнингу, что в 2006 году учредила приз в 1 млн долларов за улучшение алгоритма выработки рекомендаций по увеличению объема продаж [27].

41 URL: https://www.netflix.com/

Text Mining

Text Mining42 – это технология глубинного анализа неструктурированного текста, другими словами, – текста, написанного естественным человеческим языком.

Использование данных из неструктурированных источников позволяет принимать более эффективные бизнес-решения. При этом, по данным Gartner43, неструктурированные документы составляют более 80 % корпоративных данных, а количество внешних источников (интернет-ресурсов, блогов, форумов, СМИ) исчисляется миллионами. В них содержится гигантское количество данных, которые могут обеспечить компании существенное конкурентное преимущество. Основной вопрос – эффективность и скоростьизвлечения и анализа ценной информации.

Проблемы, связанные с автоматизацией этой области, т.е. с поиском ответа на конкретный вопрос, для большинства пользователей пока не решены. В отличие от технологии Data Mining, которая предусматривает анализ упорядоченной в некие структуры информации, технология Text Mining анализирует большие и сверхбольшие массивы неструктурированной информации.

Практически все пользователи для поиска информации формулируют запрос в одной из поисковых систем (Yandex, Google и т.д.) и получают в результате миллионы ссылок. А дальше необходимо просмотреть текст, выделить нужные фрагменты, загрузить, например, в Excel, применить формулы, построить графики и таким долгим и тяжким трудом получить нужный отчет. Такой способ работы с неструктурированной информацией представляет собой рутинный труд. Возможно ли автоматизировать этот труд?

Как показывает анализ российской и зарубежной практики, такие технологии сегодня имеются.

42Синонимом понятия Text Mining является KDT (Knowledge Discovering in Text - поиск или обнаружение знаний в тексте).

43Исследовательская и консалтинговая компания, специализирующаяся на рынках информационных технологий. URL: http://www.gartner.com/

Условно процесс получения конечного результата (ответа на вопрос) можно разделить на три этапа:

1.Поиск релевантных документов.

2.Извлечение данных из найденных документов.

3.Анализ данных.

Соответственно по степени автоматизации различных фаз указанного процесса можно также выделить три группы: подход, основанный только на автоматизации поиска, практикуется в 90 % случаев; извлечение информации автоматизировано приблизительно в 10 % решений; и только в редких случаях подобные системы берут на себя аналитическую работу.

Этап 1. Поиск документов Основные преимущества такого подхода – распространен-

ность и общедоступность поисковых технологий. Кроме того существует мнение, что дальнейшую обработку информации может выполнить только человек. Однако если речь идет об обработке больших массивов данных, применение одних только поисковых систем становится малоэффективным, так как требует значительных человеческих ресурсов на этапах «добычи» фактов и их анализа.

Этап 2. Автоматизация извлечения данных Этот подход предполагает наличие инструмента, способно-

го выделять из текста нужные элементы. При использовании такой программы на вход загружается текст, написанный на естественном языке, а на выходе пользователь получает запрошенную информацию в структурированном виде. Подобный инструмент позволяет автоматически собирать результаты своей работы в наборы данных, которые можно анализировать.

В настоящее время поставщики инструментов Text Mining снабжают свои продукты возможностями интеграции с источниками документов (в основном с веб-ресурсами) и с базами данных через файлы в формате XML. Но основной проблемой использования этих технологий является сложность настройки и поддержки таких инструментов. Это обусловлено спецификой компьютерной лингвистики, оперирующей терминами синтак-

сиса и семантики. Как правило, конечные пользователи и разработчики далеки от этих материй, а в итоге возможности таких инструментов используются лишь на 5–10 % [28].

Тем не менее пользователь уже избавлен от необходимости вручную просматривать тысячи документов и подбирать ключевые слова. За него это делает система. Появляются дополнительные возможности автоматической классификации и сопоставления подобных документов. Кроме того, программа способна сама распознавать смысловые элементы текста, например факты, события, и передавать их на последующую обработку.

Этап 3. Автоматизация аналитических процедур В простейшем случае в руках конечного пользователя есть та-

кие аналитические инструменты, как MS Excel и MS Access. Более эффективными инструментами являются BI иData Mining.

BI (Business intelligence) – бизнес-анализ, бизнес-аналитика. Под этим понятием чаще всего подразумевается программное обеспечение, созданное для помощи менеджеру в анализе информации о своей компании и её окружении. Существует несколько вариантов понимания этого термина44.

Бизнес-аналитика – это методы и инструменты для построения информативных отчётов о текущей ситуации. В этом случае цель аналитики предоставить нужную информацию тому человеку, которому она необходима в нужное время. Эта информация может оказаться жизненно необходимой для принятия управленческих решений.

Бизнес-аналитика – это инструменты, используемые для

преобразования, хранения, анализа, моделирования, доставки и трассировки информации в ходе работы над задачами, связанными с принятием решений на основе фактических данных.

Лидером в области создания инструментов Text Mining является компания Clarabridge [29]. Разработкой этой компании является Clarabridge Document Analytics – инновационная тех-

нологическая платформа, позволяющая полностью автомати-

44 URL: http://ru.wikipedia.org/

зировать процесс сбора и анализа данных из неструктурированных источников информации (Интернет, архивы, СМИ, электронная почта).

На рис. 32 представлена технология работы с этой платфор-

мой [29].

Рис. 32. Технология работы для аналитической обработки информации

Пример работы технологической связки «поиск – добыча – анализ» неструктурированной информации, реализованной на базе платформы Clarabridge, приведен Павлом Линючевым [28].

При расчете рейтинга упоминаемости автомобильных брендов в новостях, публикуемых на сайте Yandex, система нашла ссылки, извлекла факты, выявила связи между ними, структурировала полученную информацию и провела ее анализ (рис. 33). Поскольку процесс автоматизирован, пользователь сразу получает готовый информационный продукт, позволяющий судить о том, какие позитивные (негативные) качества ассоциируются с каждым из представленных брендов и как со временем меняются мнения покупателей. Если кнопкой мыши щелкнуть на той или иной части графика, например, демонстрирующей падение рейтинга BMW, система подскажет причины этого падения (в данном случае причиной стал отзыв автомобилей с рынка).

<<< < Предыдущая 1 2 3 4 5 67 / 207 8 9 10 11 12 13 14 15 16 17 18 19 20 > Следующая >>>

Соседние файлы в папке книги