Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебник 447.docx
Скачиваний:
45
Добавлен:
30.04.2022
Размер:
18.41 Mб
Скачать

Лидеры рынка

В основном хранилища данных функционируют на базе реляционных СУБД. Широко известны следующие производители хранилища данных:

- Teradata. Платформа хранилищ данных компании Teradata включает широкий набор решений для хранилищ данных, в том числе три аппаратно-программные модели с разной функциональностью предназначенные для различных категорий компаний.

В состав платформы входит база данных Teradata Database, а также Teradata Manager – большой набор инструментов и средств для контроля над операциями базы данных, управления и сервисного обслуживания.

- Oracle. Компания предлагает аппаратно-программные решения, тесно интегрируя их с продуктами других производителей, таких как Hyperion Fusion Middleware, Siebel.

- IBM. Комплекс программно-аппаратных решений IBM интегрируется с программными продуктами InfoSphere, Rational, Cognos, WebSphere, FileNet, Optim и др.

- Netezza. Компания предлагает идеальную платформу для хранения данных четвёртого поколения, обеспечивающую совмещение хранения данных и проведение аналитики. TwinFin Netezza – это самый “быстрый” продукт на сегодняшний день, у которого скорость обработки данных до 100 раз быстрее, чем у ближайших аналогов.

В сентябре 2010 г. IBM приобрела компанию Netezza. В настоящее время на рынке представлено семейство IBM Smart Analytics System (ISAS) и бренд Netezza. Программное обеспечение хранилищ данных IBM – InfoSphere Warehouse доступно для Unix, Linux, Windows и z/OS. IBM имеет тысячи клиентов баз данных по всему миру и более 500 клиентов на устройства (комбинация Netezza и ISAS)

- EMC/Greenplum. Greenplum является частью подразделения компании EMC – Data Products, разрабатывающего хранилища данных СУБД массово-параллельной архитектуры (MPP), работающих на Linux и Unix. Продукт реализуется в виде устройства или автономной СУБД. Компания имеет в мире более 400 клиентов.

- Microsoft. Платформы хранилищ данных Microsoft Data Warehouse Platform включает реляционную СУБД MS SQL Server, многомерную СУБД MS Analysis Services, ETL-систему Data Transformation Services (DTS), MS Office как среду отображения данных и выпуска отчётов.

- Sybase. Программно-аппаратные решения Sybase включают высокопроизводительную реляционную базу данных СУБД IQ, набор инструментов для мониторинга систем обработки данных (СУБД и др.).

В 2010 г. Sybase была приобретена компанией SAP. В квадранте Gartner рассматривается СУБД Sybase IQ, ставшая первой колоночной СУБД. Она же является основным хранилищем данных СУБД SAP / Sybase. У Sybase тысячи клиентов Sybase IQ во всём мире.

Основные преимущества Хранилищ данных:

- единый источник информации: компания получает выверенную единую информационную среду, на которой будут строиться все справочно-аналитические приложения в той предметной области, по которой построено хранилище. Эта среда будет обладать единым интерфейсом, унифицированными структурами хранения, общими справочниками и другими корпоративными стандартами, что облегчает создание и поддержку аналитических систем. Также, при проектировании информационного хранилища данных особое внимание уделяют достоверности информации, которая попадает в хранилище;

- производительность: физические структуры хранилища данных специальным образом оптимизированы для выполнения абсолютно произвольных выборок, что позволяет строить действительно быстрые системы запросов;

- быстрота разработки: специфическая логическая организация хранилища и существующее специализированное ПО позволяют создавать аналитические системы с минимальными затратами на программирование;

- интегрированность: интеграция данных из разных источников уже сделана, поэтому не надо каждый раз производить соединение данных для запросов требующих информацию из нескольких источников. Под интеграцией понимается не только совместное физическое хранение данных, но и их предметное, согласованное объединение; очистку и выверку при их формировании; соблюдение технологических особенностей и т.д.;

- историчность и стабильность: OLTP-системы оперируют с актуальными данными, срок применения и хранения которых обычно не превышает величины текущего бизнес-периода (полугода-год), в то время как информационное хранилище данных нацелено на долговременное хранение информации (обычно временные рамки данных, находящихся в хранилище, лежат в пределах от 15-ти месяцев до пяти лет. Данные большей давности, как правило, переносятся в архив). Стабильность означает, что фактическая информация в хранилище данных не обновляется и не удаляется, а только специальным образом адаптируется к изменениям бизнес-атрибутов. Таким образом, появляется возможность осуществлять исторический анализ информации;

- независимость: выделенность информационного хранилища существенно снижает нагрузку на OLTP-системы со стороны аналитических приложений, тем самым производительность существующих систем не ухудшается, а на практике происходит уменьшение времени отклика и улучшение доступности систем.

Альтернативным по отношению к концепции Хранилищ данных способом формирования единого взгляда на корпоративные данные является создание виртуального источника, опирающегося на распределенные базы данных различных систем обработки данных. При этом каждый запрос к такому источнику динамически транслируется в запросы к исходным базам данных, а полученные результаты на лету согласовываются, связываются, агрегируются и возвращаются к пользователю. Однако такой способ обладает рядом существенных недостатков: время обработки запросов значительно больше, требуется постоянная связь всех источников данных в сети, задействован большой объем ресурсов сервера БД, данные могут иметь разные форматы и кодировки данных, а значит, могут быть несогласованны и т.п. Главным же недостатком следует признать практическую невозможность обзора длительных исторических последовательностей, ибо при физическом отсутствии центрального хранилища доступны только те данные, которые на момент запроса есть в реальных базах данных.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]