Olap системы

Виды OLAP систем

В зависимости от метода хранения и обработки данных все OLAP системы могут быть разделены на три основных вида.

1. ROLAP (Relational OLAP – реляционные OLAP системы) – этот вид OLAP системы работает с реляционными базами данных. Обращение к данным осуществляется напрямую в реляционную базу данных. Данные хранятся в виде реляционных таблиц. Пользователи имеют возможность осуществлять многомерный анализ как в традиционных OLAP системах. Это достигается за счет применения инструментов SQL и специальных запросов.

Одним из преимуществ ROLAP является возможность более эффективно осуществлять обработку большого объема данных. Другим преимуществом ROLAP является возможность эффективной обработки как числовых, так и текстовых данных.

К недостаткам ROLAP относится низкая производительность (по сравнению с традиционными OLAP системами), т.к. обработку данных осуществляет сервер OLAP. Другим недостатком является ограничение функциональности из-за применения SQL.

2. MOLAP (Multidimensional OLAP – многомерные OLAP системы). Этот вид OLAP систем относится к традиционным системам. Отличие традиционной OLAP системы, от других систем, заключается в предварительной подготовке и оптимизации данных. Эти системы, как правило, используют выделенный сервер, на котором осуществляется предварительная обработка данных. Данные формируются в многомерные массивы – OLAP кубы.

MOLAP системы являются самыми эффективными при обработке данных, т.к. они позволяют легко реорганизовать и структурировать данные под различные запросы пользователей. Аналитические инструменты MOLAP позволяют выполнять сложные расчеты. Другим преимуществом MOLAP является возможность быстрого формирования запросов и получения результатов. Это обеспечивается за счет предварительного формирования OLAP кубов.

К недостаткам MOLAP системы относится ограничение объемов обрабатываемых данных и избыточность данных, т.к. для формирования многомерных кубов, по различным аспектам, данные приходится дублировать.

3. HOLAP (Hybrid OLAP – гибридные OLAP системы). Гибридные OLAP системы представляют собой объединение систем ROLAP и MOLAP. В гибридных системах постарались объединить преимущества двух систем: использование многомерных баз данных и управление реляционными базами данных. HOLAP системы позволяют хранить большое количество данных в реляционных таблицах, а обрабатываемые данные размещаются в предварительно построенных многомерных OLAP кубах. Преимущества этого вида систем заключаются в масштабируемости данных, быстрой обработке данных и гибком доступе к источникам данных.

Существуют и другие виды OLAP систем, но они в большей степени являются маркетинговым ходом производителей, чем самостоятельным видом OLAP системы.

К таким видам относятся:

  • WOLAP (Web OLAP). Вид OLAP системы с поддержкой web интерфейса. В этих системах OLAP есть возможность обращаться к базам данных через web интерфейс.
  • DOLAP (Desktop OLAP). Этот вид OLAP системы дает возможность пользователям загрузить на локальное рабочее место базу данных и работать с ней локально.
  • MobileOLAP. Это функция OLAP систем, которая позволяет работать с базой данных удаленно, с использованием мобильных устройств.
  • SOLAP (Spatial OLAP). Этот вид OLAP систем предназначен для обработки пространственных данных. Он появился как результат интеграции географических информационных систем и OLAP системы. Эти системы позволяют обрабатывать данные не только в буквенно-цифровом формате, но и в виде визуальных объектов и векторов.

Преимущества OLAP системы

Применение OLAP системы дает организации возможности по прогнозированию и анализу различных ситуаций, связанных с текущей деятельностью и перспективами развития. Эти системы можно рассматривать как дополнение к системам автоматизации уровня предприятия. Все преимущества OLAP систем напрямую зависят от точности, достоверности и объема исходных данных.

Основными преимуществами OLAP системы являются:

  • согласованность исходной информации и результатов анализа. При наличии OLAP системы всегда есть возможность проследить источник информации и определить логическую связь между полученными результатами и исходными данными. Снижается субъективность результатов анализа.
  • проведение многовариантного анализа. Применение OLAP системы позволяет получить множество сценариев развития событий на основе набора исходных данных. За счет инструментов анализа можно смоделировать ситуации по принципу «что будет, если».
  • управление детализацией. Детальность представления результатов может изменяться в зависимости от потребности пользователей. При этом нет необходимости осуществлять сложные настройки системы и повторять вычисления. Отчет может содержать именно ту информацию, которая необходима для принятия решений.
  • выявление скрытых зависимостей. За счет построения многомерных связей появляется возможность выявить и определить скрытые зависимости в различных процессах или ситуациях, которые влияют на производственную деятельность.
  • создание единой платформы. За счет применения OLAP системы появляется возможность создать единую платформу для всех процессов прогнозирования и анализа на предприятии. В частности, данные OLAP системы, являются основой для построения прогнозов бюджета, прогноза продаж, прогноза закупок, плана стратегического развития и пр.

OLAP (Online Analytical Processing)- это система аналитической обработки данных. Она предназначена для подготовки отчетов, построения прогностических сценариев и выполнения статистических расчетов на базе больших информационных массивов, имеющих сложную структуру.

Подробнее о структуре этих систем, о самых распространенных их видах и об их основных характеристиках будет рассказано в представленной статье.

Особенности и структура OLAP систем

OLAP системы включают ключевые компоненты:

  • базу данных (БД) — источник, из которого берется информационный материал для обработки. Тип БД определяется разновидностью OLAP системы и порядком выполнения действий OLAP сервера. Чаще всего пользуются реляционными и многомерными БД и хранилищами данных;

  • OLAP сервер — ядро системы, с помощью которого проводится обработка многомерных структур данных, и обеспечивается связь между БД и пользователями систем;

  • приложения для работы пользователей, в которых формируются запросы и визуализируются полученные ответы.

Специфика обработки данных OLAP системами состоит в построении многомерных, то есть имеющих большое количество связей между отдельными элементами, массивов информации. Для формирования таких массивов OLAP система собирает данные из различных источников (например, из хранилищ данных, из информационных систем управления предприятием (ERP) или из системы взаимодействия с клиентами (CRM)). После этого информация обрабатывается на OLAP сервере и передается в пользовательские приложения.

Хранение и обработка данных с применением OLAP систем могут осуществляться:

  • непосредственно на рабочих местах пользователей;

  • в форме реляционных баз данных — при совместной работе OLAP систем с ERP или CRM-системами;

  • в форме многомерных баз данных на обособленных серверах.

OLAP системы применяются главным образом в сфере принятия стратегических управленческих решений и используются для бюджетирования, построения прогностических моделей, подготовки финансовой отчетности, хранения результатов.

Основные типы OLAP систем

Техники обработки и варианты хранения информации в БД классифицируют системы OLAP на несколько видов:

  • системы ROLAP, работающие с реляционными БД, в которых данные сгруппированы в табличной форме. В системах такого типа возможна аналитика информации в виде чисел и текстов;

  • MOLAP системы — многомерные системы, в которых данные в ходе обработки структурируются в OLAP кубы на специализированных серверах.

  • HOLAP системы — «смешанные» системы, в которых объединены алгоритмы многомерной структуризации данных в форме кубов и размещения их в реляционных таблицах.

Характеристики OLAP систем

Характеристики OLAP систем делятся на основные и специальные. Основные представлены:

  • многомерностью моделей данных, то есть их многовариантностью и большим количеством проекций;

  • интуитивностью механизмов работы с информацией — все манипуляции проводятся без задействования сложных меню;

  • клиент-серверной архитектурной ориентированностью;

  • доступностью данных — с помощью таких систем выстраивается надежная взаимосвязь между разнородными источниками информации и рабочим интерфейсом;

  • пакетным извлечением данных, которое позволяет обеспечить не только хранение анализируемых данных, но и динамический доступ к их источникам;

  • прозрачностью — определяется возможностью полного доступа к инструментам OLAP системы и к разнородным источникам данных;

  • многопользовательской работой, которая гарантирует одновременный доступ к информации с ее извлечением, обновлением при условиях сохранения ее в безопасности и целостности.

Специальные характеристики OLAP систем включают:

  • обработку ненормализованной (избыточно введенной в БД) информации;

  • хранение OLAP результатов с разграничением от исходных данных;

  • выделение отсутствующих данных (то есть данных, которые не определяются или не имеют смысла), отличающихся по значению от нуля;

  • обработку отсутствующих значений, которые (независимо от их источника) игнорируются в ходе аналитики.

Обучиться работе с системами OLAP каждый желающий сможет, пройдя курс профессиональной переподготовки по программе «Инструментальные средства бизнес-аналитики», которую проводит ВШБИ НИУ ВШЭ. Записаться на обучение по данному курсу можно на нашем сайте.

← Назад к списку

20.07.2006, Чт, 13:07, Мск Усилия, затраченные на сбор информации, не оправдают себя, если полученные данные должным образом не проанализировать. Для эффективного выполнения этой задачи необходимы специализированные ИТ-решения, в частности, OLAP-системы. Полный текст статьи опубликован в февральском номере журнала CNews.

страницы: 1 | 2 | следующая

Объемы данных в современном мире растут огромными темпами, поэтому оценить и проанализировать их должным образом без специального ИТ-инструментария, относящегося к классу Business Intelligence, сегодня практически невозможно. Одним из основных компонентов решений BI является OLAP (On-Line Analytical Processing), оперативный анализ данных, представляющий собой комплекс ИТ-решений, направленных на интерактивный интуитивный анализ больших объемов информации.

Отличительным признаком OLAP-систем является представление данных в виде многомерных кубов. Вся информация бизнес-процесса систематизируется, разбивается на категории, которые в свою очередь преобразовываются в оси (измерения) многомерных кубов. Подобный подход позволяет предоставлять все данные в виде визуальных, интуитивно понятных двух- или трехмерных срезов таких кубов. Пользователь может самостоятельно выбирать срезы по тем или иным категориям, что позволяет совмещать, сравнивать и анализировать информацию по всевозможным направлениям, представленным в виде измерений сформированного куба. При этом каждое измерение может быть в свою очередь разбито на подизмерения в зависимости от рода информации.

Неповоротливый гигантизм

История создания OLAP-систем восходит к 1962 году, когда Кен Айверсон опубликовал книгу «Язык программирования». Айверсон разработал первый язык, который давал возможность многомерного программирования (хотя из-за своей сложности он не нашел широкого применения). Уже в 1970 году вышел первый программный продукт Express, позволяющий проводить многомерный анализ данных. Express до сих пор является одним из лидеров рынка OLAP, входя в состав Oracle9i Database. В 1992 году появился Essbase, который стал первым серьезным продуктом, занявшим прочные позиции на ИТ-рынке, а спустя год Эдгар Кодд ввел в обращение термин OLAP.

Однако динамичный рост сегмента OLAP-решений начался лишь в 1994 году. По данным The OLAP Report, тогда объем продаж составлял $500 млн. Однако, решения быстро снискали популярность, и рынок стал расширяться быстрыми темпами. При этом ежегодный рост объема рынка в период 1994-1998 годов достигал 40-45%, хотя в дальнейшем произошло замедление темпов. Причем последний 45-процентный скачок в 1998 году был вызван, по мнению аналитиков, выходом Microsoft SQL Server 7.0.

Динамика объема рынка OLAP, $ млрд.

* прогноз

После 2000 года двузначного роста рынок OLAP уже не показывал. Этот факт многие аналитики связывают с активной деятельностью Microsoft, которая вытеснила с рынка многие OLAP-решения, существовавшие до 1998 года. Среди них Acuity, Acumate, Gentia, Media, MetaCube, Mineshare, Pilot, Prodea Beacon, WhiteLight. В результате развитие рынка в целом пошло намного медленнее, нежели рост нескольких гигантов, занимающих исключительные позиции. По итогам 2005 года объем рынка составил $5 млрд.

Из чего выбирать?

Жесткая конкуренция на рынке OLAP, которую можно наблюдать в последнее время, привела к тому, что осенью 2005 года практически все основные игроки выпустили очередные релизы своих продуктов, где постарались исправить ошибки прошлых версий. Основной акцент при этом в большинстве случаев был сделан на улучшении интеграции между реляционными и многомерными отчетами.

Рыночные доли разработчиков OLAP-решений по итогам 2004 года

Microsoft – демпинг и маркетинг
Microsoft Analysis Services (Microsoft SQL Server) не был оригинальной разработкой корпорации. Технология, разработанная в 1996 году, была куплена у компании Panorama Software Systems. Продукт Microsoft, созданный на основе этой технологии, быстро завоевал рынок OLAP-решений за счет усовершенствованной архитектуры хранения данных с применением ROLAP/MOLAP/ HOLAP, а также демпинговых цен и агрессивного маркетинга. Analysis Services 2005 выигрывает в цене у конкурентов, кроме того, корпорация изначально встраивала зачатки OLAP-системы в MS Office, а в Excel 2000 специальное приложение PivotTables помогало интегрироваться в виде OLAP-клиента к Microsoft Analytic Services. Безусловно Office 12 в этом смысле не будет исключением.

В Microsoft SQL Server 2005 в отличие от 2000-ого присутствует единая модель OLAP и реляционной отчетности. Если в SQL Server 2000 модель анализа данных использовала всю информацию OLAP-куба, то в новой версии модели можно строить по произвольным разрезам куба. При выборе одного измерения другие, связанные с ним, можно рассматривать как вложенные таблицы, причем к каждому допускается применение независимых разрезов. Новая версия продукта позволяет применять OLAP-модель к глобальному кубу, делить его на группы, создавать кластеры в режиме реального времени. Сервер позволяет постоянно обновлять кубы, сводя разницу между реляционными и многомерными базами к минимуму.

страницы: 1 | 2 | следующая