Itera

Data

Platform

Эффективное решение для аналитического хранилища данных

Itera Data Platform

>

Платформа для построения аналитического хранилища данных

Itera Data Platform (IDP) – ETL-решение, включающее набор инструментов для решения задач построения корпоративного хранилища данных, загрузки данных в хранилище из источников, преобразования данных и построения витрин для отчетов, администрирования хранилища и мониторинга процессов обработки данных, экспорта и отправки отчетов в различные каналы.

IDP поддерживает работу с разными видами источников данных: корпоративные информационные системы (1С, Адванта), базы данных, файлы данных, веб-сервисы.

Основная задача, которую позволяет решить реализованный в IDP подход, – максимально снизить нагрузку на системы-источники данных и при этом обеспечить скорость доставки данных в отчеты пользователей, сопоставимую с прямым запросом BI-инструментов к системам-источникам данных.

Используемый подход предполагает организацию в хранилище данных многоуровневой архитектуры LSA (Layered Scalable Architecture), предусматривающей отдельные области для сырых данных, ядра хранилища и витрин для анализа данных. При этом последовательно выполняются конвейеры данных, включающие операции извлечения данных из источников, загрузки в слой сырых данных, очистки, трансформации и консолидации для целей анализа, формирования витрин для анализа данных средствами визуализации, а также для экспорта и отправки в различные каналы (электронная почта, корпоративный портал, общий диск, внешний ресурс).

 

 

Функциональные возможности

Инициализация структуры хранилища данных

  • Инициализация областей хранилища данных:
  • Сырые данные,
  • Ядро,
  • Витрины для анализа данных,
  • Витрины для аудита данных,
  • Витрины для экспорта данных.
  • Автоматическое создание структуры хранения загруженных и преобразованных данных.
  • Автоматическое обновление структуры хранения загруженных и преобразованных данных при изменении структуры данных в источниках.

Подключение к источникам данных и загрузка данных в хранилище

  • Поддержка разных видов источников данных: базы данных, файлы данных, веб-сервисы.
  • Интеграция с коннекторами для высокоскоростной загрузки данных из корпоративных систем:
  • 1С,
  • Адванта.
  • Возможности при работе с файловыми источниками данных:
  • Выбор загружаемых диапазонов данных (для загрузки данных из Excel),
  • Отслеживание изменений файлов данных (загрузка только измененных файлов данных).
  • Инкрементальная загрузка данных из реляционных БД (загрузка только измененных данных).

Обработка данных в хранилище, подготовка витрин данных

  • Поддержка шаблонов сценариев обработки данных.
  • Оптимизированный процесс обработки данных: автоматическое построение плана обработки данных с максимальным распараллеливанием выполняемых операций.

Управление качеством данных (корректировка, анализ ошибок)

  • Доступные операции корректировки данных:
  • Удаление дубликатов,
  • Проверка пустых значений,
  • Сравнение с эталонными справочниками.
  • Сохранение сведений об ошибках данных.
  • Подготовка витрин для анализа ошибок данных.

Экспорт данных

  • Регулярная выгрузка данных из хранилища в формате csv либо xlsx.
  • Сохранение файлов выгрузки на корпоративном портале, в локальном или сетевом каталоге либо рассылка по электронной почте.

Интеграция с инструментами визуализации

  • Подготовленные с помощью IDP витрины могут напрямую использоваться любым профессиональным BI-инструментом визуализации данных, включая отечественные или зарубежные аналитические системы (Modus BI, Polymatica, Visiology, Power BI и т.д.), open-source решения (Superset) или собственные разработки.

Отображение структуры хранилища и этапов обработки данных

  • Через веб-интерфейс доступны следующие сведения:
  • Детальная информация по всем источникам данных: параметры каждого источника, названия и типы полей;
  • Детальная информация по всем объектам (таблицы и представления) в разных слоях хранилища данных: параметры каждого объекта, названия и типы полей;
  • Исходные и скомпилированные скрипты обработки данных для каждого объекта хранилища.

Управление и мониторинг процессов обработки данных

  • Через веб-интерфейс доступны операции запуска /остановки конвейеров данных, а также следующие представления:
  • Последовательность операций обработки данных с возможностью просмотра деталей и текущего статуса каждой операции;
  • Подробный журнал выполнения операций с информацией об ошибках выполнения;
  • График динамики скорости выполнения операций.

Стоимость продукта

Стоимость внедрения и использования ПО рассчитывается индивидуально. Для получения информации о стоимости Вы можете связаться с нами по e-mail: info@4dwh.ru

Документация

Контакты

ООО «ИТЕРА»

+7 913 741-73-88

г. Москва, п. Первомайское, ул. Центральная, д. 24, помещ. 19п

© 2024 ООО «ИТЕРА»