>
Платформа для построения аналитического хранилища данных
Itera Data Platform (IDP) – ETL-решение, включающее набор инструментов для решения задач построения корпоративного хранилища данных, загрузки данных в хранилище из источников, преобразования данных и построения витрин для отчетов, администрирования хранилища и мониторинга процессов обработки данных, экспорта и отправки отчетов в различные каналы.
IDP поддерживает работу с разными видами источников данных: корпоративные информационные системы (1С, Адванта), базы данных, файлы данных, веб-сервисы.
Основная задача, которую позволяет решить реализованный в IDP подход, – максимально снизить нагрузку на системы-источники данных и при этом обеспечить скорость доставки данных в отчеты пользователей, сопоставимую с прямым запросом BI-инструментов к системам-источникам данных.
Используемый подход предполагает организацию в хранилище данных многоуровневой архитектуры LSA (Layered Scalable Architecture), предусматривающей отдельные области для сырых данных, ядра хранилища и витрин для анализа данных. При этом последовательно выполняются конвейеры данных, включающие операции извлечения данных из источников, загрузки в слой сырых данных, очистки, трансформации и консолидации для целей анализа, формирования витрин для анализа данных средствами визуализации, а также для экспорта и отправки в различные каналы (электронная почта, корпоративный портал, общий диск, внешний ресурс).
Функциональные возможности
Инициализация структуры хранилища данных
- Инициализация областей хранилища данных:
- Сырые данные,
- Ядро,
- Витрины для анализа данных,
- Витрины для аудита данных,
- Витрины для экспорта данных.
- Автоматическое создание структуры хранения загруженных и преобразованных данных.
- Автоматическое обновление структуры хранения загруженных и преобразованных данных при изменении структуры данных в источниках.
Подключение к источникам данных и загрузка данных в хранилище
- Поддержка разных видов источников данных: базы данных, файлы данных, веб-сервисы.
- Интеграция с коннекторами для высокоскоростной загрузки данных из корпоративных систем:
- Возможности при работе с файловыми источниками данных:
- Выбор загружаемых диапазонов данных (для загрузки данных из Excel),
- Отслеживание изменений файлов данных (загрузка только измененных файлов данных).
- Инкрементальная загрузка данных из реляционных БД (загрузка только измененных данных).
Обработка данных в хранилище, подготовка витрин данных
- Поддержка шаблонов сценариев обработки данных.
- Оптимизированный процесс обработки данных: автоматическое построение плана обработки данных с максимальным распараллеливанием выполняемых операций.
Управление качеством данных (корректировка, анализ ошибок)
- Доступные операции корректировки данных:
- Удаление дубликатов,
- Проверка пустых значений,
- Сравнение с эталонными справочниками.
- Сохранение сведений об ошибках данных.
- Подготовка витрин для анализа ошибок данных.
Экспорт данных
- Регулярная выгрузка данных из хранилища в формате csv либо xlsx.
- Сохранение файлов выгрузки на корпоративном портале, в локальном или сетевом каталоге либо рассылка по электронной почте.
Интеграция с инструментами визуализации
- Подготовленные с помощью IDP витрины могут напрямую использоваться любым профессиональным BI-инструментом визуализации данных, включая отечественные или зарубежные аналитические системы (Modus BI, Polymatica, Visiology, Power BI и т.д.), open-source решения (Superset) или собственные разработки.
Отображение структуры хранилища и этапов обработки данных
- Через веб-интерфейс доступны следующие сведения:
- Детальная информация по всем источникам данных: параметры каждого источника, названия и типы полей;
- Детальная информация по всем объектам (таблицы и представления) в разных слоях хранилища данных: параметры каждого объекта, названия и типы полей;
- Исходные и скомпилированные скрипты обработки данных для каждого объекта хранилища.
Управление и мониторинг процессов обработки данных
- Через веб-интерфейс доступны операции запуска /остановки конвейеров данных, а также следующие представления:
- Последовательность операций обработки данных с возможностью просмотра деталей и текущего статуса каждой операции;
- Подробный журнал выполнения операций с информацией об ошибках выполнения;
- График динамики скорости выполнения операций.
Стоимость внедрения и использования ПО рассчитывается индивидуально. Для получения информации о стоимости Вы можете связаться с нами по e-mail: info@4dwh.ru
ООО «ИТЕРА»
+7 913 741-73-88
info@4dwh.ru
г. Москва, п. Первомайское, ул. Центральная, д. 24, помещ. 19п