flag ru Ru row down
flag ru Russian
flag en English
flag ru Ru row down
flag ru Russian
flag en English

Из чего состоит
Legato data

scheme
Хранилища
row-right row-down
slow-rep
Медленные хранилища
Позволяют сэкономить бюджет, если нет необходимости в быстрой обработке данных для отчетности. Мы используем следующие хранилища:
  • Self-hosted S3 storages (Minio, Ceph, etc)
  • Cloud-hosted S3 storages (AWS, Azure, ect)
slow-rep
Быстрые хранилища
Позволяют реализовать сложные аналитические отчеты без потери производительности. Мы используем следующие быстрые хранилища:
  • Druid
  • Clickhouse
Вычислительный кластер
row-right row-down
slow-rep
В качестве вычислительного кластера используется Spark
Преимущества данной технологии:
  • Стабильная работа при больших объемах данных
  • Параллельное выполнение задач
  • Возможность использования разных языков программирования при описании задач преобразования данных
  • Поддержка трех аналитических форматов хранения данных: parquet, iceberg и hudi
  • Поддержка как пакетных, так и потоковых задач обработки данных
  • Существование единого хранилища мета-информации о таблицах
  • Возможность подключения через jdbc
slow-rep
Собственное решение
Нами разработано решение для мониторинга, оркестрации, логирования и алертинга Spark - приложений, позволяющее проще отлаживать задачи обработки данных на вычислительном кластере.
Построение дашбордов
row-right row-down
slow-rep
Для построения дашбордов используются следующие встроенные технологии:
  • Superset
  • Metabase
При этом мы можем интегрировать любые другие BI-системы, представленные на современном рынке
Data governance
row-right row-down
Для поддержки Data Governance используем Datahub и Atlas
Преимущества данных технологий:
  • Удобное ведение глоссария сущностей предметной области
  • Снижение затрат на onboarding новых сотрудников на проекте
  • Документирование особенностей проекта непосредственно в системе
slow-rep

Наши Преимущества:
Сравнение с Конкурентами

LegatoData представляет собой уникальную и гибкую платформу, охватывающую всесторонние решения для DWH, ETL, Data Governance.
Ниже представлена таблица, которая демонстрирует наши конкурентные преимущества по сравнению с другими игроками на российском рынке.
logo Arenadata logo Almaz Bi logo Zyfra logo Loginom logo
Обеспечивающие сервисы
row-right row-down
Импортозамещение plus plus plus minus minus
Гибридная инфраструктура: On premise и Cloud plus plus plus minus minus
Единая система мониторинга plus minus minus minus minus
DWH
row-right row-down
Работа с SQL: queries, UDF plus plus plus plus plus
Встроенная поддержка R, Python и Scala plus plus plus plus plus
Собственное хранилище (поддержка разных веток) plus plus plus plus minus
Multi-tenant plus plus plus plus minus
ETL
row-right row-down
Валидация данных plus plus plus plus minus
Загрузка данных в пакетном режиме: инкрементальная, интервальная, полная plus plus plus plus minus
История запусков, отладка и мониторинг процессов ETL plus plus plus plus minus
Визорд для построения пайпланов plus plus plus plus minus
Конструктор типовых витрин данных plus plus plus plus minus
BI
row-right row-down
Возможность интеграции с любыми BI-системами. Например: Tableau, Power BI, Superset plus plus plus plus minus
Data Governance
row-right row-down
Data Catalog plus plus plus plus minus
Data quality tests plus plus plus plus minus
Data Security Management plus plus plus plus minus
Интеграции
row-right row-down
OLTP, OLAP, Message Brokers и API plus plus plus plus minus
Возможность интегрировать плагины других вендоров plus plus plus plus minus
Импорт и парсинг JSON, CSV, TXT, XLS, XLSX, XML файлов plus plus plus plus minus
AI/ML
row-right row-down
Deep Learning/Machine Learning Platform (PySpark, PyTorch, Jupyter Notebook, Numpy, Scipy) plus plus plus plus minus
Цифровые двойники (Digital Twins Data) plus plus plus plus minus
LLM (поддержка больших языковых моделей) plus plus plus plus minus
Обеспечивающие сервисы
row-down row-right
Импортозамещение
row-down row-right
Гибридная инфраструктура: On premise и Cloud
row-down row-right
Единая система мониторинга
row-down row-right
DWH
row-down row-right
Работа с SQL: queries, UDF
row-down row-right
Встроенная поддержка R, Python и Scala
row-down row-right
Собственное хранилище (поддержка разных веток)
row-down row-right
Multi-tenant
row-down row-right
ETL
row-down row-right
Валидация данных
row-down row-right
Загрузка данных в пакетном режиме: инкрементальная, интервальная, полная
row-down row-right
История запусков, отладка и мониторинг процессов ETL
row-down row-right
Визорд для построения пайпланов
row-down row-right
Конструктор типовых витрин данных
row-down row-right
BI
row-down row-right
Возможность интеграции с любыми BI-системами. Например: Tableau, Power BI, Superset
row-down row-right
Data Governance
row-down row-right
Data Catalog
row-down row-right
Data quality tests
row-down row-right
Data Security Management
row-down row-right
Интеграции
row-down row-right
OLTP, OLAP, Message Brokers и API
row-down row-right
Возможность интегрировать плагины других вендоров
row-down row-right
Импорт и парсинг JSON, CSV, TXT, XLS, XLSX, XML файлов
row-down row-right
AI/ML
row-down row-right
Deep Learning/Machine Learning Platform (PySpark, PyTorch, Jupyter Notebook, Numpy, Scipy)
row-down row-right
Цифровые двойники (Digital Twins Data)
row-down row-right
LLM (поддержка больших языковых моделей)
row-down row-right