Платформы данных:

хранилища, обработка, миграция

Инфраструктура для сбора, хранения и анализа данных на площадке заказчика. От систем хранения — к полноценным платформам для работы с данными, включая обнаружение и классификацию чувствительной информации.

Задачи, с которыми к нам приходят
  • Проектирование хранилищ данных
    Выбор архитектуры хранения под задачу: транзакционные базы, аналитические хранилища, архивы телеметрии. Расчёт ёмкости с учётом роста данных на 3–5 лет. Встроенное резервирование и сжатие.
  • Миграция баз данных между платформами
    Перенос данных с устаревших систем хранения на новые без остановки сервисов. Проверка целостности, тестирование производительности после миграции. План отката на случай непредвиденных ситуаций.
  • Локализация данных на территории РК
    азмещение всей инфраструктуры хранения и обработки данных на площадке заказчика. Соответствие требованиям к локализации персональных данных и защите критической инфраструктуры.
  • Обнаружение и классификация чувствительных данных
    Автоматический поиск и категоризация данных по всей инфраструктуре: персональные данные, финансовая информация, коммерческая тайна. Формирование карты данных для регуляторной отчётности и контроля доступа.
  • Подготовка инфраструктуры для аналитических платформ
    Проектирование вычислительного и сетевого слоя под развёртывание lakehouse-платформ и аналитических сред. Интеграция с существующими источниками данных: SCADA, ERP, биллинг.
Типовые архитектуры на базе нашего портфеля
Корпоративное хранилище данных для банка или оператора связи
Высокопроизводительная система хранения для транзакционных баз данных и биллинговых платформ. Встроенная дедупликация и сжатие сокращают занимаемый объём в несколько раз. Обновление оборудования без остановки сервисов.

Состав: Pure Storage FlashArray для основной нагрузки, IBM FlashSystem для гибридных сценариев, репликация между площадками для аварийного восстановления.

Целевые показатели:
— Стабильная производительность при пиковых нагрузках
— Обновление оборудования без простоя
— Сжатие данных: сокращение занимаемого объёма в несколько раз
Lakehouse-платформа для промышленных данных
Единое хранилище для структурированных и неструктурированных данных: телеметрия с датчиков, журналы оборудования, результаты видеоаналитики. Данные доступны для построения отчётов, дашбордов и обучения моделей ИИ.

Состав: iomete (open-source lakehouse-платформа), Pure Storage FlashBlade для хранения больших объёмов данных, периферийные серверы для сбора на промплощадках.

Целевые показатели:
— Единое хранилище для всех типов промышленных данных
— Данные доступны для аналитики и моделей ИИ без дополнительных преобразований
— Хранение полной истории без удаления устаревших данных
Платформа обнаружения и классификации чувствительных данных
Автоматическое сканирование всех хранилищ и баз данных в инфраструктуре заказчика. Идентификация персональных данных, финансовой информации, данных ограниченного доступа. Формирование карты данных и отчётов для регулятора.

Состав: 1touch.io (платформа обнаружения и классификации данных), интеграция с существующими СХД и базами данных.

Целевые показатели:
— Полная карта чувствительных данных по всей инфраструктуре
— Автоматическая классификация без ручного аудита
— Готовая отчётность для регуляторных проверок
Миграция данных с устаревших систем хранения
Поэтапный перенос данных с оборудования, вышедшего из поддержки производителя, на современные системы хранения. Параллельная работа старой и новой платформы на время миграции. Проверка целостности каждого этапа.

Состав: Pure Storage FlashArray или IBM FlashSystem как целевая платформа, инструменты миграции производителя, план отката.

Целевые показатели:
— Миграция без остановки сервисов
— Проверка целостности данных на каждом этапе
— Готовый план отката в случае непредвиденной ситуации
От обследования до SLA за четыре шага
2-4 недели

Обследование


2-4 недели

3-6 недель

Проектирование


3-6 недель

4–16 недель

Поставка и внедрение


4-16 недель

по плану

Сопровождение


На постоянной основе

Производители в направлении промышленной аналитики и ИИ
  • Производители: IOMETE · 1touch.io · Pure Storage · IBM

    iomete — open-source lakehouse-платформа для хранения и обработки данных 
    1touch.io — автоматическое обнаружение и классификация чувствительных данных 
    Pure Storage — высокопроизводительные системы хранения (FlashArray, FlashBlade) 
    IBM — корпоративные системы хранения (FlashSystem), управление данными
Частые вопросы
Ответы на то, что обычно спрашивают до первой встречи
Готовы обсудить платформу данных?
Опишите задачу — инженеры подберут архитектуру хранения и обработки данных под ваши объёмы, нагрузки и регуляторные требования.
Связанные разделы

Серверы, СХД, сети — фундамент, на котором строится безопасность

Защита данных и моделей от несанкционированного доступа

Аналитические модели и ИИ поверх ваших данных

Производители, статусы и компетенции