Hadoop-рішення для захисту даних великих обсягів

Fìz.-mat. model. ìnf. tehnol. 2021, 33:23-27

  • Nataliya Maslova Донецький національний технічний університет, пл.Шибанкова, 2, м. Покровськ, Україна
  • Olha Polovynka Донецький національний технічний університет, пл.Шибанкова, 2, м. Покровськ, Україна
Ключові слова: технологія Hadoop, обробка даних, дані великих обсягів, Big Data, безпека даних, захист інформації

Анотація

Досліджено одну з проблем даних великого обсягу – забезпечення захисту в процесі накопичення та обробки. Розглядається випадок застосування технології Hadoop в її останній модифікації Apache Hadoop 3.3.0. Пропонується рішення з посиленням захисту оброблюваних даних й підключенням інструментів Apache Knox Gateway, Apache Ranger та Apache Atlas. Передбачена можливість застосування даних, отриманих в результаті роботи локальних баз, електронних архівів, систем управління базами та даних окремих користувачів. Особливостями рішення є також застосування приватної хмари й криптографічних алго-ритмів. Наведено приклад реалізації захищеного рішення до розв’язання задачі глибинного аналізу на прикладі паралельної версії задачі пошуку асоціативних правил при роботи з неструктурованими даними великих обсягів.

Опубліковано
2021-09-02