ГІПЕРКУБИ OLAP ЯК ЗАСІБ АНАЛІЗУ БАГАТОВИМІРНИХ СИЛЬНО СТРУКТУРОВАНИХ ДАНИХ

Автор(и)

  • К.М. Ялова Дніпровський державний технічний університет, м. Кам'янське, Україна https://orcid.org/0000-0002-2687-5863
  • М.В. Бабенко Дніпровський державний технічний університет, м. Кам'янське, Україна https://orcid.org/0000-0003-1013-9383
  • В.В. Ісмаілов Дніпровський державний технічний університет, м. Кам'янське, Україна

DOI:

https://doi.org/10.31319/2519-8106.2(51)2024.317498

Ключові слова:

аналіз багатовимірних даних, OLAP, ROLAP, гіперкуб, реляційне сховище даних, модель даних «сніжинка»

Анотація

Статтю присвячено аналізу технології OLAP з точки зору багатовимірного аналізу даних, збережених у реляційних сховищах даних. Технологія OLAP забезпечує збереження і представлення інформації для її комплексного аналізу за рахунок узагальнення даних великих масивів, структурованих за принципом багатовимірності. Для застосування OLAP технології для проведення багатовимірного аналізу даних та їх візуалізації необхідно перетворити вхідні дані до специфічної архітектури сховища даних OLAP, визначивши категорії-виміри, які використовуються для реалізації багатовимірних запитів. В статті описано основні об’єкти технології OLAP: гіперкуб, вимір, показник, таблиця вимірів і фактів; наведено опис моделей перетворення реляційної структури даних до багатовимірної моделі. Багатовимірний куб або гіперкуб
даних — це абстрактне представлення підмножин даних у декількох вимірах одночасно, операції з яким можуть бути застосовано для різностороннього аналізу багатовимірних даних. Вимірами гіперкубу є числові значення, числові значення, координати яких представляються індивідуальними значеннями атрибутів, що містяться в таблиці фактів. Показниками гіперкубу є чисельні значення, які зіставляються з числовими значеннями стовпців таблиці фактів.

Авторами запропоновано узагальнений алгоритм застосування технології OLAP для здійснення багатовимірного аналізу даних, який полягає у виконанні таких кроків, як: отримання вхідних даних, визначення показників і вимірів, формування багатовимірної моделі даних, формування структури запитів, обробка отриманих даних. Наведено результати проєктування гіперкубу на основі статистичних даних результатів національного мультипредметного тесту, збережених у таблицях створеного реляційного сховища даних. З метою демонстрації принципів використання гіперкубу для аналізу багатовимірних даних в статті наведено результати застосування операцій: slicе, diсе, rotation, drill-down, roll-up.

Посилання

Samotyy, V., Dzelendzyak, U. (2016). Multivariate data analysis using OLAP cubes in billing system. Bullitin of LSU, 13, 32—38.

Yalova, K., Yasyna, K. Konratenko, A. (2019). OLAP technology for the relational databases analysis. LOGOS, 8, 69—73.

Kharkianen, O. V., Gladka, Y. A. (2019). Information support for product sales by intellectual data analysis methods. Мodelling and information systems in economy, 2019, 209—214. doi: 10.33111/mise.98.20.

Sarsimbaeva, S., Dimitrov, V. (2019) Multidimensional data analysis with OLAP. CEUR, 2464, 95—98.

Kovacic, I., Schuetz. C., Neumayr, B., Schrefl, M. (2022). OLAP Patterns: A pattern-based ap-proach tomultidimensional data analysis. Data & Knowledge Engineering, 138, 101948.

Zhou, X.-H., Zhang, X.-M. (2017). The application of OLAP and Data mining technology in the analysis of book lending. Advances in Engineering Research, 118, 368—373.

Leveraging OLAP for Advanced Data Analysis. URL: https://www.kandasoft.com/blog/leveraging-olap-for-advanced-data-analysis

Yadav, A., Singh, B. (2023). Improve the performance of multidimensional data for OLAP by using an optimization approach. AIP Conference Proceedings, 2745. doi: https://doi.org/10.1063/5.0132474

Mao, Y., Huang, S., Cui, S., Wang, H., Zhang, J., Ding, W. (2020). Multi dimensional data distribution monitoring based on OLAP. Proceedings of the 2nd International Conference on Infor-mation Technology and Computer Application (ITCA’20), pp. 1—15, Guangzhou, China.

Francia, M., Marcel, P., Peralta, V., Rizzi, S. (2022) Enhancing Cubes with Models to Describe Multidimensional Data. Information System Frontiers, 24(1), 31—48. doi: 10.1007/s10796-021-10147-3.

Cuzzocrea, A., Maio, C., Fenza, G., Loia, V., Parente, M. (2016) OLAP analysis of multidimen-sional tweet streams for supporting advanced analytics, Proceedings of the 31st Annual ACM Sym-posium on Applied Computing (SAIC’16), pp. 992—999, New York, USA. doi: https://doi.org/10.1145/2851613.2851662.

Li, X., Shen, Q., Yang, T. (2024). Design and optimization of multidimensional data models for enhanced OLAP query performance and data analysis. Applied and Computational Engineering, 69, 161—166. doi: https://doi.org/10.54254/2755-2721/69/20241503.

Neha, Garg, K. (2017). Efficient information retrieval using multidimensional OLAP cube. International Research Journal of Engineering and Technology, 4(7), 2885—2889.

Appah, B., Amos, D. (2018). Multidimensional data model for health service decision making data. International Journal of Computer Science Engineering Techniques, 3(3), 1—6.

Hu, R. (2017). The design of OLAP-based muti-dimensional analysis system for hospital information. Scholars Journal of Engineering and Technology, 5(2), 76—80.

Самотий В. В. Дзелендзяк У. Ю. Багатовимірний аналіз даних у білінговій системі з викори-станням OLAP кубів. Вісник ЛДУ. 2016. №13. С. 32—38.

Ялова К. М., Яшина К. В., Кондратенко А. І. Технологія OLAP для аналізу реляційних баз даних. LOGOS. 2019. №8. С.69—73.

Харкянен О. В., Гладка Ю. А. Інформаційна підтримка збуту продукції методами інтелекту-ального аналізу даних. Моделювання та інформаційні систем в економіці. 2019. №98. С. 209—214. DOI: 10.33111/mise.98.20.

Sarsimbaeva S., Dimitrov V. Multidimensional data analysis with OLAP. CEUR. 2019. 2464. P. 95—98.

Kovacic I., Schuetz C., Neumayr B., Schrefl M. OLAP Patterns: A pattern-based approach tomultidimensional data analysis. Data & Knowledge Engineering. 2022. Vol. 138. P.101948.

Zhou X.-H., Zhang X.-M. The application of OLAP and Data mining technology in the analysis of book lending. Advances in Engineering Research. 2017. Vol. 118. P. 368—373.

Leveraging OLAP for Advanced Data Analysis. URL: https://www.kandasoft.com/blog/leveraging-olap-for-advanced-data-analysis (дата звернення: 30.08.2024).

Yadav A., Singh B. Improve the performance of multidimensional data for OLAP by using an optimization approach. AIP Conference Proceedings. 2023. Vol. 2745. doi: https://doi.org/10.1063/5.0132474.

Mao Y., Huang S., Cui S., Wang H., Zhang J., Ding W. Multi dimensional data distribution monitoring based on OLAP. Proceedings of the 2nd International Conference on Information Technology and Computer Application (ITCA’20), Guangzhou, China, 2020. pp. 1—15.

Francia M., Marcel P., Peralta V., Rizzi S. Enhancing Cubes with Models to Describe Multidimensional Data. Information System Frontiers. 2022. 24(1). P. 31—48. doi: 10.1007/s10796-021-10147-3.

Cuzzocrea A., Maio C., Fenza G., Loia V., Parente M. OLAP analysis of multidimensional tweet streams for supporting advanced analytics, Proceedings of the 31st Annual ACM Symposium on Applied Computing (SAIC’16), New York, USA, 2016. pp. 992—999. doi: https://doi.org/10.1145/2851613.2851662.

Li X., Shen Q., Yang T. Design and optimization of multidimensional data models for enhanced OLAP query performance and data analysis. Applied and Computational Engineering. 2024. Vol. 69, P. 161—166. doi: https://doi.org/10.54254/2755-2721/69/20241503.

Neha, Garg K. Efficient information retrieval using multidimensional OLAP cube. International Research Journal of Engineering and Technology. 2018. Vol. 4(7). P. 2885—2889.

Appah B., Amos D. Multidimensional data model for health service decision making data. International Journal of Computer Science Engineering Techniques. 2018. Vol. 3. Issue 3. P. 1—6.

Hu R. The design of OLAP-based muti-dimensional analysis system for hospital information. Scholars Journal of Engineering and Technology. 2017. Vol. 5. Issue 2. P. 76—80.

##submission.downloads##

Опубліковано

2024-12-24

Номер

Розділ

Статті