ГІПЕРКУБИ OLAP ЯК ЗАСІБ АНАЛІЗУ БАГАТОВИМІРНИХ СИЛЬНО СТРУКТУРОВАНИХ ДАНИХ
DOI:
https://doi.org/10.31319/2519-8106.2(51)2024.317498Ключові слова:
аналіз багатовимірних даних, OLAP, ROLAP, гіперкуб, реляційне сховище даних, модель даних «сніжинка»Анотація
Статтю присвячено аналізу технології OLAP з точки зору багатовимірного аналізу даних, збережених у реляційних сховищах даних. Технологія OLAP забезпечує збереження і представлення інформації для її комплексного аналізу за рахунок узагальнення даних великих масивів, структурованих за принципом багатовимірності. Для застосування OLAP технології для проведення багатовимірного аналізу даних та їх візуалізації необхідно перетворити вхідні дані до специфічної архітектури сховища даних OLAP, визначивши категорії-виміри, які використовуються для реалізації багатовимірних запитів. В статті описано основні об’єкти технології OLAP: гіперкуб, вимір, показник, таблиця вимірів і фактів; наведено опис моделей перетворення реляційної структури даних до багатовимірної моделі. Багатовимірний куб або гіперкуб
даних — це абстрактне представлення підмножин даних у декількох вимірах одночасно, операції з яким можуть бути застосовано для різностороннього аналізу багатовимірних даних. Вимірами гіперкубу є числові значення, числові значення, координати яких представляються індивідуальними значеннями атрибутів, що містяться в таблиці фактів. Показниками гіперкубу є чисельні значення, які зіставляються з числовими значеннями стовпців таблиці фактів.
Авторами запропоновано узагальнений алгоритм застосування технології OLAP для здійснення багатовимірного аналізу даних, який полягає у виконанні таких кроків, як: отримання вхідних даних, визначення показників і вимірів, формування багатовимірної моделі даних, формування структури запитів, обробка отриманих даних. Наведено результати проєктування гіперкубу на основі статистичних даних результатів національного мультипредметного тесту, збережених у таблицях створеного реляційного сховища даних. З метою демонстрації принципів використання гіперкубу для аналізу багатовимірних даних в статті наведено результати застосування операцій: slicе, diсе, rotation, drill-down, roll-up.
Посилання
Samotyy, V., Dzelendzyak, U. (2016). Multivariate data analysis using OLAP cubes in billing system. Bullitin of LSU, 13, 32—38.
Yalova, K., Yasyna, K. Konratenko, A. (2019). OLAP technology for the relational databases analysis. LOGOS, 8, 69—73.
Kharkianen, O. V., Gladka, Y. A. (2019). Information support for product sales by intellectual data analysis methods. Мodelling and information systems in economy, 2019, 209—214. doi: 10.33111/mise.98.20.
Sarsimbaeva, S., Dimitrov, V. (2019) Multidimensional data analysis with OLAP. CEUR, 2464, 95—98.
Kovacic, I., Schuetz. C., Neumayr, B., Schrefl, M. (2022). OLAP Patterns: A pattern-based ap-proach tomultidimensional data analysis. Data & Knowledge Engineering, 138, 101948.
Zhou, X.-H., Zhang, X.-M. (2017). The application of OLAP and Data mining technology in the analysis of book lending. Advances in Engineering Research, 118, 368—373.
Leveraging OLAP for Advanced Data Analysis. URL: https://www.kandasoft.com/blog/leveraging-olap-for-advanced-data-analysis
Yadav, A., Singh, B. (2023). Improve the performance of multidimensional data for OLAP by using an optimization approach. AIP Conference Proceedings, 2745. doi: https://doi.org/10.1063/5.0132474
Mao, Y., Huang, S., Cui, S., Wang, H., Zhang, J., Ding, W. (2020). Multi dimensional data distribution monitoring based on OLAP. Proceedings of the 2nd International Conference on Infor-mation Technology and Computer Application (ITCA’20), pp. 1—15, Guangzhou, China.
Francia, M., Marcel, P., Peralta, V., Rizzi, S. (2022) Enhancing Cubes with Models to Describe Multidimensional Data. Information System Frontiers, 24(1), 31—48. doi: 10.1007/s10796-021-10147-3.
Cuzzocrea, A., Maio, C., Fenza, G., Loia, V., Parente, M. (2016) OLAP analysis of multidimen-sional tweet streams for supporting advanced analytics, Proceedings of the 31st Annual ACM Sym-posium on Applied Computing (SAIC’16), pp. 992—999, New York, USA. doi: https://doi.org/10.1145/2851613.2851662.
Li, X., Shen, Q., Yang, T. (2024). Design and optimization of multidimensional data models for enhanced OLAP query performance and data analysis. Applied and Computational Engineering, 69, 161—166. doi: https://doi.org/10.54254/2755-2721/69/20241503.
Neha, Garg, K. (2017). Efficient information retrieval using multidimensional OLAP cube. International Research Journal of Engineering and Technology, 4(7), 2885—2889.
Appah, B., Amos, D. (2018). Multidimensional data model for health service decision making data. International Journal of Computer Science Engineering Techniques, 3(3), 1—6.
Hu, R. (2017). The design of OLAP-based muti-dimensional analysis system for hospital information. Scholars Journal of Engineering and Technology, 5(2), 76—80.
Самотий В. В. Дзелендзяк У. Ю. Багатовимірний аналіз даних у білінговій системі з викори-станням OLAP кубів. Вісник ЛДУ. 2016. №13. С. 32—38.
Ялова К. М., Яшина К. В., Кондратенко А. І. Технологія OLAP для аналізу реляційних баз даних. LOGOS. 2019. №8. С.69—73.
Харкянен О. В., Гладка Ю. А. Інформаційна підтримка збуту продукції методами інтелекту-ального аналізу даних. Моделювання та інформаційні систем в економіці. 2019. №98. С. 209—214. DOI: 10.33111/mise.98.20.
Sarsimbaeva S., Dimitrov V. Multidimensional data analysis with OLAP. CEUR. 2019. 2464. P. 95—98.
Kovacic I., Schuetz C., Neumayr B., Schrefl M. OLAP Patterns: A pattern-based approach tomultidimensional data analysis. Data & Knowledge Engineering. 2022. Vol. 138. P.101948.
Zhou X.-H., Zhang X.-M. The application of OLAP and Data mining technology in the analysis of book lending. Advances in Engineering Research. 2017. Vol. 118. P. 368—373.
Leveraging OLAP for Advanced Data Analysis. URL: https://www.kandasoft.com/blog/leveraging-olap-for-advanced-data-analysis (дата звернення: 30.08.2024).
Yadav A., Singh B. Improve the performance of multidimensional data for OLAP by using an optimization approach. AIP Conference Proceedings. 2023. Vol. 2745. doi: https://doi.org/10.1063/5.0132474.
Mao Y., Huang S., Cui S., Wang H., Zhang J., Ding W. Multi dimensional data distribution monitoring based on OLAP. Proceedings of the 2nd International Conference on Information Technology and Computer Application (ITCA’20), Guangzhou, China, 2020. pp. 1—15.
Francia M., Marcel P., Peralta V., Rizzi S. Enhancing Cubes with Models to Describe Multidimensional Data. Information System Frontiers. 2022. 24(1). P. 31—48. doi: 10.1007/s10796-021-10147-3.
Cuzzocrea A., Maio C., Fenza G., Loia V., Parente M. OLAP analysis of multidimensional tweet streams for supporting advanced analytics, Proceedings of the 31st Annual ACM Symposium on Applied Computing (SAIC’16), New York, USA, 2016. pp. 992—999. doi: https://doi.org/10.1145/2851613.2851662.
Li X., Shen Q., Yang T. Design and optimization of multidimensional data models for enhanced OLAP query performance and data analysis. Applied and Computational Engineering. 2024. Vol. 69, P. 161—166. doi: https://doi.org/10.54254/2755-2721/69/20241503.
Neha, Garg K. Efficient information retrieval using multidimensional OLAP cube. International Research Journal of Engineering and Technology. 2018. Vol. 4(7). P. 2885—2889.
Appah B., Amos D. Multidimensional data model for health service decision making data. International Journal of Computer Science Engineering Techniques. 2018. Vol. 3. Issue 3. P. 1—6.
Hu R. The design of OLAP-based muti-dimensional analysis system for hospital information. Scholars Journal of Engineering and Technology. 2017. Vol. 5. Issue 2. P. 76—80.
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:
a. Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
b. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
c. Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).