Data Mining для дослідницьких цілей
DOI:
https://doi.org/10.15407/sofs2025.02.027Ключові слова:
data mining, емпірична закономірність, навчальна вибірка, ознаковий простір, проєктування даних.Анотація
Розглянуто можливість використання методів Data Mining (DM) у науковому дослідженні, спрямованому на пізнання, яке потребує відповіді на питання «чому?», а також зв’язку методів DM із загальними питаннями пізнання. Методологія дослідження знаходиться на стику математики, статистики, інформатики, теорії управління. Поряд із використанням загальнонаукових методів пізнання (узагальнення, систематизація, абстрагування, індукція і дедукція, аналіз і синтез, аналогія, порівняння, формалізація, моделювання, класифікація, категоризація) застосовано спеціальні методи аналізу (логічний, структурний, функціональний), описовий метод дослідження, інтерпретаційну методологію. Уточнено зв’язок методів DM із загальною теорією пізнання. Обґрунтовано, що методи DM — це нова, людино-машинна методологія емпіричного пізнання. Вказано на обмеженість цих методів — результатами їх використання є емпіричні закономірності (ЕМЗ), тобто ймовірні (а не точні) знання, на основі яких формулюють інструкції або правила ухвалення рішення, але залишаються на першому, найнижчому з можливих, емпіричному рівні пізнання, що є характерним для бізнесу. Але головна мета наукових досліджень — отримання дійсно нових знань, які надалі можуть бути втілені в інновації та забезпечити конкурентну перевагу вищого порядку. ЕМЗ можуть слугувати «заготовками» для формулювання, перевірки та відбору гіпотез з метою подальшого глибшого пізнання предметної області та отримання надійніших знань, що наближають дослідника до розуміння. А якщо з’являється розуміння, це означатиме, що знайдено дещо таке, що лежить в основі отриманого знання і може стати новим методом розв’язання поставлених завдань. Знання — це відомості, а розуміння — здатність робити висновки. На сьогоднішній день це межа застосовності всіх інструментів DM: вони дають знання у вигляді емпіричних і робочих гіпотез, але не дають розуміння, без якого неможливий перехід до наступного рівня пізнання — наукового методу.
Посилання
Zakrevsky, A.D. (1988). The logic of recognition. Moscow: Nauka i tekhnika [in Russian].
Gnedenko, B.V. (1983). Mathematics and scientific cognition. Moscow: Znaniye [in Russian].
Malinovsky, L. (1986). Classification processes: the basis for the construction of sciences about reality. Algorithms of experimental data processing. Moscow: Nauka [in Russian].
Jurs, P., & Eisenauer, T. (1977). Pattern recognition in chemistry. New Jersey: Wiley.
Krendelev, F.P., & Krendelev, S.F. (1977). Heuristic methods in geology. Moscow: Nauka [in Russian].
Alabin, B.K., Voronin, Y.A., Goldin, S.V., Goldina, N.A., Yeganov, E.А., Ivanova, М.N., & et al. (1970). Geology and mathematics. Novosibirsk: Nauka [in Russian].
Rastegari, H., & Sap, M.N. (2008). Data mining and e-commerce: methods, applications, and challenges. Jurnal Teknologi Maklumat, 20 (2), 116—128.
Gupta, A., Dengre, V., Kheruwala, H.A., & Shah, M. (2020). Comprehensive review of text-mining applications in finance. Financial Innovation, 6 (39), 1—25. https://doi.org/10.1186/s40854-020-00205-1
Daher, J.B., Brun, A., & Boyer, A.A. (2018). Review on Heterogeneous, Multi-source and Multi-dimensional data mining. LORIA — Université de Lorraine.
Waters, D.J. (2023). The emerging digital infrastructure for research in the humanities. International Journal on Digital Libraries, 24, 87—102. https://doi.org/10.1007/s00799-022-00332-3
Németh, R., & Koltai, J. (2021). The Potential of Automated Text Analytics in Social Knowledge Building. Pathways Between Social Science and Computational Social Science. Springer, 49—70. https://doi.org/10.1007/978-3-030-54936-7_3
Leitgöb, H., Prandner, D., & Wolbring, T. (2023). Big data and machine learning in sociology. Front. Sociol., 8. https://doi.org/10.3389/fsoc.2023.1173155
Strachan, S., Stephen, B., & McArthur, S. (2007). Practical Applications of Data Mining in Plant Monitoring and Diagnostics. IEEE Power Engineering Society General Meeting, 1—7. https://doi.org/10.1109/PES.2007.385983
Toledo M.R., Vázquez E.R., García-Salcedo R., Gómez-Vargas I., & Uruchurtu E.S., et al. (2021). Data Mining applied to interventional cardiology procedures. Journal of Physics: Conference Series, 1723 (1), 12—34, 012034. https://doi.org/10.1088/1742-6596/1723/1/012034
Khajehei, M., & Etemady, F. (2010). Data Mining and Medical Research Studies. Second International Conference on Computational Intelligence, Modelling and Simulation. Bali, Indonesia, 119—122. https://doi.org/10.1109/CIMSiM.2010.24
Algarni, A. (2016). Data Mining in Education. International Journal of Advanced Computer Science and Applications, 7 (6). https://doi.org/10.14569/ijacsa.2016.070659
Yethiraj, N.G. (2012). Applying Data Mining Techniques in the Field of Agriculture and Allied Sciences. International Journal of Business Intelligence Research, 1 (2), 40—42. https://doi.org/10.20894/ijbi.105.001.002.004
Polyakov, M., Khanin, I., Shevchenko, G., & Bilozubenko, V. (2021). Data mining as a cognitive tool: capabilities and limits. Knowledge and Performance Management, 5 (1), 1—13. https://doi.org/10.21511/kpm.05(1).2021.01
Marx, K. (1955). Revenue and its Sources. Vulgar Political Economy. Moscow: Publishing House of Political Literature [in Russian].
Khanin, I.G. (2018). Issues of noospheric development of economy and cognition. Dnipro: Nova ideolohia [in Ukrainian].
Smirnov, V.A. (1964). Problems of the logic of scientific cognition. Moscow: Institute of Philosophy, Academy of Sciences of the USSR [in Russian].
Chorayan, O.G. (1987). The concept of probability and fuzziness in the work of the brain. Rostov-on-Don: Publishing house of Rostov State University [in Russian].
Shapiro, D.I. (1977). An introduction to human-machine methods for solving one class of problems. Issues of Cybernetics. Theory and Practice of Situational Management, 18, 82—88 [in Russian].
Shevchenko, G.Ya., Bilozubenko, V.S., & Marchenko, О.А. (2022). The formation of the corporate scientific environment. Science and Science of Science, 2 (116), 12—24. https://doi.org/10.15407/sofs2022.02.012
Oleshko, D.N., Krisilov, V.A., & Blazhko, A.A. (2004). Constructing a qualitative training sample for predictive neural network models. Artificial Intelligence, 3, 567— 573 [in Russian].
Vasilenko, Yu.A., & Shevchenko, G.Ya. (1979). An analytical method of finding tests. Automatics, 4, 3—8 [in Russian].
Tukey, J.W. (1977). Exploratory Data Analysis. London: Addison-Wesley.
Tukey, J.W. (1962). The Future of Data Analysis. Annals of Mathematical Statistics, 33 (1), 1—67. https://doi.org/10.1214/aoms/1177704711
Ishikawa, K. (1985). What is Total Quality Control? The Japanese Way. Englewood Cliff s, NJ: Prentice-Hall, Inc.
Taguchi, G., Chowdhury. S., & Wu, Y. (2005). Taguchi’s Quality Engineering Handbook. Hoboken, New Jersey: John Wiley & Sons. https://doi.org/10.1002/9780470258354
Fisher, R.A. (1936). The Use of Multiple Measurements in Taxonomic Problems. Annals of Eugenics, 7, 179—188. https://doi.org/10.1111/j.1469-1809.1936.tb02137.x
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2025 Академперіодика НАН України

Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.



