Data analysis strategy for revealing multivariate structures in social-economic data warehouses
Author | Affiliation | |
---|---|---|
Matematikos ir informatikos institutas | ||
Lietuvos mokslų akademija |
Date |
---|
2003 |
Straipsnyje pateikiama daugiamačių statistinių metodų integravimo strategija, skirta socialinių-ekonominių duomenų struktūrų ir ryšių atskleidimui, kai stebima didelė kintamųjų aibė trumpais laiko intervalais. Nagrinėjami faktorinės ir klasterinės duomenų analizės metodų integruoto taikymo aspektai. Pasiūlytas algoritmas leidžia atskleisti ir įvertinti sudėtingas duomenų struktūras, informacijos kitimo šablonus ir jų tarpusavio ryšius socialinių-ekonominių duomenų saugyklose. Šių metodų pagrindu konstruojami dinaminiai modeliai, atspindintys socialinės gerovės rodiklių įtaką nusikalstamumo lygio kitimui. Pateikiami šios metodikos realizavimo algoritmo taikymo pavyzdžiai ir gauti rezultatai analizuojant situaciją Lietuvos miestuose.
This research work is aimed at the development of data analysis strategy in a-complex, multidimensional, and dynamic domain. Our universe of discourse is concerned with the data mining techniques of data warehouses revealing the importance of multivariate structures of social-economic data which influence criminality. Distinct tasks require different data structures and various data mining exercises in data warehouses. The proposed problem solution strategy allows choosing an appropriate method in recognition processes. The ensembles of diverse and accurate classifiers are constructed on the base of multidimensional classification and clusterisation methods. Factor analysis is introduced into data mining process for revealing influencing impacts of factors. The temporal nature and multidimensionality of the target object is revealed in dynamic model using multidimension regression estimates. The paper describes the strategy of integrating the methods of multiple statisti!.