面向建筑业决策支持系统知识获取的文本与数据挖掘技术

TEXT AND DATA MINING TECHNIQUES IN ASPECT OF KNOWLEDGE ACQUISITION FOR DECISION SUPPORT SYSTEM IN CONSTRUCTION INDUSTRY / DUOMENŲ RINKIMO METODAI STATYBOS SPRENDIMŲ PARAMOS SISTEMAI

Technological and Economic Development of Economy · 2010
被引 49
人大 A-

中文导读

探讨了在建筑行业决策支持系统中应用文本挖掘技术来获取知识,旨在简化知识获取过程并实现自动化,以替代耗时的人工调查方法。

Abstract

This article presents the possibilities of using mining techniques in building Decision Support Systems. One of the biggest problems is the issue of gaining data and knowledge, their mutual representation and reciprocal usage. Data and knowledge make up the resources of the system and are its key link. It has been estimated that 70% to 80% of the sources available for general use are text documents. The text mining technique is defined as a process aiming to extract previously unknown information from text resources (e.g. technological cards). The fundamental feature of text mining is the ability to converse text documents in formal form, which opens up great possibilities of conducting further analysis. This article presents chosen IT tools using text mining technique, along with the elements of the text mining analysis. The main objectives are the simplification of the process of knowledge acquisition, its automation and shortening as well as the creation of ready‐made models containing knowledge. Previous tests with knowledge acquisition (surveys, questionnaires) were time‐consuming and exacting for experts. Santrauka Straipsnyje pateikiamos informacijos rinkimo metodu pritaikymo galimybės sprendimų paramos sistemoms statyboje. Daugiausia problemų sukelia informacijos gavimas, tinkamas jos atvaizdavimas ir naudojimas. Duomenys yra pagrindinis sistemos išteklius. Nustatyta, kad nuo 70 iki 80 % visu turimų bendrojo naudojimo informacijos šaltinių yra tekstiniai dokumentai. Tekstines informacijos rinkimo technika yra suprantama kaip procesas, kuriuo siekiama išgauti anksčiau nežinoma informacija iš tekstiniu dokumentu (pavyzdžiui, technologiniu kortelių). Pagrindine šios technikos savybė ‐ galimybė tekstinių dokumentų informacija pateikti formalizuota forma, tai atveria plačiu galimybių tolesnei analizei. Šiame straipsnyje pateikiamos pasirinktos IT priemonės, naudojamos tekstinei informacijai rinkti. Autoriaus tikslas ‐ su paprastinti informacijos rinkimą, ji automatizuoti ir sutrumpinti, sukurti informacija apimančius modelius. Ankstesni informacijos kaupimo metodai (apklausos, anketos) reikalavo daug ekspertų darbo ir laiko.

文本挖掘知识获取决策支持系统建筑业