- 데이터 마이닝은 방대한 데이터로부터 유용한 정보를 추출하고데이터 간 상관관계를 발견하여 의사 결정에 이용하는 과정을 의미한다.
- Feature Selection은 데이터 마이닝 기법 중 하나로 방대한 데이터셋에서 특정 데이터로부터 가장 좋은 성능을 나타내는 가장 연관이 깊은 데이터의 속성을 찾아내는 것이다.
Search Method
- BestFirst 모든 속성을 순서화하여 깊이 우선 탐색을 통해 값을 도출
- Greedy Stepwise 속성의 하위 데이터의 임의 공간에서 시작하여 정방향/역방향 탐색 수행
- Ranker 속성별 개별 평가를 통해 속성의 순위를 계산
Feature Evaluator
- CfsSubset Eval 각 개별 속성의 예측 가능성과 데이터 중복 정도를 고려하여 속성의 가치를 평가
- GainRatio AttributeEval 속성에 대한 이득 비율을 산정
- Symmetrical UncertEval 속성값의 대칭 정도를 측정하여 속성 평가
- InfoGain AttributeEval 속성과 관련된 정보 획득을 측정
- Correlation AttributeEval 속성 간의 상관관계를 측정하여 평가
뉴질랜드 Waikato 대학에서 개발한 Weka, Machine Learning Software in Java
Weka 3 - Data Mining with Open Source Machine Learning Software in Java
Weka is a collection of machine learning algorithms for data mining tasks. It contains tools for data preparation, classification, regression, clustering, association rules mining, and visualization. Found only on the islands of New Zealand, the Weka is a
www.cs.waikato.ac.nz
'무기체계와 컴퓨터 > 인공지능과 머신러닝 AI Machine Learning' 카테고리의 다른 글
음성 처리 (0) | 2023.11.21 |
---|---|
CODEFUSION 코드퓨전 (0) | 2023.11.08 |
GAN(Generative Adversarial Networks) (0) | 2023.11.01 |
랜덤포레스트 (0) | 2023.11.01 |
데이터 크기와 데이터 분석 (0) | 2023.10.17 |