무기체계와 컴퓨터/인공지능과 머신러닝 AI Machine Learning

머신러닝 절차

xdots 2023. 10. 3. 09:17

일반적인 머신러닝 프로세스

먼저 분석 대상이 되는 원천 데이터를 수집하고 수집된 데이터를 가공한다. 지도 학습의 경우는 학습을 위해 레이블링 등의 전처리 작업이 필요하고, 기상 데이터와 같은 시계열 데이터는 빈 공간이 존재하여 이 값을 어떻게 처리할지 정하여 데이터 튜닝작업을 수행해야 한다. 그 다음 AI 모델을 선정하여 학습시키고 학습된 최적화 모델 값을 정하여, AI 모델을 만들어 내어 시험 및 평가하는 절차를 지속적으로 반복하여 이루어 진다.

머신러닝 개발 프로세스

ISO/IEC 표준에서 제시한 머신러닝 워크플로우

먼저 목적을 이해하고 소스 데이터를 수집과 전처리하고 AI 프레임워크를 선정하고 모델을 만든다. 선정된 모델을 이용하고 학습과 튜닝 작업을 반복하여 테스트 모델을 만들고 배포하여 지속적으로 모니터링하고 튜닝하여 사용한다.

Machine Learning Workflow (ISO TR29119-20)

데이터셋 구축 과정

  • 1단계 데이터셋 요구사항 도출
  • 2단계 요구사항 고려 데이터 수집
  • (3단계 수집한 데이터 전처리) 수집한 데이터의 전처리를 통해 모델에 활용하기에 적합한 데이터로 만든다. 이러한 전처리 과정은 모델 수립에 활용되기 때문에 적절한 전처리 과정이 문제 해결을 위한 모델 수립에 매우 중요하다.
  • (4단계 데이터셋 구축) 데이터가 내포하는 특징값을 추출하고 이미지 형태의 데이터라면 레이블링을 통해 데이터 세트를 구축
  • (5단계 데이터셋 구성) 학습용, 검정용 등의 세트를 구성