반응형

기계학습 자료와 분석 유형

 

글. 오상문 sualchi@daum.net

 

기계학습(머신러닝)을 하기 위해서는 자료가 필요합니다. 그리고 어떤 기준을 레이블 형태로 제공할지 아니면 자료 자체만 갖고 분석(또는 학습)할지에 따라서 supervisedunsupervised 유형으로 나뉩니다.

 

Supervised 유형에는 classification(분류), regression(경향, 선형 등) 분석이 있고 Unsupervised 유형에는 clustering(군집, 분포 그룹) 분석 방법이 있습니다.

 

1. 예를 들어 0에서 100까지 어떤 숫자들이 나타나는 자료가 있다고 합시다. 그 자료를 0에서 100이라는 레이블 기준(supervised)으로 나타나는 수치 분류(classification)가 가능합니다.

 

2. 자료들이 특정 레이블 기준(supervised)으로 선형에 가깝도록 분석한다면 그것은 회귀(regression) 분석입니다.

 

3. 특정한 레이블 없이(unsupervised) 자료들의 분포를 구분한다면 그것은 자료가 어떤 군집들로 이루어졌는지 분석(clustering)한 것입니다.

 

<이상>

반응형

+ Recent posts