자신의 일은 스스로하자

[머신 러닝] #2 머신러닝 / 비지도학습 [광주인공지능학원] 본문

AI/머신러닝

[머신 러닝] #2 머신러닝 / 비지도학습 [광주인공지능학원]

힐파르 사막 삼계탕 2021. 8. 2. 01:59
728x90

2021.08.02 - [AI/머신러닝] - [머신러닝] #1 머신 러닝 / 지도학습 [광주인공지능학원]

 

[머신러닝] #1 머신 러닝 / 지도학습 [광주인공지능학원]

머신러닝 machine learning(기계 학습)은 경험을 통해 자동으로 개선하는 컴퓨터 알고리즘의 연구입니다. 데이터에서 지섹을 추출하는 작업으로 머신러닝은 통계학, 인공지능, 컴퓨터 과학이 얽혀

oneself.tistory.com

 

  지도학습에서 주목할 점은 입력과 출력이 직관적으로 보이지만, 데이터를 모으는 과정은 많이 다릅니다. 편지봉투를 읽는 것은 손이 많이가지만 비용이 적게듭니다. 의료 영상 이미지를 얻거나 분석하려면 도덕적 이슈나 개인정보 보호를 차치하더라도 거가의 장비가 필요하고 보수가 높으며 전문가의 의견도 구해야해 매우 어렵습니다. 반면 신용카드의 불법거래 감지 데이터 수집은 고객이 사기거래라고 보고해 데이터를 제공하므로 간단합니다. 

 

  다른 알고리즘은 비지도학습입니다. 비지도 학습에서는 알고리즘에 입력은 주어지지만 출력은 제공되지 않습니다. 이 알고리즘의 성공사례는 많지만 비지도 학습을 이해하거나 평가하기는 쉽지 않습니다.


- 비지도학습

1. 블로그 글의 주제 구분

  많은 양의 텍스트 데이터를 요약하고 그 안에 담긴 핵심 주제를 찾고자 할 수 있습니다. 사전에 어떤 주제인지 알지 못하고 얼마나 많은 주제가 있는지도 모릅니다. 그러므로 출력 값을 준비할 수 없습니다.

 

2. 고객들의 취향이 비슷한 그룹으로 묶기

  고객 데이터를 이용해서 어떤 고객들의 추향이 비슷한지 알고 싶거나 비슷한 취향의 고객을 그룹으로 묶고 싶을 것입니다. 어떤 그룹이 있는지 미리 알 수 없고 얼마나 많은 그룹이 있는지 모르니 출력을 가지고 있지 않은 것과 같습니다.

 

3. 비정상적인 웹사이트 접근 탐지

일상적이지 않은 접근 패턴을 찾으면 부정행위나 버그를 구별하는 데 도움이 됩니다. 각각의 비정상 패턴은 서로 많이 다를 수 있고 이미 가지고 있는 비정상 데이터도 없을 수 있습니다. 이 경우 웹 트래픽만 관찰할 수 있고 어떤 것이 정상이고 비정상인지 알지 못하므로 비지도 학습의 문제입니다.

 

 

스마트인재개발원에서 진행된 수업입니다.

http://www.smhrd.or.kr

 

스마트인재개발원

4차산업혁명시대를 선도하는 빅데이터, 인공지능, 사물인터넷 전문 '0원' 취업연계교육기관

www.smhrd.or.kr

728x90