일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- while문
- Python
- 크롬
- 보안용어
- 딥러닝실행
- 스마트인재개발원
- 웹 크롤링
- 딥러닝
- java
- 머신러닝
- 주식
- 컴퓨터보안
- 광주인공지능학원
- 도서관관리
- 정보보호
- 문자태그
- 크롤링
- 딥러닝수학
- 딥러닝기초수학
- 보안
- HTML
- 웹툰
- 멜론
- 기본목록
- for문
- 스마트인재개발원 후기
- Visual Studio Code
- 프로젝트
- 파이썬
- Selenium
- Today
- Total
자신의 일은 스스로하자
[머신 러닝] #2 머신러닝 / 비지도학습 [광주인공지능학원] 본문
2021.08.02 - [AI/머신러닝] - [머신러닝] #1 머신 러닝 / 지도학습 [광주인공지능학원]
지도학습에서 주목할 점은 입력과 출력이 직관적으로 보이지만, 데이터를 모으는 과정은 많이 다릅니다. 편지봉투를 읽는 것은 손이 많이가지만 비용이 적게듭니다. 의료 영상 이미지를 얻거나 분석하려면 도덕적 이슈나 개인정보 보호를 차치하더라도 거가의 장비가 필요하고 보수가 높으며 전문가의 의견도 구해야해 매우 어렵습니다. 반면 신용카드의 불법거래 감지 데이터 수집은 고객이 사기거래라고 보고해 데이터를 제공하므로 간단합니다.
다른 알고리즘은 비지도학습입니다. 비지도 학습에서는 알고리즘에 입력은 주어지지만 출력은 제공되지 않습니다. 이 알고리즘의 성공사례는 많지만 비지도 학습을 이해하거나 평가하기는 쉽지 않습니다.
- 비지도학습
1. 블로그 글의 주제 구분
많은 양의 텍스트 데이터를 요약하고 그 안에 담긴 핵심 주제를 찾고자 할 수 있습니다. 사전에 어떤 주제인지 알지 못하고 얼마나 많은 주제가 있는지도 모릅니다. 그러므로 출력 값을 준비할 수 없습니다.
2. 고객들의 취향이 비슷한 그룹으로 묶기
고객 데이터를 이용해서 어떤 고객들의 추향이 비슷한지 알고 싶거나 비슷한 취향의 고객을 그룹으로 묶고 싶을 것입니다. 어떤 그룹이 있는지 미리 알 수 없고 얼마나 많은 그룹이 있는지 모르니 출력을 가지고 있지 않은 것과 같습니다.
3. 비정상적인 웹사이트 접근 탐지
일상적이지 않은 접근 패턴을 찾으면 부정행위나 버그를 구별하는 데 도움이 됩니다. 각각의 비정상 패턴은 서로 많이 다를 수 있고 이미 가지고 있는 비정상 데이터도 없을 수 있습니다. 이 경우 웹 트래픽만 관찰할 수 있고 어떤 것이 정상이고 비정상인지 알지 못하므로 비지도 학습의 문제입니다.
스마트인재개발원에서 진행된 수업입니다.
http://www.smhrd.or.kr
'AI > 머신러닝' 카테고리의 다른 글
[머신러닝] #1 머신 러닝 / 지도학습 [광주인공지능학원] (0) | 2021.08.02 |
---|