일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 멜론
- 보안용어
- 머신러닝
- 딥러닝기초수학
- Selenium
- 기본목록
- 딥러닝
- 크롬
- 프로젝트
- 광주인공지능학원
- Visual Studio Code
- 정보보호
- 도서관관리
- 스마트인재개발원 후기
- 보안
- for문
- 스마트인재개발원
- 파이썬
- java
- while문
- 문자태그
- HTML
- 크롤링
- 웹 크롤링
- 딥러닝수학
- 웹툰
- Python
- 컴퓨터보안
- 주식
- 딥러닝실행
- Today
- Total
자신의 일은 스스로하자
[웹 크롤링] #4_1 파이썬 Selenium 모듈을 사용해 컴퓨터 제어 [스마트인재개발원] 본문
Selenium이란?
Selenium은 웹 애플리케이션 테스트를 위한 포터블 프레임워크입니다. 셀레늄은 테스트 스크립트 언어를 학습할 필요 없이 기능 테스트를 만들기 위한 플레이백 도구를 제공합니다. (셀례늄 IDE) C 샤프, 그루비, 자바, 펄, PHP, 파이썬, 루비, 스칼라 등 수많은 유명 프로그래밍 언어들에서 테스트를 작성하기 위한 테스트 도메인 특화 언어(Selenese)를 제공합니다. 이 테스트들은 현대의 대부분의 웹 브라우저에서 수행이 가능합니다. 웹 페이지를 제어하기 위한 모듈입니다.
Selenium 모듈을 사용하기 위해서는 설치가 필요합니다.
!pip install selenium
실행했을 때 결과가 위 사진처럼 나왔다면 설치가 된 것입니다.
from selenium import webdriver as wb
from selenium.webdriver.common.keys import Keys
import time
이제 컴퓨터를 제어하기 위한 모듈들을 import 해줍니다.
# webdriver : 웹페이지를 제어하기 위한 모듈입니다.
# Keys : 컴퓨터의 키보드와 같은 역할 모듈입니다.
# time : 쉬는 시간을 부여합니다.
※ 제어하는 웹 브라우저는 크롬으로 사용합니다.
크롬을 제어하기 위해서는 크롬 웹 브라우저를 설치해야 합니다.
구글에 크롬 드라이버를 검색하고 밑에 보이는 WebDriver for Chrome - Downloads - ChromeDriver에 접속해 줍니다.
먼저 다운로드하기 전에 본인 크롬 버전에 맞는 것을 설치하기 위해 확인 과정이 필요합니다.
위 사진의 과정대로 접속하여 버전을 확인해줍니다.
맞는 버전을 찾아 클릭해 줍니다.
이후 본인의 사용 환경에 맞춰 zip 파일을 다운로드합니다.
zip 파일을 풀어준 후 저는 Jupyter Notebook안에 크롤링 폴더에 넣어 줬습니다.
이제 컴퓨터를 제어할 환경이 만들어졌습니다.
driver = wb.Chrome()
url = "https://www.naver.com/"
driver.get(url)
크롬 드라이버를 사용해 코딩만으로 네이버 홈페이지로 들어가지는 것을 볼 수 있습니다.
스마트인재개발원에서 진행된 수업입니다.
'웹 크롤링' 카테고리의 다른 글
[웹 크롤링] #4_2 파이썬 Selenium 모듈을 사용해 컴퓨터 제어 [스마트인재개발원] (0) | 2021.06.17 |
---|---|
[웹 크롤링] #3 파이썬으로 멜론 차트 TOP 100 데이터 프레임 생성, CSV저장 / pandas [스마트인재개발원] (0) | 2021.06.13 |
[웹 크롤링] #2 파이썬으로 멜론 TOP100 수집 / BeautifulSoup [스마트인재개발원] (0) | 2021.06.07 |
[웹 크롤링] #1 파이썬으로 네이버 / Melon 페이지 정보 불러오기 [스마트인재개발원] (0) | 2021.06.04 |