자신의 일은 스스로하자

[웹 크롤링] #4_1 파이썬 Selenium 모듈을 사용해 컴퓨터 제어 [스마트인재개발원] 본문

웹 크롤링

[웹 크롤링] #4_1 파이썬 Selenium 모듈을 사용해 컴퓨터 제어 [스마트인재개발원]

힐파르 사막 삼계탕 2021. 6. 15. 11:51
728x90

Selenium이란?

Selenium은 웹 애플리케이션 테스트를 위한 포터블 프레임워크입니다. 셀레늄은 테스트 스크립트 언어를 학습할 필요 없이 기능 테스트를 만들기 위한 플레이백 도구를 제공합니다. (셀례늄 IDE) C 샤프, 그루비, 자바, 펄, PHP, 파이썬, 루비, 스칼라 등 수많은 유명 프로그래밍 언어들에서 테스트를 작성하기 위한 테스트 도메인 특화 언어(Selenese)를 제공합니다. 이 테스트들은 현대의 대부분의 웹 브라우저에서 수행이 가능합니다. 웹 페이지를 제어하기 위한 모듈입니다.


Selenium 모듈을 사용하기 위해서는 설치가 필요합니다.

!pip install selenium

실행했을 때 결과가 위 사진처럼 나왔다면 설치가 된 것입니다.

 

from selenium import webdriver as wb
from selenium.webdriver.common.keys import Keys
import time

이제 컴퓨터를 제어하기 위한 모듈들을 import 해줍니다. 

# webdriver : 웹페이지를 제어하기 위한 모듈입니다.
# Keys : 컴퓨터의 키보드와 같은 역할 모듈입니다.
# time : 쉬는 시간을 부여합니다.

 

※ 제어하는 웹 브라우저는 크롬으로 사용합니다.

크롬을 제어하기 위해서는 크롬 웹 브라우저를 설치해야 합니다.

구글에 크롬 드라이버를 검색하고 밑에 보이는 WebDriver for Chrome - Downloads - ChromeDriver에 접속해 줍니다.

 

먼저 다운로드하기 전에 본인 크롬 버전에 맞는 것을 설치하기 위해 확인 과정이 필요합니다.

위 사진의 과정대로 접속하여 버전을 확인해줍니다.

맞는 버전을 찾아 클릭해 줍니다.

이후 본인의 사용 환경에 맞춰 zip 파일을 다운로드합니다.

zip 파일을 풀어준 후 저는 Jupyter Notebook안에 크롤링 폴더에 넣어 줬습니다.

이제 컴퓨터를 제어할 환경이 만들어졌습니다. 

driver = wb.Chrome()
url = "https://www.naver.com/"
driver.get(url)

크롬 드라이버를 사용해 코딩만으로 네이버 홈페이지로 들어가지는 것을 볼 수 있습니다.

 

 

스마트인재개발원에서 진행된 수업입니다.

www.smhrd.or.kr

 

스마트인재개발원

4차산업혁명시대를 선도하는 빅데이터, 인공지능, 사물인터넷 전문 '0원' 취업연계교육기관

www.smhrd.or.kr

 

728x90