반응형
파이썬, 셀레니움 google.co.kr 웹 페이지 소스 코드를 HTML 파일로 저장
글. 수알치 오상문
# google.co.kr 페이지 가져와서 html 파일로 저장하기
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
import time
options = webdriver.ChromeOptions()
options.add_experimental_option('excludeSwitches', ['enable-logging']) # device error 메시지 off
driver = webdriver.Chrome(options=options) # 현재 위치에 있는 크롬드라이버 등록
driver.implicitly_wait(10) # 정상 페이지 로딩 최대 허용 시간
driver.set_window_size(1920, 1600) # 브라우저 창 크기
driver.set_window_position(1, 1) # 브라우저 화면 위치
driver.set_page_load_timeout(20) # 페이지 로딩 타임아웃 시간 20초
try:
driver.get('https://www.google.co.kr/')
WebDriverWait(driver, 20).until(
lambda driver: driver.find_element(By.NAME, 'q')) # 검색창 로딩 확인
time.sleep(3)
except Exception as e:
print('get error:', e)
raise Exception('Name "q" was not found')
# 페이지 HTML 코드 가져오기
el = driver.find_element(By.XPATH, "//*")
source_code = el.get_attribute("outerHTML")
# HTML 코드를 'html_code.html' 파일로 저장하기
with open('html_code.html', 'w') as f:
f.write(source_code) # .encode('utf-8')
# 브라우저 및 드라이버 종료
driver.quit()
[실행 결과] 저장한 html 파일 내용
반응형
'웹 크롤링, 스크래핑' 카테고리의 다른 글
파이썬, 셀레니움 요소 선택 에러 대응 참고 (0) | 2022.07.20 |
---|---|
파이썬, 셀레니움 HTML 파일 읽어서 분석하기 (0) | 2022.07.17 |
파이썬, 셀레니움 '텍스트'로 요소 찾기 (0) | 2022.07.17 |
파이썬, 셀레니움 스크롤 예제 (0) | 2022.07.17 |
파이썬, 셀레니움 XHR 데이터 확인 예제 (0) | 2022.07.17 |