반응형

파이썬, 셀레니움 google.co.kr 웹 페이지 소스 코드를 HTML 파일로 저장

글. 수알치 오상문

 

https://www.google.co.kr/

 

Google

 

www.google.co.kr

 

# google.co.kr 페이지 가져와서 html 파일로 저장하기
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
import time
options = webdriver.ChromeOptions()
options.add_experimental_option('excludeSwitches', ['enable-logging']) # device error 메시지 off
driver = webdriver.Chrome(options=options)  # 현재 위치에 있는 크롬드라이버 등록
driver.implicitly_wait(10)  # 정상 페이지 로딩 최대 허용 시간
driver.set_window_size(1920, 1600)  # 브라우저 창 크기
driver.set_window_position(1, 1)  # 브라우저 화면 위치 
driver.set_page_load_timeout(20)  # 페이지 로딩 타임아웃 시간 20초
try:
    driver.get('https://www.google.co.kr/')  
    WebDriverWait(driver, 20).until(
        lambda driver: driver.find_element(By.NAME, 'q'))  # 검색창 로딩 확인
    time.sleep(3)
except Exception as e:
    print('get error:', e)
    raise Exception('Name "q" was not found')
# 페이지 HTML 코드 가져오기 
el = driver.find_element(By.XPATH, "//*")
source_code = el.get_attribute("outerHTML")
# HTML 코드를 'html_code.html' 파일로 저장하기 
with open('html_code.html', 'w') as f:
    f.write(source_code)  # .encode('utf-8')
# 브라우저 및 드라이버 종료 
driver.quit()

 

[실행 결과] 저장한 html 파일 내용 

 

 

반응형

+ Recent posts