<참조: 파이썬을 이용한 머신러닝, 딥러링 실전개발 입문>
파이썬, 네이버 오늘의 코스피 코스닥 지수 가져와 출력하기
글. 오상문 sualchi@daum.net
네이버 금융 정보 페이지에서 오늘의 코스피/코스닥 지수 정보를 가져오는 예제이다. 앞 예제에서 다뤘던 태그를 이용한 검색 방식을 이용했다.
웹 페이지 소스에서 찾아보면 아래 부분에서 정보를 제공하고 있다.
<dl class="blind">
<dt>
오늘의 코스피/코스닥 지수
</dt>
<dd>
2020년 01월 06일 장마감
</dd>
<dd>
코스피 지수 2,155.07 전일대비 하락 21.39 마이너스 0.98 퍼센트
</dd>
<dd>
코스닥 지수 655.31 전일대비 하락 14.62 마이너스 2.18 퍼센트
</dd>
</dl>
해당 웹페이지 URL 주소는 다음과 같다.
이제 해당 페이지를 가져와서 dd 태그에 있는 텍스트 중에서 '코스피 지수'가 있는 놈을 찾아서 출력해보자.
from bs4 import BeautifulSoup
import urllib.request as req
url = "https://finance.naver.com/"
html = req.urlopen(url)
# HTML 파서를 이용한 분석 결과를 객체 soup 저장
soup = BeautifulSoup(html, "html.parser")
dd = soup.html.dd # dd 태그 첫 내용
while(dd != None): # dd 태그를 내용을 찾았으면
s = dd.string.strip()[:7] # 앞뒤 공백문자 제거하고 앞 7문자만 저장
if '코스피 지수 ' == s: # 혹시나 해서 뒤에 빈칸까지 비교
print(dd.string.strip())
elif '코스닥 지수 '== s: # 혹시나 해서 뒤에 빈칸까지 비교
print(dd.string.strip())
break # 코스닥 지수까지 찾았으면 종료
dd = dd.next_sibling.next_sibling # 다음 태그의 텍스트 찾아봄
if(dd == None): # 찾지 못했으면...
print("찾을 수 없습니다!")
[결과]
코스피 지수 2,155.07 전일대비 하락 21.39 마이너스 0.98 퍼센트
코스닥 지수 655.31 전일대비 하락 14.62 마이너스 2.18 퍼센트
<이상>
'웹 크롤링, 스크래핑' 카테고리의 다른 글
BeautifulSoup, HTML 구조에서 특정 태그의 요소 다루기 (0) | 2022.06.18 |
---|---|
웹 스크래핑: 캘린더 다루기 (with Selenium) 영문 (0) | 2022.06.17 |
BeautifulSoup, selenium 크롤링, 스크래핑 (0) | 2022.06.17 |
chromedriver.exe 다운로드(download) 사이트 (0) | 2021.05.18 |
파이썬, BeautifulSoup 웹 페이지 자료 추출 (0) | 2020.01.06 |