오늘 배운 것
데이터 분석가가 크롤링을 배워야 하는 이유
다양한 데이터 소스를 수집 및 맞춤형 데이터셋을 구축하는데 도움이 될 수 있으며
비정형 데이터를 구조화 할 수 있는 능력을 기를 수 있으며 자동화 및 비용 절감의 장점이 있기 때문이다.
Requests의 사용법
import requests
r = requests.get('https://www.naver.com')
print(r.text)
Requests를 사용하여 불러온 naver의 정보
BeautifulSoup4 사용법
import requests
from bs4 import BeautifulSoup
r = requests.get('https://zdnet.co.kr/newskey/?lstcode=%EC%9D%B8%EA%B3%B5%EC%A7%80%EB%8A%A5')
r.text
soup = BeautifulSoup(r.text, 'html.parser')
soup.select_one('body > div.contentWrapper > div > div.left_cont > div.news_box > div:nth-child(1) > div.assetText > a > h3').text
의 코드를 실행시켰을 때 결과물
오늘 느낀점:
Requests와 BeautifulSoup4 를 잘 활용한다면 주식 주가 예측 알고리즘, 주가 매매 추천 머신을 제작할 수 있을 것 같다는 생각이 들었다.
'TIL' 카테고리의 다른 글
본 캠프 26일차 TIL (0) | 2024.07.19 |
---|---|
본 캠프 25일차 TIL (1) | 2024.07.19 |
본 캠프 23일차 TIL (0) | 2024.07.16 |
본 캠프 22일차 TIL (3) | 2024.07.15 |
본 캠프 21일차 TIL (0) | 2024.07.14 |