본문 바로가기
TIL

본 캠프 24일차 TIL

by Data 학습자 2024. 7. 17.

오늘 배운 것

데이터 분석가가 크롤링을 배워야 하는 이유

다양한 데이터 소스를 수집 및 맞춤형 데이터셋을 구축하는데 도움이 될 수 있으며

비정형 데이터를 구조화 할 수 있는 능력을 기를 수 있으며 자동화 및 비용 절감의 장점이 있기 때문이다.

 

Requests의 사용법

import requests
r = requests.get('https://www.naver.com')
print(r.text)

 

Requests를 사용하여 불러온 naver의 정보

 

BeautifulSoup4 사용법

import requests
from bs4 import BeautifulSoup

r = requests.get('https://zdnet.co.kr/newskey/?lstcode=%EC%9D%B8%EA%B3%B5%EC%A7%80%EB%8A%A5')
r.text
soup = BeautifulSoup(r.text, 'html.parser')
soup.select_one('body > div.contentWrapper > div > div.left_cont > div.news_box > div:nth-child(1) > div.assetText > a > h3').text

의 코드를 실행시켰을 때 결과물

 

오늘 느낀점:

Requests와 BeautifulSoup4 를 잘 활용한다면 주식 주가 예측 알고리즘, 주가 매매 추천 머신을 제작할 수 있을 것 같다는 생각이 들었다.

'TIL' 카테고리의 다른 글

본 캠프 26일차 TIL  (0) 2024.07.19
본 캠프 25일차 TIL  (1) 2024.07.19
본 캠프 23일차 TIL  (0) 2024.07.16
본 캠프 22일차 TIL  (3) 2024.07.15
본 캠프 21일차 TIL  (0) 2024.07.14