Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- datetime #zip
- aiflow
- 원하는 태그 찾기
- 가상환경 초기세팅
- 파일저장
- with open
- HeidiSQL
- celery
- airflow
- 자동화
- Docker
- pickle #datetime
- requests
- cron
- 빗썸api
- JavaScripts
- 자연어처리 환경 컨테이너
- enumerate #함수 # def
- text.children
- 리눅스 # 기초
- 모델서빙
- K-ICT
- 정규표현식
- FastAPI
- etl
- requesthead
- beautifulsoup
- mariadb설치 #mysql설치
- ssh operator
- Google Cloud Storage
Archives
- Today
- Total
목록with open (1)
오음

네이버 스포츠에서 이시각 많이 본 뉴스의 제목과 내용을 크롤링 # 필요한 패키지 import from bs4 import BeautifulSoup from selenium.webdriver.common.by import By from selenium import webdriver import re # 네이버 스포츠 인기뉴스 url로 데이터 get driver = webdriver.Chrome() news_url = "https://sports.news.naver.com/wfootball/news/index?isphoto=N&type=popular" driver.get(news_url) # 이시각 많이 본 뉴스들의 url주소 가져오기 # "div"태그 , class_='text'['href'] bs = B..
데이터 엔지니어링/크롤링
2023. 3. 9. 16:54