Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 자동화
- etl
- ssh operator
- FastAPI
- cron
- beautifulsoup
- 모델서빙
- K-ICT
- enumerate #함수 # def
- 가상환경 초기세팅
- requesthead
- HeidiSQL
- aiflow
- text.children
- datetime #zip
- mariadb설치 #mysql설치
- 자연어처리 환경 컨테이너
- 빗썸api
- 정규표현식
- JavaScripts
- 원하는 태그 찾기
- Docker
- airflow
- 파일저장
- with open
- Google Cloud Storage
- 리눅스 # 기초
- requests
- celery
- pickle #datetime
Archives
- Today
- Total
목록파일저장 (1)
오음
python) BeautifulSoup 활용하기
BeautifulSoup : 복잡한 HTML 문서에서 원하는 부분만 뽑아낼 수 있는 파이썬 라이브러리 BeautifulSoup활용하기 - 네이버뉴스 크롤링 - 사용하기에 앞서 requests로 HTML 문서에 담긴 내용을 가져온다 import requests news_url = "https://n.news.naver.com/mnews/article/009/0005088914?sid=105" head = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36"} # 크롬으로 속이기 naver_news = requests.get(news..
데이터 엔지니어링/파이썬
2023. 3. 7. 22:40