Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 가상환경 초기세팅
- aiflow
- 정규표현식
- Google Cloud Storage
- requests
- 빗썸api
- 자동화
- beautifulsoup
- etl
- airflow
- pickle #datetime
- 파일저장
- mariadb설치 #mysql설치
- 리눅스 # 기초
- cron
- HeidiSQL
- FastAPI
- with open
- celery
- datetime #zip
- requesthead
- 자연어처리 환경 컨테이너
- enumerate #함수 # def
- ssh operator
- 원하는 태그 찾기
- Docker
- K-ICT
- text.children
- JavaScripts
- 모델서빙
Archives
- Today
- Total
목록Google Cloud Storage (1)
오음

사용자들의 플레이리스트들을 수집해서 word2vec모델을 학습 후 새로운 사용자의 리스트를 보고 추천해주는 시스템을 만들고 싶었다. (더 공부한 후 포스팅예정!) 거의 2주간은 필요한 데이터 수집과 데이터 전처리에 많은 시간을 쏟은 것 같았다. 그럼에도 필요 데이터 수집은 계속해서 이루어져야 한다.. 왜냐? 모델 학습을 계속 진행해서 더 많은 데이터로 학습하게 만들어야 되기 때문이다. 이 과정을 airflow를 통해서 만들어진 코드들이 자동화 될 수 있게 만들어 줄 것이다. airflow 진행순서) 멜론,바이브,지니,스포티파이등등의 user 플레이리스트 크롤링 + 배포될 경우 새로운 사용자들의 리스트 -> 모델 학습 -> 모델 저장 -> 백엔드로 모델 서빙 여기서 플레이리스트 크롤링과 배포될 경우 새로운..
데이터 엔지니어링/Airflow
2023. 7. 30. 16:28