본문 바로가기

구름고동이네 데이터분석

스케줄링 자동화방법 구현하기

오늘의 학습 목표

스케줄링 자동화 방법 구현

클래스와 조건문 활용 (__init__, run_once(), run_forever(), if df.empty)

 

 


초기 문제 상황

RSS 피드에서 데이터를 가져오지 못해 df.empty 조건문에 걸림

경고 메시지 출력: “RSS 피드를 확인하세요”

코드 자체는 정상 동작했지만 기사 데이터가 없었던 상태

해결 과정

실제 네이버 연합뉴스 RSS 주소를 가져와 적용

정치, 경제, 사회, 문화, 세계, 북한 등 카테고리별 RSS 추가

YNANewsCollector 클래스 실행 → 기사 수집 성공

save_to_csv() 메서드로 날짜 기반 파일명(yna_news_20260218.csv) 저장 완료

주피터 노트북에서 완료 


폴더에 저장된 CSV

 



오늘의 핵심 키포인트

__init__에서 RSS, 키워드, 실행 주기 설정

run_once() → 테스트용 단일 실행

run_forever() → 무한 루프 + time.sleep()으로 주기적 실행

조건문(if df.empty)으로 데이터가 없을 때 안전 처리

앞으로의 계획

자동화된 RSS 수집 결과를 Plotly 대시보드와 연결

매일 자동 업데이트되는 실시간 분석 대시보드 완성