오늘은 **대시보드 시각화 교육**을 진행하면서 단순히 시각화만 하는 것이 아니라, 과정에서 발생한 문제점을 분석하고 해결책을 찾아내는 경험을 했습니다.
1. 문제 상황
처음에는 RSS 데이터를 수집했지만, 키워드 필터링과 RSS 업데이트 시점 문제로 인해 데이터가 비어 있었습니다.
- `df.empty` 조건문에 걸려 경고 메시지 출력
- 따라서 대시보드에 시각화할 데이터가 없었음
2. 해결 과정
- 키워드 필터링을 잠시 제거하고 전체 기사 데이터를 먼저 수집
- 이후 다시 키워드를 적용해 원하는 분석을 진행
- Plotly 대시보드로 기사 수집 현황과 키워드별 시계열 패턴을 시각화

3. 결과물 확인
실제 기사 데이터가 반영된 그래프가 정상적으로 출력되었습니다.
- 왼쪽: 날짜별 기사 수를 보여주는 **기사 수집 현황**
- 오른쪽: 특정 키워드 등장 시점을 보여주는 **키워드별 시계열 패턴**

### 4. 이미지 저장 문제 해결
대시보드 이미지를 저장하려고 했을 때 `ValueError`가 발생했습니다. 원인은 Plotly에서 이미지 저장을 담당하는 **kaleido 패키지가 설치되지 않았기 때문**이었습니다.
- `pip install -U kaleido`로 설치
- 커널 재시작 후 다시 실행 → 정상적으로 PNG 파일 저장 완료

5. 오늘의 성과
- 문제 상황을 분석하고 원인을 파악
- 해결책을 적용해 실제 데이터 반영된 대시보드 완성
- 이미지 저장을 위해 필요한 도구(kaleido) 설치 및 활용 성공
6. 앞으로의 계획
이제는 이 과정을 **스케줄링 자동화와 결합**해서, 매일 자동으로 대시보드 이미지가 생성되는 **실시간 분석 시스템**을 완성하는 단계로 나아갈 예정입니다.
'구름고동이네 데이터분석' 카테고리의 다른 글
| **[Python 기초 다지기] 변수, 자료형, 조건문, 반복문, 함수 학습 정리** (0) | 2026.02.23 |
|---|---|
| 대시보드 시각화 교육 - 자동화된 이미지 저장과 실시간 분석 시스템 완성 (0) | 2026.02.21 |
| 스케줄링 자동화방법 구현하기 (0) | 2026.02.18 |
| 데이터라벨링 1급 과정을 (0) | 2023.11.23 |
| ocr과 음성 전사 검수는 (0) | 2023.11.15 |