[크롤링] KBO 경기 데이터 수집 및 전처리
·
프로젝트/크보패스
1. kbo_service.py의 역할kbo_service.py는 KBO 공식 홈페이지의 경기 일정 데이터를 수집하고,서비스에서 사용할 수 있는 형태로 정제하는 파일이다.이번 프로젝트에서는 경기 일정 데이터가 모든 기능의 시작점이 되기 때문에, 단순히 크롤링으로 데이터를 가져오는 것에서 끝내지 않고 날짜, 시간, 팀, 점수, 구장 정보를 구조화하는 과정이 필요했다. 전체 흐름은 다음과 같다.KBO 일정 페이지 접속 → 월별 경기 일정 크롤링 → 날짜/시간/경기/구장 데이터 추출 → 경기 문자열 파싱 → 구장 데이터 매핑 → 시즌 전체 일정 수집 → 중복 제거 → 구조화된 데이터 반환2. 초기 크롤링 데이터 형태초기 크롤링 단계에서는 KBO 경기 데이터가 다음과 같은 형태로 수집되었다.{ 'date'..