지방자치단체는 매년 수천억 원 규모의 예산을 편성하고, 다양한 정책을 실행한다. 복지, 교육, 치안, 교통, 문화, 환경 등 시민 삶에 영향을 미치는 수많은 사업이 이 예산을 통해 운영된다. 문제는 예산이 실제로 어디에 얼마나 쓰이고 있는지를 일반 시민이 체감하기 어렵다는 점이다. 각 지자체 홈페이지에는 결산서, 세출예산서, 추진사업 요약 등 관련 정보가 게시되어 있지만, 복잡한 회계 용어와 방대한 분량으로 인해 비전문가가 접근하기에는 너무 높은 장벽이 존재한다. 한 예로 "올해 우리 구청은 청소년 지원에 얼마를 썼는가?", "작년보다 교통 안전 예산은 늘었는가?" 같은 단순한 질문에도, 시민이 스스로 답을 찾기란 매우 어렵다. 이 정보 격차는 시민의 정책 참여를 가로막고, 행정 불신을 유발하기도 한다.
이러한 배경 속에서 등장한 것이 바로 ‘지방자치단체 예산 데이터를 자동 분석하고, 생활밀착형 정책 우선순위를 시각화하는 시스템’이다. 이 시스템은 방대한 예산 문서를 자동으로 분석하여, 시민의 눈높이에 맞춘 정책 우선순위 지도를 제공함으로써 행정의 투명성과 시민의 정책 이해도를 동시에 향상시킬 수 있다.
이 시스템이 작동하기 위해서는 우선 공공 예산 데이터를 수집할 수 있는 기반이 필요하다. 다행히 현재 대부분의 지방자치단체는 예산서와 결산서를 PDF 또는 Excel 형식으로 제공하고 있으며, 행정안전부 ‘열린재정’ 시스템을 통해 통합 조회가 가능하다. Python에서는 requests, pandas, tabula-py, pdfplumber 등의 라이브러리를 활용하여 이 데이터를 자동으로 수집하고 전처리할 수 있다. 핵심은 예산 항목을 분류하고, 목적, 대상, 집행 비율 등을 표준화하여 정제하는 과정이다. 예를 들어 서울 강서구의 2024년 예산서에서 ‘청년 일자리 창출 사업’, ‘노인복지증진사업’, ‘지역상권 활성화 기금’ 등의 항목을 자동 추출하고, 각 항목에 할당된 금액, 전년도 대비 증감률, 사업명 키워드 등을 분석한다. 이후 머신러닝 또는 단순 규칙 기반 필터링으로 ‘생활밀착형’ 항목을 분류하는 것이 핵심이다. 여기서 생활밀착형 정책이란 교통, 치안, 복지, 보육, 청소년, 환경 등 시민의 일상과 직결되는 주제를 말하며, 시스템은 관련 키워드를 중심으로 자동 분류하고 우선순위 점수를 매긴다.
데이터 분석 자체보다 더 중요한 것은 시민이 이해할 수 있는 형태로 정보를 시각화하는 것이다. 대부분의 시민은 숫자보다는 그래프, 지도, 순위표를 통해 정보를 받아들이는 데 익숙하다. 이 시스템은 분석된 예산 데이터를 기반으로 ‘생활밀착 정책 TOP10’, ‘작년 대비 예산 증감이 가장 큰 분야’, ‘1인당 예산 집행액이 가장 높은 항목’ 등을 자동으로 추출하여 시각화한다. 예를 들어 서울 성북구 거주 시민이 시스템에 접속하면 다음과 같은 정보를 볼 수 있다:
이 데이터는 월 단위 또는 분기 단위로 갱신되며, 시스템은 시민이 쉽게 탐색할 수 있도록 순위 기반 인터페이스 또는 대시보드 형태로 구성된다. 또한 ‘우리 동네 정책 변화 추적기’, ‘지난 3년간 예산 흐름 차트’, ‘정책별 만족도 조사 연동’ 등의 부가 기능을 통해 시민 참여와 피드백까지 연계할 수 있다. 결과적으로 이 시스템은 단순히 행정정보를 전달하는 것에 그치지 않고, 정책에 대한 시민의 관심과 참여를 이끌어내는 행정 커뮤니케이션 플랫폼으로도 기능한다.
지방자치단체는 시민의 세금으로 정책을 집행하며, 그 사용 내역을 공개할 책임이 있다. 하지만 지금까지는 ‘공개’는 되어 있지만 ‘이해’되지는 못했다. 예산 데이터 자동 분석 및 시각화 시스템은 이 점에서 기존 행정 시스템의 공백을 메워주는 역할을 한다. 특히 정치적으로 민감하지 않은 ‘생활 정책’에 대해서는 정량적 분석과 시각화를 통해 정책 성과를 시민 스스로 판단할 수 있도록 돕는 기능이 매우 중요하다. 이 시스템은 향후 전국 모든 지자체를 대상으로 확장 가능하며, 청년 정책 집중도, 고령자 복지 격차, 지역 간 문화 예산 편차 등 정책 불균형을 드러내는 지표 생산 도구로도 활용할 수 있다. 또 언론, 학교, 시민단체 등에도 데이터를 제공함으로써 정책 비판이 아닌 정책 기반 대화를 가능하게 만드는 역할을 수행할 수 있다. 기술적 관점에서는 Streamlit, Dash, Tableau, Google Data Studio 등과 연동해 웹 대시보드 형태로 서비스할 수 있으며, PDF 또는 이메일 리포트 자동 생성 기능도 포함 가능하다.
궁극적으로 이 시스템은 시민이 '정책을 당하는 존재'가 아니라
'정책을 해석하고 질문하는 주체'로 변화하도록 돕는, 생활 밀착형 데이터 민주시스템이 될 수 있다.
지역별 정책 신뢰도와 만족도 추이 자동 리포트 시스템 구축하기 (0) | 2025.07.14 |
---|---|
지역별 예산 대비 시민 체감도 자동 수집 및 비교 분석 시스템 (1) | 2025.07.14 |
소상공인 지원 정책 데이터 자동 수집 후 업종별 추천 리포트 생성기 만들기 (0) | 2025.07.14 |
지역별 도서관 신간 정보 자동 정리 봇 만들기 (0) | 2025.07.08 |
지역 날씨 기반 반려동물 산책 시간 추천 자동화 시스템 (0) | 2025.07.07 |