서울시 범죄현황 통계자료 분석 및 시각화 3

06. 서울시 범죄현황 통계자료 분석 및 시각화

지도를 이용한 시각화 진행 이제 지도를 불러와서 시각화를 진행해보자. 지도를 이용한 시각화는 Folium library를 활용해야 한다. 그런데 우리는 지금 서울시 데이터만 가지고 있기 때문에 서울시 지도만 따로 뽑아서 사용할 것이다. 서울시 지도 데이터는 폴더에 'skorea_municipalities_geo_simple.json' 파일로 저장 되어 있다. 우선 Folium library를 다운로드 시키자. !pip install folium==0.5.0 코드를 실행시키고 마지막 줄에 Successfully가 뜨면 성공이다. 그리고 우리는 json 파일을 열기 때문에 json을 import 해주자 import json geo_path = 'skorea_municipalities_geo_simple.js..

05. 서울시 범죄현황 통계자료 분석 및 시각화

인구수 열까지 포함한 gu_df의 데이터 프레임은 다음과 같다. 이 데이터 프레임을 시각화하기 쉽게 하기 위해서 정렬을 해보겠다. '검거율'로 정렬을 시켜보도록 하겠습니다. gu_df.sort_values(by='검거율', inplace=True, ascending=True) gu_df 정렬 함수는 sort인데, '검거율' 열의 값을 기준으로 정렬이므로 sort_values를 사용한다. ( )안에는 기준열부터 작성하고, ascending의 뜻은 '올라가다'이다. 그런데 False이므로 내림차순으로 정렬이다. inplace는 덮어쓰기를 허용한다는 뜻이다. 이제 검거율과 인구수를 제거한 데이터 프레임으로 시각화를 진행해보자. 어느 구에서 5대 범죄가 많이 일어나는지 알아보기 위해서이다. gu_df[[ '강간..

04. 서울시 범죄현황 통계자료 분석 및 시각화

이제부터 Jupyter Notebook으로 제대로 된 프로젝트를 시작하겠다. 프로젝트는 '서울시 범죄 현황 통계자료를 분석하고, 시각화'를 하는 것이다. import numpy as np import pandas as pd import seaborn as sns from matplotlib import font_manager, rc 우선 가장 기본적인 세팅을 해주자. 마지막 matplotlib은 한글 폰트를 위한 것인데, 굳이 외워서 안써도 된다. 그리고 서울시 범죄현황 파일은 Jupyter Notebook과 같은 폴더 안에 있어야 쉽다. 이제 파일을 불러오자. df = pd.read_excel('관서별 5대범죄 발생 및 검거.xlsx') 엑셀 파일이기 때문에 read_excel 함수를 사용한다. 파일을..