분류 전체보기 16

06. 서울시 범죄현황 통계자료 분석 및 시각화

지도를 이용한 시각화 진행 이제 지도를 불러와서 시각화를 진행해보자. 지도를 이용한 시각화는 Folium library를 활용해야 한다. 그런데 우리는 지금 서울시 데이터만 가지고 있기 때문에 서울시 지도만 따로 뽑아서 사용할 것이다. 서울시 지도 데이터는 폴더에 'skorea_municipalities_geo_simple.json' 파일로 저장 되어 있다. 우선 Folium library를 다운로드 시키자. !pip install folium==0.5.0 코드를 실행시키고 마지막 줄에 Successfully가 뜨면 성공이다. 그리고 우리는 json 파일을 열기 때문에 json을 import 해주자 import json geo_path = 'skorea_municipalities_geo_simple.js..

05. 서울시 범죄현황 통계자료 분석 및 시각화

인구수 열까지 포함한 gu_df의 데이터 프레임은 다음과 같다. 이 데이터 프레임을 시각화하기 쉽게 하기 위해서 정렬을 해보겠다. '검거율'로 정렬을 시켜보도록 하겠습니다. gu_df.sort_values(by='검거율', inplace=True, ascending=True) gu_df 정렬 함수는 sort인데, '검거율' 열의 값을 기준으로 정렬이므로 sort_values를 사용한다. ( )안에는 기준열부터 작성하고, ascending의 뜻은 '올라가다'이다. 그런데 False이므로 내림차순으로 정렬이다. inplace는 덮어쓰기를 허용한다는 뜻이다. 이제 검거율과 인구수를 제거한 데이터 프레임으로 시각화를 진행해보자. 어느 구에서 5대 범죄가 많이 일어나는지 알아보기 위해서이다. gu_df[[ '강간..

04. 서울시 범죄현황 통계자료 분석 및 시각화

이제부터 Jupyter Notebook으로 제대로 된 프로젝트를 시작하겠다. 프로젝트는 '서울시 범죄 현황 통계자료를 분석하고, 시각화'를 하는 것이다. import numpy as np import pandas as pd import seaborn as sns from matplotlib import font_manager, rc 우선 가장 기본적인 세팅을 해주자. 마지막 matplotlib은 한글 폰트를 위한 것인데, 굳이 외워서 안써도 된다. 그리고 서울시 범죄현황 파일은 Jupyter Notebook과 같은 폴더 안에 있어야 쉽다. 이제 파일을 불러오자. df = pd.read_excel('관서별 5대범죄 발생 및 검거.xlsx') 엑셀 파일이기 때문에 read_excel 함수를 사용한다. 파일을..

03. Jupyter Notebook DataFrame 기초

1. DataFrame에서 일부 행 꺼내는 방법. 행 꺼내는 코드는 2가지가 있다. 행 꺼내는 함수명 설명 loc[ ] [ ] 안에 index 명을 입력 iloc[ ] 1. [ ] 안에 index 명을 입력 2. [ ] 안에 행의 범위, 열의 범위 입력 df.loc[3] 첫번째, loc은 location의 약자이다. DataFrame의 index number의 위치를 알려주면 그 값을 출력해주는 것이다. 주의해야 할 점은 [ ]안에 인덱스 번호를 넣어야 한다. 출력 값은 다음과 같다. 출력 값 중 name 열이 key 값이고, bear 열이 value 값이다. 이때 시각화 좋게 출력하려면 [ ]를 두번 사용하면 된다. df.loc[[3]] 여러 행을 출력하기 위해서는 다음과 같이 key 값들을 list로..

Jupyter NoteBook 2023.06.29

02. Jupyter Notebook File 읽기

제가 듣고 있는 강의에서 프로젝트를 하나 시작했습니다. 프로젝트 내용은 Jupyter Notebook을 이용해 '서울시 5대 범죄 현황.xlsx'을 활용해 데이터 시각화까지 하는 것입니다. 오늘은 '서울시 5대 범죄 현황.xlsx'을 Jupyter Notebook에서 사용하는 것을 배웠습니다. import numpy as np import pandas as pd import seaborn as sns 위의 함수는 python의 3대장 라이브러리입니다. Library 설명 numpy 행렬 연산, 수치 계산 pandas 정형 데이터 핸들링 seaborn 정형 데이터 시각화 matplotlib 정형 데이터 시각화를 위해서는 matplotlib을 사용하는데, seaborn이라는 함수가 더 그래프가 이쁘고, 코드..

Jupyter NoteBook 2023.06.28

01. Jupyter Notebook 단축키

안녕하십니까. 저는 인공지능 공부를 이제 막 시작한 23살 남성입니다. 컴퓨터공학 전공은 아니지만 인공지능에 관심이 있어 군대에서 공부하고, 전역하고 공부한 것을 기록으로 남기려고 글을 작성합니다. 목표는 1일 1글입니다만.. 안될 수도 있습니다. Jupyter Notebook은 python 코딩을 하기 위한 수단 중 하나입니다. 문서화가 용이하고, 코딩한 것을 바로바로 확인할 수 있다는 장점이 있답니다. 오늘은 Jupyter Notebook에서 많이 사용하는 단축키를 소개 시켜 드리겠습니다. 우선, Jupyter Notebook은 아래 그림과 같이 cell 안에서 명령어를 입력하고, 실행하는 방식입니다. 명령어를 실행하는 방법은 Shift+Enter를 누르면 됩니다. cell 밖으로 나가는 방법은 es..

Jupyter NoteBook 2023.06.27