목록전체 글 (305)
RUBY
서울시 범죄 현황 데이터 분석 프로젝트 2. 데이터 얻기 데이터 얻기 1. 구글에서 "서울시 관서별 5대 범죄 현황" 을 검색한다. 2. https://data.seoul.go.kr/dataList/316/S/2/datasetView.do 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 3. 필요한 데이터를 수집한다. 받은 데이터를 02.crime_in_Seoul.csv로 저장한다.
서울시 범죄 현황 데이터 분석 프로젝트 1. 목표 1. 데이터 얻기 2. 데이터 확인하고 초기 정리하기 - numpy, pandas 3. Pandas Pivot Table 적용하기 4. Python 모듈 설치하기 5. Google Maps API 설치하기 6. Python의 반복문 7. Google Maps를 이용한 데이터 정리 8. 구별 데이터 얻기 9. 범죄 데이터 정렬을 위한 데이터 정리 10. seaborn 11. 서울시 범죄현황 데이터 시각화 12. 지도 시각화 - Folium 13. 서울시 범죄 현황에 대한 지도 시각화 14. 서울시 범죄 현황 발생 장소 분석
서울시 CCTV 분석하기 프로젝트 5. matplotlib기초 matplotlib란? 파이썬의 대표 시각화 도구 Matplotlib는 Python 프로그래밍 언어 및 수학적 확장 NumPy 라이브러리를 활용한 플로팅 라이브러리이다. Tkinter , wxPython , Qt 또는 GTK 와 같은 범용 GUI 툴킷을 사용하여 애플리케이션에 플롯을 포함 하기 위한 객체 지향 API를 제공한다. Matplotlib은 매트랩과 유사하게 설계된 상태기계(예: OpenGL )을 기반으로 하는 절차적 "pylab" 인터페이스도 있지만 사용은 권장되지 않는다. SciPy는 Matplotlib을 활용한다. plt로 많이 naming하여 사용한다. Jupyter Notebook 유저의 경우 matplotlib의 결과가 o..
벌써 올해의 두 번째 달이 찾아왔다. 시간이 정말 빠르게 지나가는구나를 느낀다. 입사한지 얼마 안된 것 같은데 IT직종에서 일한지 10개월차에 접어들고 있다. 처음보다 많은 것들이 익숙해졌지만, 아직은 아는 것보다 모르는 것이 많고 앞으로 배워야 할 것과 이 곳에서 배울 것이 많다는 걸 아주 많이 느끼고 있다. 최근에는 회사 공식 홈페이지 내재화를 맡아서 진행하고 있는데 자꾸 다른 업무가 밀려와 정신 없다보니 진도가 잘 나가지 않는다... 일단 기존 PHP를 이용해서 만들어진 홈페이지를 내부 서버에서 돌리는게 목표이다. 새로 입사한 우리팀 친구한테 물어가며 꾸역꾸역 해 나가고 있다. 친구는 현재 폐쇄몰인 약사들만 이용하는 쇼핑몰을 맡아서 내재화를 진행중인데, 엄청나게 진도가 빠르다. 전공자에 인턴생활도 ..
서울시 CCTV 분석하기 프로젝트 4.Pandas 데이터 merge를 이용해서 병합하기 1. merge를 이용한 데이터 병합을 진행해보자 left = pd.DataFrame( { "key":["K0", "K4", "K2", "K3"], "A":["A0", "A1", "A2", "A3"], "B":["B0", "B1", "B2", "B3"], } ) right = pd.DataFrame( { "key":["K0", "K1", "K2", "K3"], "C":["C0", "C1", "C2", "C3"], "D":["D0", "D1", "D2", "D3"], } ) 2. left 데이터 left 3.right 데이터 right 4.key 컬럼 기준으로 병합 pd.merge(left, right, on="key"..
서울시 CCTV 분석하기 프로젝트 3.Pandas로 데이터 읽기(4) (인구현황 데이터 훑어보기) 1. 서울시 인구 데이터 확인 pop_Seoul.head() 2. 첫 행(0번)의 소계 데이터는 필요없다. 행을 지우는 명령 → drop pop_Seoul.drop([0], inplace=True) pop_Seoul.head() 3. unique 조사 pop_Seoul["구별"].unique() len(pop_Seoul["구별"].unique()) 4. 외국과 고령자 비율을 만들어준다. 데이터가 행이 25개인데, 딱 한줄로 의도하는 바를 이룬다. 컬럼 연산이 편하다는 것이 Python의 장점 pop_Seoul["외국인비율"]=pop_Seoul["외국인"]/pop_Seoul["합계"]*100 pop_Seoul..
서울시 CCTV 분석하기 프로젝트 3.Pandas로 데이터 읽기(3) 48. CCTV_Seoul = pd.read_csv("../data/01.Seoul_CCTV.csv", encoding='cp949') CCTV_Seoul.head() CCTV의 앞 부분 데이터를 확인한다. 49. 가장 CCTV를 적게 보유한 구 확인하기 CCTV_Seoul.sort_values(by="총계", ascending=True).head(5) 50. 가장 CCTV를 많이 보유한 구 확인하기 CCTV_Seoul.sort_values(by="총계", ascending=False).head(5) 51. 최근증가율을 구하려는데 Type 오류가 뜬다. 해결해보자. TypeError Traceback (most recent call l..
서울시 CCTV 분석하기 프로젝트 3.Pandas로 데이터 읽기(2) 25. import pandas as pd import numpy as np pandas는 통상적으로 pd로 import하고 수치해석적 함수가 많은 numpy는 통상적으로 np로 import한다. 26. s = pd.Series([1, 3, 5, np.nan, 6, 8]) s Pandas의 데이터형을 구성하는 기본은 Series이다. 27. dates = pd.date_range("20230131", periods=6) dates 날짜(시간)을 이용할 수 있다. 28. df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=["A", "B", "C", "D"]) df pandas에..