목록전체 글 (305)
RUBY
서울시 범죄 현황 데이터 분석 프로젝트 10. 범죄 데이터 정렬을 위한 데이터 정리 crime_anal_gu.head() 1. - 정규화 - 본래의 DataFrame은 두고, 정규화 된 데이터를 따로 만든다. - 최고값을 1로 두고, 최소값을 0으로둔다. crime_anal_gu["강도"] / crime_anal_gu["강도"].max() 2. 데이터 정리하기 col = ["살인", "강도", "강간", "절도", "폭력"] crime_anal_norm = crime_anal_gu[col] / crime_anal_gu[col].max() crime_anal_norm.head() 3. 검거율을 추가하자 col2 = ["강간검거율", "강도검거율", "살인검거율", "절도검거율", "폭력검거율"] crime..
서울시 범죄 현황 데이터 분석 프로젝트 9. 구별 데이터 얻기 구별 데이터 얻기 - 경찰서별 데이터로 정리되어 있다. - 서울은 한 구에 경찰서가 두 곳인 구가 있다. - 그러므로 구의 이름으로 다시 정렬해야 한다. 1. - 데이터를 다시 읽어오자 - 중간에 데이터를 파일로 저장해두면 테스트 코드가 긴 경우에 중간부터 다시 작업할 수 있다. # index_col "구분"을 인덱스 컬럼으로 설정 crime_anal_station = pd.read_csv( "../data/02. crime_in_Seoul_raw.csv", index_col=0, encoding="utf-8") crime_anal_station.head() 2. - pivot_table을 이용해서 구별로 정리하자 - pivot_table의 ..
서울시 범죄 현황 데이터 분석 프로젝트 8. Google Maps을 이용한 데이터 정리 1. Google Maps API를 설치하자 conda install -c conda-forge googlemaps 은근히 시간이 걸리니 천천히 기다려주자. 2. 구글맵을 import 하자! import googlemaps gmaps_key = "방금 발급받은 Geocoding api key값 입력" gmaps = googlemaps.Client(key=gmaps_key) 3. 구글맵 API 단순 테스트 해보기 gmaps.geocode("서울영등포경찰서", language="ko") 아 주 잘 출력된다~ 4. - 구글 맵 API에서 데이터 얻기 - 전체 결과 크기가 1인 list형이라서 tmp[0]로 접근 - 큰 리스..
서울시 범죄 현황 데이터 분석 프로젝트 7. Python의 반복문 For - loop 모든 언어에는 다 반복문이 있다. Python의 반복문은? * MATLAB은 반복이든, 조건이든, 함수이든 end로 끝나게 해서 구분하고 * C/C++은 중괄호로 구문의 시작과 끝을 구분한다. * Python은 들여쓰기(intent)로 구분한다. ex) for n in [1,2,3,4]: 들여쓰기로 코드를 작성 들여쓰기가 적용되는 곳까지가 for문 그리고 들여쓰기를 중단하면 for문이 아니다. for n in [1, 2, 3, 4]: print("Number is ", n) for n in range(0, 10): print(n ** 2) 방금 전 코드를 한줄로 만들면? [n ** 2 for n in range(0, 1..
서울시 범죄 현황 데이터 분석 프로젝트 6. Google Maps API설치하기 1. 구글에서 conda install googlemaps을 검색한다. 2. 설치하자 https://anaconda.org/conda-forge/googlemaps Googlemaps :: Anaconda.org Description Use Python? Want to geocode something? Looking for directions? Maybe matrices of directions? This library brings the Google Maps API Web Services to your Python application. Analytics anaconda.org 모든 모듈이 깔끔하게 설치되는 것은 아니다. ..
서울시 범죄 현황 데이터 분석 프로젝트 5. Python 모듈 설치하기(pip, conda) pip 명령 - Python의 공식 모듈 관리자 - pip list : 현재 설치된 모듈 리스트를 반환한다. - pip install module_name : 모듈 설치 - pip unimstall module_name : 설치된 모듈을 제거한다. get_ipython().system("pip list") conda 명령 pip를 사용하면 conda환경에서 dependency 관리가 정확하지 않을 수 있다 아나콘다에서는 가급적 conda 명령으로 모듈을 관리하는 것이 좋다. - conda list : 설치된 모듈 list - conda install module_name : 모듈 설치 - conda uninsta..
서울시 범죄 현황 데이터 분석 프로젝트 4. Pandas Pivot Table index, columns, values, aggfunc 1. 간단한 판매 현황표를 가져와본다. df = pd.read_excel("../data/02. sales-funnel.xlsx") df.head() 2. Name 컬럼을 인덱스로 설정하고 재정렬해보려한다. # pd.pivot_table(df, index="Name") df.pivot_table(index="Name") C:\Users\JIEUN\AppData\Local\Temp\ipykernel_17280\4182054485.py:1: FutureWarning: pivot_table dropped a column because it failed to aggregate...
서울시 범죄 현황 데이터 분석 프로젝트 3. 데이터 확인하고 초기 정리하기 1. 필요한 모듈을 import 한다. - 먼저 numpy와 pandas를 사용한다. import numpy as np import pandas as pd 2. - 숫자들이 콤마(,)를 사용하고 있어서 문자로 인식될 수 있다. - 천단위 구분(thounsands=',') 이라고 알려주면 콤마를 제거하고 숫자형으로 읽는다. crime_raw_data = pd.read_csv("../data/02. crime_in_Seoul.csv", thousands=",", encoding="euc-kr") crime_raw_data.head() 3. - info() : 데이터의 개요 확인하기 - RangeIndex가 65534인데 데이터가 31..