Matplotlib 분석(히스토그램, scatter plot, cmap, 파이그래프, boxplot)
◆ 자동차 정보 데이터 분석 ▶ 데이터 선택 ▶ 히스토그램 sr.plot(kind='hist', bins=10) # 시리즈형태 혹은 데이터프레임에서 한 컬럼 선택 # bins : 밀도 / 낮을수록 함축시킴 ▶ Scatter plot df.plot(kind='scatter', x='차중', y='연비', c= 'coral', s=30) # c : color / s : size(점 크기) ▶ 3개 변수로 산점도 그리기 ● s = cylinders_size # 점 크기를 실린더 컬럼으로 ● c = cylinders_size, cmap = 'viridis', alpha = 0.3 # 점 색깔을 실린더 컬럼으로 / cmap : 색깔 가이드 / alpha : 투명도 ▶ 파이그래프 ● 제조국별 카운트 df['카운트'..
2023. 11. 6.
Matplotlib 그래프 & 그래프 세부설정 (라인그래프, 점그래프, 점&라인그래프, 면적그래프, 막대그래프), (스택 여부, 수평, 보조축)
◆ 인구이동 데이터 그래프 그리기 ▶ 데이터 준비 ▶ 누락값(NaN) 앞의 데이터로 채우기 df.fillna(method='ffill') # ffill : 포워드 필, 앞의 데이터로 채우기 / bfill : 백 필, 뒤의 데이터로 채우기 ▶ 서울에서 다른 지역으로 이동한 데이터만 추출(불린인덱싱) - '전출지별' 컬럼의 값이 '서울특별시'인 것 - '전입지별' 컬럼의 값이 '서울특별시'가 아닌것 ▶ 컬럼 삭제 및 인덱스 설정 df.drop(['전출지별'], axis=1) : '전출지별' 이라는 컬럼(axis=1)삭제 df.rename({'전입지별' : '전입지'}, axis=1) : '전입지별'이라는 컬럼(axis=1)을 '전입지'로 변경 df.set_index('전입지') : '전입지' 컬럼을 인덱스로..
2023. 11. 6.