▶ 데이터 불러오기
pd.read_excel('파일명.xlsx', engine = 'openpyxl')
▶ 데이터 선택(행 선택)
df.iloc[]
* df_ns.columns.map(int) => df_ns의 컬럼명을 int로 적용시킨다.
map(적용할 함수, 적용대상) : 적용대상에 적용할 함수를 각각 적용시킨다.
▶ line plot(라인 그래프)
df.plot() # 자동으로 컬럼이 y축, index가 x축으로 들어감
# 따로 그래프 종류를 설정하지 않으면 기본값 라인그래프로 그려짐
▶ 행과 열 전치
df.T
▶ 막대 그래프 그리기(bar)
df.plot(kind='bar')
▶ 히스토그램 그리기
df.plot(kind='hist')
* tdf_ns.astype(float) => tdf_ns의 데이터 타입을 float으로 변환
▶ 데이터 불러오기
▶ 상관계수 확인
df.corr()
* '출력' 컬럼의 데이터는 문자이므로 상관계수를 구할 수 없음
▶ 산점도 그리기(scatter)
df.plot(x='컬럼1', y='컬럼2', kind='scatter')
※ 내 컴퓨터에 설치된 폰트 출력 -> 한글패치
▶ 박스플랏 그리기(box plot)
df.plot(kind='box')
df[['컬럼1']].plot(kind='box') # 데이터프레임으로 추출하기 위해 [[]]사용
df[['컬럼1', '컬럼2']].plot(kind='box')
※ '출력' 컬럼의 데이터중 '?' 가 있어 float으로 변환이 불가하다
'데이터 분석' 카테고리의 다른 글
Matplotlib 분석(히스토그램, scatter plot, cmap, 파이그래프, boxplot) (0) | 2023.11.06 |
---|---|
Matplotlib 그래프 & 그래프 세부설정 (라인그래프, 점그래프, 점&라인그래프, 면적그래프, 막대그래프), (스택 여부, 수평, 보조축) (0) | 2023.11.06 |
데이터 분석 기초 (0) | 2023.10.31 |
판다스 데이터불러오기 (0) | 2023.10.31 |
판다스 기초 2 (0) | 2023.10.31 |