AUTO TRADE/etc contents

Pandas to_excel 사용 방법

Pandas 모듈 내에는 to_sql과 더불어 to_excel이라는 함수를 제공하고 있다. 즉, 데이터를 엑셀 파일로 저장하는 동작을 수행하는 함수이다. 다만 이에 관한 정보가 너무 많고 사용 방법에 있어서도 상당 부분 상이하고 각자만의 방법으로 사용하고 있다 보니 처음에 to_excel 함수를 사용할 때는 베껴서 작성한다 하더라도 나중에 가면 사용 방법을 까먹고 다시 또 구글링을 하게 되는 대참사(?)가 반복된다. 따라서 이번 포스팅에서는 파이썬을 통해 to_excel 함수를 사용하는 방법에 대해 작성하고자 한다.

 

Basic Formation of Excel

Pandas 모듈의 to_excel 함수를 사용하기 전에 앞서 알아두어야 할 몇 가지 개념들이 있는데, 아래의 사진을 참고하여 설명하도록 하겠다.

먼저 상단 왼쪽에 보면 A와 1이라는 값에 빨간색으로 색칠되어 있는데, 이는 각각 하나의 셀을 나타내기 위한 좌표와 같은 역할을 한다. 사진의 가운데 즈음에는 하얀 배경에 빨간색 칸이 하나 있는데, 그 칸 하나를 셀이라고 하며, 그 좌표는 C3이 되는 것이다. 마지막으로 맨 아래에는 Sheet1이라는 값이 표시되어 있는데, 저거는 '시트'를 의미하며 시트는 파일 하나에 여러 개가 사용될 수 있다.

 

import Pandas

가장 기본적인 내용이지만, 처음부터 모든 것을 다루기 위해 작성하는 글이니 만큼 이 부분에 대한 언급도 필요하다고 보았다. 파이썬 내에서 Pandas라는 모듈을 불러오는 방법은 import 문을 사용하는 것이고, 이는 여느 모듈을 불러올 때도 동일하게 적용된다.

import pandas

 

to_excel()

기본적으로, to_excel()은 정말이지 정말 단순하게도 파일 이름만 작성하면 알아서 데이터를 입력해준다. 물론 이외에도 정말 많은 옵션(option)들이 있지만 여기서는 가장 기본적인 사용 방법에 대해서만 익히도록 하자.

data.to_excel("filename.xlsx")

 

Parameters of to_excel

파이썬 내에서 to_excel()을 하고 그 안에 파일 이름을 입력한 후에 보면 그 뒤에 sheet_name이니, na_rep이니 다양한 옵션들이 나타나게 되는데 이에 관한 내용은 아래의 표를 참고하도록 하자. 바로 아래는 to_excel을 사용하는 데에 있어서 사용되는 파라미터가 포함된 가장 기본적인 형태이므로 이를 복사해서 붙여넣기 해둔 후에 주석 처리를 하고 나중에 궁금할 때마다 그 코드를 보도록 하자,  

DataFrame.to_excel(excel_writer, sheet_name='Sheet1', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, startrow=0, startcol=0, engine=None, merge_cells=True, encoding=None, inf_rep='inf', verbose=True, freeze_panes=None, storage_options=None)

Parameter format information
excel_writer   파일 경로나 파일 명을 입력
sheet_name  string defualt : 'Sheet1'
na_rep string defualt : ''
float_format string string을 float(숫자) 형태로 변환할 수 있도록 하는 파라미터
사용례) float_format = "%.2f"
columns list / string  
header list / string / bool 칼럼의 이름
index bool 기본 값 : True
엑셀에 저장될 때 해당 데이터 내에 있는 인덱스를 저장할 것인지의 여부
index_label string 인덱스의 이름을 설정하는 것. 만약 header 값과 index 값이 True라면 인덱스의 이름(대표적으로 idx)이 사용됨
startrow int 어느 지점부터 데이터를 입력할 것인지를 지정(defualt:0)
startcol과 함께 사용되는 것으로, startrow는 1, 2, 3, 4와 같이 값 지정 가능
startcol int 어느 지점부터 데이터를 입력할 것인지를 지정(defualt:0)
startrow과 함께 사용되는 것으로, startcol는 A, B, C, D와 같이 값 지정 가능
engine string 엔진을 사용한다면 입력해야 하는 부분으로, openpyxl 또는 xlsxwriter가 있음
merge_cells bool defualt : True
encoding string xlwt를 통해 엑셀 파일로 인코딩할 때 사용하는 파라미터. 그 외 openpyxl 등의 경우에는 자동적으로 unicode 형태로 입력됨
inf_rep string defualt : 'inf'
verbose bool defualt : True
freeze_panes tuple / int(length 2)  
storage_options dictionary  

 

 


 

728x90
반응형
Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.