Pandas 모듈 내에는 to_sql과 더불어 to_excel이라는 함수를 제공하고 있다. 즉, 데이터를 엑셀 파일로 저장하는 동작을 수행하는 함수이다. 다만 이에 관한 정보가 너무 많고 사용 방법에 있어서도 상당 부분 상이하고 각자만의 방법으로 사용하고 있다 보니 처음에 to_excel 함수를 사용할 때는 베껴서 작성한다 하더라도 나중에 가면 사용 방법을 까먹고 다시 또 구글링을 하게 되는 대참사(?)가 반복된다. 따라서 이번 포스팅에서는 파이썬을 통해 to_excel 함수를 사용하는 방법에 대해 작성하고자 한다.
Basic Formation of Excel
Pandas 모듈의 to_excel 함수를 사용하기 전에 앞서 알아두어야 할 몇 가지 개념들이 있는데, 아래의 사진을 참고하여 설명하도록 하겠다.
먼저 상단 왼쪽에 보면 A와 1이라는 값에 빨간색으로 색칠되어 있는데, 이는 각각 하나의 셀을 나타내기 위한 좌표와 같은 역할을 한다. 사진의 가운데 즈음에는 하얀 배경에 빨간색 칸이 하나 있는데, 그 칸 하나를 셀이라고 하며, 그 좌표는 C3이 되는 것이다. 마지막으로 맨 아래에는 Sheet1이라는 값이 표시되어 있는데, 저거는 '시트'를 의미하며 시트는 파일 하나에 여러 개가 사용될 수 있다.
import Pandas
가장 기본적인 내용이지만, 처음부터 모든 것을 다루기 위해 작성하는 글이니 만큼 이 부분에 대한 언급도 필요하다고 보았다. 파이썬 내에서 Pandas라는 모듈을 불러오는 방법은 import 문을 사용하는 것이고, 이는 여느 모듈을 불러올 때도 동일하게 적용된다.
import pandas
to_excel()
기본적으로, to_excel()은 정말이지 정말 단순하게도 파일 이름만 작성하면 알아서 데이터를 입력해준다. 물론 이외에도 정말 많은 옵션(option)들이 있지만 여기서는 가장 기본적인 사용 방법에 대해서만 익히도록 하자.
data.to_excel("filename.xlsx")
Parameters of to_excel
파이썬 내에서 to_excel()을 하고 그 안에 파일 이름을 입력한 후에 보면 그 뒤에 sheet_name이니, na_rep이니 다양한 옵션들이 나타나게 되는데 이에 관한 내용은 아래의 표를 참고하도록 하자. 바로 아래는 to_excel을 사용하는 데에 있어서 사용되는 파라미터가 포함된 가장 기본적인 형태이므로 이를 복사해서 붙여넣기 해둔 후에 주석 처리를 하고 나중에 궁금할 때마다 그 코드를 보도록 하자,