CSV 파일 열기 방법 완벽 가이드 - 한글 깨짐 없이 여는 7가지 방법
엑셀에서 CSV 파일을 열면 한글이 깨지거나 숫자가 이상하게 변할 때가 많습니다. 깔끔하게 여는 7가지 방법과 인코딩 문제를 한 번에 해결하는 노하우를 정리했습니다.
![]()
회사에서 받은 CSV 파일을 더블클릭했더니 글자가 깨져서 보이거나, 주민등록번호가 지수 표기로 바뀌거나, 모든 데이터가 한 칸에 들어가 있어서 당황한 적이 있을 겁니다. CSV는 단순한 텍스트 파일이지만 프로그램마다 처리 방식이 달라서 결과가 천차만별로 나타납니다.
특히 한국에서 만든 CSV는 EUC-KR(CP949)과 UTF-8 인코딩이 섞여 쓰이기 때문에 더 헷갈립니다. 상황에 맞는 안전한 CSV 파일 열기 방법을 정리해 드립니다.
CSV 파일의 정체 - 텍스트 파일일 뿐입니다
CSV는 Comma Separated Values의 약자로, 쉼표로 데이터를 구분한 단순 텍스트 파일입니다. 엑셀 전용 형식이 아니기 때문에 메모장으로도 열 수 있고, 어떤 프로그램이든 텍스트만 읽을 수 있다면 다룰 수 있습니다.
구조를 살펴보면 첫 줄은 보통 열 이름이고, 두 번째 줄부터 실제 데이터가 들어갑니다. 예를 들면 다음과 같습니다.
이름,나이,지역
홍길동,32,서울
김철수,28,부산
단순한 텍스트 한 줄이 표의 한 행이 됩니다. 이 단순함이 CSV가 25년 넘게 표준으로 쓰이는 이유입니다.
이렇게 단순한 구조 덕분에 모든 데이터 분석 도구, 데이터베이스, 통계 프로그램에서 표준 입출력 형식으로 사용합니다.
엑셀에서 CSV 파일 한글 안 깨지게 여는 방법
가장 흔하게 쓰는 방법이 엑셀입니다. 그러나 CSV 파일을 그냥 더블클릭하면 한글이 ?? 또는 □□로 깨져 보이는 경우가 많습니다. 인코딩 자동 감지가 완벽하지 않기 때문입니다.
안전하게 여는 단계
- 엑셀을 먼저 빈 화면으로 실행합니다.
- 상단 메뉴에서 데이터 - 텍스트/CSV에서를 선택합니다.
- 파일을 선택하면 미리보기 창이 뜨면서 인코딩(파일 원본)을 고를 수 있습니다.
- 한글이 깨져 보이면 65001(UTF-8)과 949(CP949)를 번갈아 선택해 깨지지 않는 쪽을 고릅니다.
- 로드를 누르면 워크시트로 들어옵니다.
숫자가 날짜로 바뀌는 문제
엑셀은 1-1 같은 값을 자동으로 1월 1일로 바꿔 버립니다. 주민등록번호 앞자리, 우편번호 앞 0, 카드번호도 사라지거나 변형됩니다. 이런 데이터를 보호하려면 가져오기 마법사에서 해당 열을 텍스트로 지정해야 합니다.
구글 스프레드시트와 온라인 도구로 열기
엑셀이 없거나 모바일에서 빠르게 확인해야 할 때는 구글 스프레드시트가 편합니다. 자동으로 UTF-8을 감지해서 한글 깨짐 없이 열어주는 경우가 대부분입니다.
- 구글 드라이브에 CSV 파일을 끌어다 놓습니다.
- 업로드된 파일을 우클릭해서 Google 스프레드시트로 연결을 선택합니다.
- 자동으로 표 형태로 변환되며 공유 링크도 바로 만들 수 있습니다.
특히 가계부, 대출 상환 내역, 매출 데이터 같은 숫자 위주 CSV를 정리할 때 유용합니다. 정리한 데이터를 바탕으로 대출 계산기로 이자를 다시 계산하거나 퍼센트 계산기로 증감률을 빠르게 확인하면 분석 시간이 크게 줄어듭니다.
텍스트 에디터와 개발자 도구 활용
CSV 파일이 너무 크거나 단순히 내용만 확인하고 싶을 때는 텍스트 에디터가 유리합니다. 표 형태로 보이지는 않지만 인코딩을 자유롭게 바꿀 수 있어서 깨짐 문제를 진단하기 쉽습니다.
| 도구 | 장점 | 적합한 상황 |
|---|---|---|
| 메모장 | 윈도우 기본 제공 | 10MB 이하 작은 파일 확인 |
| VS Code | 인코딩 변환, 컬러 강조 | 구조 검토와 수정 |
| Notepad++ | 대용량 파일도 빠르게 | 50MB 이상 큰 파일 |
| Python pandas | 자동 분석과 변환 | 수십만 행 데이터 처리 |
| LibreOffice Calc | 무료, 인코딩 선택 가능 | 엑셀 라이선스가 없을 때 |
VS Code에서는 파일을 연 뒤 우측 하단의 UTF-8 표시를 클릭하면 Reopen with Encoding 메뉴가 나타납니다. 여기서 EUC-KR을 선택하면 깨졌던 한글이 정상으로 보입니다.
한글 깨짐 인코딩 문제 해결법
한글 깨짐의 원인은 거의 100% 인코딩 불일치입니다. 파일을 만든 쪽과 여는 쪽이 사용하는 글자 표현 방식이 다르기 때문입니다.
가장 자주 마주치는 두 가지 인코딩은 다음과 같습니다.
- UTF-8: 전 세계 표준입니다. 웹과 최신 프로그램 대부분이 사용합니다.
- EUC-KR(CP949): 한국 윈도우 기본값입니다. 엑셀이 자동 저장 시 사용합니다.
엑셀에서 저장한 CSV를 깃허브에 올리면 깨지고, 깃허브에서 받은 CSV를 엑셀에서 더블클릭하면 깨지는 이유가 바로 이 차이입니다. 한쪽으로 통일하는 가장 좋은 방법은 UTF-8 with BOM 형식으로 저장하는 것입니다. BOM이라는 작은 표시가 파일 앞에 붙어서 엑셀이 자동으로 UTF-8을 인식하게 만들어 줍니다.
CSV 파일 다룰 때 자주 묻는 질문
1GB가 넘는 CSV는 어떻게 열까요
엑셀은 약 104만 행까지만 지원합니다. 그 이상이면 행이 잘립니다. 큰 파일은 EmEditor, Notepad++, 또는 Python pandas의 chunksize 옵션을 사용해 나눠서 처리해야 합니다.
쉼표가 데이터 안에 들어 있으면 어떻게 되나요
주소나 회사명에 쉼표가 들어 있으면 열이 어긋납니다. 이런 값은 큰따옴표로 감싸야 하며, 엑셀은 자동으로 처리해 주지만 직접 만든 텍스트 파일은 따옴표 처리를 따로 확인해야 합니다.
CSV 대신 어떤 형식을 쓰면 좋을까요
인코딩 문제가 자주 생긴다면 엑셀 전용 형식인 xlsx나 데이터 분석에 강한 parquet를 고려할 수 있습니다. 다만 호환성은 여전히 CSV가 가장 넓습니다.
지금 손에 깨져 보이는 CSV 파일이 있다면 두 가지 액션을 추천합니다. 첫째, 엑셀의 데이터 - 텍스트/CSV에서 메뉴로 다시 열어 인코딩을 직접 선택해 보세요. 둘째, 같은 파일을 자주 열어야 한다면 메모장이나 VS Code로 한 번만 UTF-8 BOM 형식으로 다시 저장해 두세요. 그 이후로는 더블클릭만으로도 깔끔하게 열립니다.