CSV 파일 결합
파워 쿼리에서 지정된 데이터 원본의 여러 파일을 결합할 수 있습니다. 이 문서에서는 결합하려는 파일이 CSV 파일인 경우 환경이 작동하는 방식을 설명합니다. 추가 정보: 파일 결합 개요 정보
팁
이 예제를 따라하려면 이 문서에 사용된 샘플 파일을 이 다운로드 링크에서 다운로드할 수 있습니다. 로컬 폴더, SharePoint 폴더, Azure Blob Storage, Azure Data Lake Storage 또는 파일 시스템 보기를 제공하는 다른 데이터 원본과 같은 원하는 데이터 원본에 해당 파일을 배치할 수 있습니다.
간단히 하기 위해 이 문서의 예제에서는 폴더 커넥터를 사용합니다. 추가 정보: 폴더
사용된 샘플 파일 정보
파일을 결합하려면 모두 동일한 구조와 동일한 확장명이 있어야 합니다. 이 예제에 사용된 모든 파일의 구조와 확장명은 동일합니다(.csv).
2019년 한 달마다 하나씩 12개의 CSV 파일이 있습니다. 다음 이미지는 1월의 파일의 처음 15개 행을 보여 줍니다.
행 수는 파일마다 다르지만 모든 파일에는 처음 4개의 행에 머리글 섹션이 있습니다. 열 머리글은 5번째 행에 있고 테이블의 데이터는 6번째 행에서 시작하여 모든 후속 행에서 계속됩니다.
목표는 12개 파일을 모두 단일 테이블로 결합하는 것입니다. 이 결합 테이블은 테이블 맨 위에 있는 머리글 행을 포함하며, 머리글 행 뒤의 별도의 열에 전체 연도의 원본 이름, 날짜, 국가, 단위 및 수익 데이터를 포함합니다.
테이블 미리 보기
결합할 파일을 호스트하는 폴더에 연결할 때(이 예제에서는 해당 폴더의 이름이 CSV Files - 왼쪽 위 모서리에 폴더 경로를 표시하는 테이블 미리 보기 대화 상자가 표시됩니다. 데이터 미리 보기에는 파일 시스템 보기가 표시됩니다.
이 예제에서는 결합을 선택합니다. Excel 또는 Power Query 데스크톱의 경우 결합 & 데이터 변환을 선택합니다.
메모
다른 상황에서는 데이터 변환 선택하여 파일을 결합하기 전에 데이터를 추가로 필터링하고 변환할 수 있습니다. 폴더에 결합하려는 파일만 포함되어 있다고 확신하는 경우에만 결합 선택하는 것이 좋습니다.
파일 결합 대화 상자
테이블 미리 보기에서 결합을 선택하면 파일 결합 대화 상자가 나타납니다.
메모
파워 쿼리는 목록에 있는 첫 번째 파일을 기반으로 사용할 커넥터를 자동으로 검색합니다. CSV 커넥터에 대해 자세히 알아보려면 Text/CSV으로 이동하세요.
이 예제에서는 모든 기본 설정(예제 파일첫 번째 파일, 파일 원본, 구분 기호및 데이터 형식 검색기본값)을 그대로 둡니다.
이제 오른쪽 아래 모서리에 있는 데이터 변환을 선택하여 출력 쿼리로 이동합니다.
출력 쿼리
파일 결합 대화 상자에서 변환 데이터을 선택하면 로컬 폴더에 대한 연결로 처음 생성한 쿼리의 파워 쿼리 편집기로 돌아갑니다. 이제 출력 쿼리에는 왼쪽 열의 원본 파일 이름과 나머지 열에 있는 각 원본 파일의 데이터가 포함됩니다.
그러나 데이터가 올바른 모양이 아닙니다. 각 파일을 결합하기 전에 상위 4개의 행을 제거해야 합니다. 각 파일을 결합하기 전에 변경하려면 화면 왼쪽의 쿼리 창에서 변환 샘플 파일 쿼리를 선택합니다.
변환 샘플 파일 쿼리 수정
이 변환 샘플 파일 쿼리에서 날짜 열의 값은 데이터가 연도-월-일(YYYY-MM-DD) 형식인 4월의 데이터임을 나타냅니다. 4월 2019.csv 테이블 미리 보기에 표시되는 첫 번째 파일입니다.
이제 데이터를 정리하기 위해 새 변환 집합을 적용해야 합니다. 각 변환은 각 파일의 데이터를 결합하기 전에 폴더의 모든 파일에 적용되는 도우미 쿼리 그룹 내의 함수로 자동으로 변환됩니다.
변환 샘플 파일 쿼리에 추가해야 하는 변환은 다음과 같습니다.
맨 위 행 제거 : 이 작업을 수행하려면 테이블의 왼쪽 위 모서리에 있는 테이블 아이콘 메뉴를 선택한 다음 맨 위 행 제거선택합니다.
맨 위 행 제거 대화 상자에서 4를 입력하고 확인을 선택합니다.
확인선택하면 테이블에 더 이상 상위 4개의 행이 없습니다.
첫 번째 행을 머리글로 사용: 테이블 아이콘을 다시 선택한 다음 첫 번째 행을 머리글로사용합니다.
이 작업을 통해 테이블의 첫 번째 행이 새 열 머리글로 승격됩니다.
이 작업이 완료되면 파워 쿼리는 기본적으로 열의 데이터 형식을 자동으로 검색하고 새 변경된 열 형식 단계를 추가하려고 시도합니다.
출력 쿼리 수정
파워 쿼리 데스크톱에서 CSV 파일 쿼리로 돌아가면 마지막 단계에서는 "테이블의 'Column1' 열을 찾을 수 없습니다."라는 오류가 표시됩니다. 파워 쿼리 온라인의 CSV 파일 쿼리로 돌아가면 이전에 처음 네 개의 행을 제거하고 첫 번째 행을 머리글로 사용하기 위해 변경한 내용이 테이블에 적용되지 않습니다. 파워 쿼리 온라인의 홈 탭에서 새로 고침 선택합니다. 화면을 새로 고치면 동일한 오류 메시지가 표시됩니다.
이 오류의 원인은 쿼리의 이전 상태가 Column1열에 대해 작업을 수행했기 때문입니다. 그러나 변환 샘플 파일 쿼리가 변경되었기 때문에 이 열은 더 이상 존재하지 않습니다. 추가 정보: 파워 쿼리에서 오류 처리
단계 이름 왼쪽에 있는 X 삭제 아이콘을 선택하여 적용된 단계 창에서 쿼리의 마지막 단계를 제거할 수 있습니다. 이 단계를 삭제하면 쿼리에 올바른 결과가 표시됩니다.
그러나 파일(날짜, 국가, 단위, 수익)에서 파생된 열에는 특정 데이터 형식이 할당되지 않습니다. 다음 표를 사용하여 각 열에 올바른 데이터 형식을 할당합니다.
열 이름 | 데이터 형식 |
---|---|
날짜 | 날짜 |
나라 | 문자 메시지 |
단위 | 정수 |
수익 | 통화 |
각 열에 대한 데이터 형식을 정의한 후 테이블을 로드할 준비가 된 것입니다.
메모
열 데이터 형식을 정의하거나 변경하는 방법을 알아보려면 데이터 형식.
확인
모든 파일이 결합되어 있는지 확인하려면 결합된 파일의 모든 이름을 표시하는 Source.Name 열 머리글에서 필터 아이콘을 선택할 수 있습니다. "목록이 불완전할 수 있음"이라는 경고가 표시되면 메뉴 아래쪽에 있는 로드할 선택하여 열에 사용 가능한 더 많은 값을 표시합니다.
더 많은로드를 선택하면 사용 가능한 모든 파일 이름이 표시됩니다.