본문 바로가기
업무 보조 프로그램

PDF 테이블을 엑셀 데이터로 변환 [Windows 버전]

by 어날켐 2024. 1. 22.
728x90

PDF 파일의 테이블 자료를 텍스트 자료로 변환하기
(Windows 버전: Excel)

PDF 자료들을 확인하다보면,
계산 과정을 확인하기 위해서 같은 과정을 모방해 보기 위해서
기존 자료들을 사용해 보고 싶은 경우가 있다. 
하지만, 자이 테이블 (표)로 구성되어 있다면
엑셀에 복사 / 붙여넣기 하면 테이블 형태로 가져오지 못한다. 
모든 자료들이 셀 하나에 모두 들어가 있거나, 
하나의 행 또는 열로 자료들이 배열되어 다시 정리해야 한다.

이번 내용은 이미지에서 텍스트를 가져오는 방법 중
테이블 데이터를 원본 형태로 가져올 수 있는 방법을 소개하려고 한다.

엑셀 (Excel) 에는 외부 데이터를 가져오는 방법들을 제공하고 있다. 
그 중에 이미지에서 데이터를 가져오는 도구를 사용하면
테이블 형태의 데이터를 원본 형태로 가져오는 것이 가능하다.

엑셀 메뉴에서 데이터 탭에 "데이터 가져오기 및 변환" 메뉴가 있다. 

그 중에 "사진에서" 메뉴를 선택하면 "파일의 사진" 과 "클립보드의 사진" 이 나타난다.

PDF 파일에서 테이블을 사진으로 저장해서 진행해도 가능하지만, 
사진 저장하는 번거로운 작업이 추가된다. 
그래서 클립보드로 임시 저장해서 작업하는 방식이 더 간편하다. 

윈도우는 화면 캡처 기능을 제공하고 있으므로
그 방법을 사용해서 클립보드로 이미지를 임시 저장하고 
엑셀에서 클립보드의 사진을 가져오는 방식을 사용하면 
가져오기 작업을 손쉽고 간편하게 할 수 있다. 

윈도우의 화면 캡처 방법은 단축키를 사용하면 
프로그램 실행 없이도 바로 사용이 가능하다. 
화면 캡처 단축키는 다음과 같다. 

Shift + Window 키 + S

화면 캡처 단축키를 누르면 화면이 색상이 회색으로 변하게되고, 
캡처 하고 싶은 시작점에서 마우스를 클릭한 상태에서 드래그하면
색생이 선명해지고 영역을 확인할 수 있다. 
캡처의 마지막 지점에서 클릭 상태를 해제하면 
해당 영역의 이미지가 클립보드에 캡처된다.
아래 영상은 화면 캡처와 엑셀에서 테이블 데이터를 가져오는 내용을 보여준다. 

화면 캡처 이후에 엑셀에서 "클립보드의 사진" 메뉴를 선택하면
자동 클립보드의 이미지를 불러와서 데이터를 가져온다. 
해당 메뉴는 클립보드에 사진이 없으면 활성화되지 않는다.

자동으로 데이터 가져오기가 끝나면 
상단 화면에는 이미지를 보여주고,
가져온 데이터는 하단에 미리보기로 보여준다. 
데이터 중 오류 데이터가 있는 경우
하단에 붉은색으로 표시해 준다.
오류로 보이는 데이터는 클릭해서 수정이 가능하다.
추가 수정이 없다면 "데이터 삽입"을 클릭한다. 
엑셀로 가져온 데이터는 시트에서 입력된 것이 확인된다.

하지만, 기타 오류들이 나타나기도 하기 때문에 
추가적인 오류들을 다시 확인하는 것이 필요하다. 
영상처럼 숫자 사이에 띄어쓰기가 되어 있거나 
한글 또는 영문은 다른 글자로 가져오는 경우도 있다.

이런 오류를 줄이기 위해서는
클립보드 사진의 화질이 좋으면 오류가 적어진다. 
캡처 이미지 화질을 좋게 하려면 
프로그램 창을 전체 화면으로 설정하고,
테이블 내용을 최대로 확대하서 캡처하면 가능하다.

이런 방법을 사용해도 인식 오류는 발생하기 때문에
꼭! 마지막에는 원본과 가져온 데이터를 비교해야 한다. 

불러온 데이터의 오류를 확인하는 또 다른 방법으로는
엑셀에서 숫자는 오른쪽 정렬, 문자는 왼쪽 정렬을 
기본 설정으로 하고 있기 때문에 
숫자 데이터들이 나열된 자료 중 
정렬이 다른 것이 있다면 가져오기 중 다른 입력이 추가된 경우로
띄어쓰기 또는 다른 문자 (특수기호)가 삽입되어 문자로 인식될 수 있다.

데이터를 가져온 이후 원본과 비교 확인은 꼭 잊지말아야 한다. 

728x90