보다 자세한 설명은 도움말을 참고해주세요. WIDBEE

Posted by WIDBEE
2017. 3. 19. 18:01 IT/TIPS

오늘은 여러가지 테스트를 거치면서 알아낸 후지쯔 ScanSnap ix500설정에 대해서 공유하고자 합니다. 약 7만여장이 넘는 스캔을 하면서 알게된 나름의 최적화 설정이 아닐까 생각해 봅니다. 더 좋은 의견이 있으신 분은 댓글로 알려주시면 참고하겠습니다.


먼저 기본적으로 JPG로 스캔을 합니다. 이유는 원본파일을 보관하기 위함이고, PDF로 바로 변환하게 되면 작업시간도 좀 더 걸리고 뭔가 원하는대로의 결과물을 얻기가 조금 어렵더라구요. 그래서 (1) JPG스캔 (2) PDF로 변환 (3) OCR작업 이렇게 좀 더 세분화된 단계를 거치도록 했습니다.





먼저 ScanSnap Manager가 설치되어 있다는 가정하에 각 옵션의 세부설정에 관한 설명을 하도록 하겠습니다. 먼저 ScanSnap Manager를 실행해주시면 아래와 같은 화면이 나옵니다.



어플리케이션




제공되는 여러가지 모드가 있지만, 위와 같이 Scan to Folder로 설정합니다. Scan을 완료하면 Folder로 바로 저장하게끔 하는 옵션입니다. ABBYY에서 제공하는 여러가지 Scan모드가 있지만, Word, Excel, PowerPoint 등의 모드는 사용할 일이 거의 없고, 저의 최종적인 목표인 Searchable PDF(검색가능한 PDF)로 테스트해본 결과 작업시간도 오래걸리고 결과물도 세부단계를 거친 결과물보다 상대적으로 떨어집니다.




저장




저장은 파일명을 따로 지정해 주는게 좋습니다. 왜냐하면 이렇게 해야 실제 페이지 숫자와 비슷하게 알 수 있기 때문입니다. 정말 세밀하게 페이지를 원본 책과 동일하게 맞추고 싶으신 분들은 원본책의 1페이지부터 스캔해주시고 앞 표지는 나중에 스캔해서 앞에 배치해 주시면 됩니다. 저는 굳이 완전히 똑같을 필요는 없었기에 외부 겉표지부터 스캔했었습니다. 이정도만 되어도 비슷하게 페이지를 찾아갈 수 있으니까요.




스캐닝모드




스캐닝 모드는 Super Fine모드로 하면 됩니다. 300dpi면 품질과 속도 두마리 다 잡을 수 있는 모드입니다. 이것보다 높이면 스캔시간과 용량이 배로 늘어나게 됩니다. 이미지 회전의 경우 옆으로 누운 형태로 스캔되게 되면 회전해서 바로 잡는 모드인데, 정상적으로 스캔하면 되는 것도 옆으로 회전시키는 경우가 발생해서 체크해제 하였습니다. 


그리고 아래에 있는 체크옵션 중에서 


(1) 빈페이지를 자동으로 제거하는 옵션체크해제 하였는데, 이유는 원본책과 좌우 페이지 모습을 동일하게 맞추기 위해서는 빈페이지가 필요하기 때문입니다. 왜냐하면 책 내용 중 실제로 좌우 페이지에 걸쳐있는 그림 등이 있을 수 있기 때문입니다. JPG로 스캔하신 다음에 이미지뷰어의 2장씩 보기 모드 등을 이용하셔서 원본책과 동일하게 보이는지 체크해주시는 것이 좋습니다. 


(2) 그리고 현재 스캔이 종료된 후에도 스캐닝을 계속하는 모드는 체크해 준 이유는, 한 번에 여러 장을 스캔하기 위함입니다. 급지함에 올려진 종이들이 다 스캔되고 나면, 화면 우측 하단에 스캔을 계속할 것인지 중지할 것인지를 묻는 창이 뜨게 됩니다. 계속 스캔하고 싶은 경우에는 급지함에 다음 스캔할 내용들을 넣고 ScanSnap 본체에 있는 Scan버튼을 그냥 눌러주면 계속 스캔됩니다. 


'파일이 한꺼번에 날아가면 어떻게하나요?'라고 우려하시는 분들도 계신데, 7만 여장을 넘게 스캔하면서 그런 경우는 없었습니다. 다만, 제 실수로 '스캔파일을 지우시겠습니까?'라는 물음이 나왔을 때 '예'를 눌러서 지워본 적은 있습니다. 순간 당황했지만, 빠르게 스캔이 가능하므로 그냥 다시 스캔했습니다. 잃어버린 건 몇 분의 시간일 뿐.. 털썩...





다음으로 우측 하단에 있는 옵션 버튼을 누르면,



옵션에 있는 모든 체크옵션체크해제 하였습니다. 


(1) 블리드 스루종이비침 현상을 말합니다. 그래서 뒷면의 활자나 그림이 보이는 경우를 말하구요. 종이가 얇은 경우에 이런 현상이 나타납니다. 스캔할 때 빛을 투과하기 때문에 더 두드러지게 나타날 수도 있구요. 그런데 왠만한 책에서는 걱정하지 않아도 됩니다. 사전정도 되는 종이 두께에서 걱정할 문제이고, 실제로 이 옵션을 체크하고 스캔하게 되면 원본 페이지의 활자나 그림의 형태까지 보정하여 스캔하는 경우가 있기에 추천드리지 않습니다.


(2) 문서에서 문자만 선명하게 하는 모드를 체크했을 때 글자가 좀 부드럽지 않게 스캔됩니다. 글자의 선명도는 나중에 OCR처리할 때 높일 수 있기 때문에 JPG스캔 단계에서는 최대한 원본에 가까운 형태로 스캔하는게 좋습니다.




파일형식



파일형식은 JPEG로.




용지




용지는 설명서 등 중요도가 떨어지는 스캔인 경우에는 편리하게 자동검출로 했습니다만, 책을 스캔하는 경우에는 가로 X 세로 사이즈를 다 측정한 뒤에 사용자 지정크기에 입력해주고 그리고 그 사이즈로 스캔을 했습니다. 책의 경우 자동검출 모드로 스캔하게 되면 사이즈가 1mm씩 커졌다 작아졌다 뒤죽박죽 되는 경우가 있는데, 나중에 PDF로 바꿔보면, 글자 범위 및 라인이 안맞습니다. 그래서 좀 거슬릴 수가 있기에 처음부터 정해진 사이즈대로 스캔하는 것이 좋습니다. 책을 줄자로 재실 때 정밀하게 재단한 경우가 아닌 한, 위 아래가 1mm씩 차이나는 경우도 있을 수 있습니다. 그래서 여유있게 1 ~ 2mm 정도 줄여서 스캔하시면 하얀여백이 생기지 않습니다.




압축



다음으로 JPG압축은 하지 않았습니다. 이유는 스캔 작업속도 때문입니다. 원본 그대로 작업하는 것이 좋고, 이 압축률이 얼마나 효용있는지 모르기 때문입니다. 




참고사항


(1) 스캔하시다가 이 생기거나 스캔품질이 좀 떨어지는 것으로 보이시면, 스캐너를 열어서 안에 있는 스캔 유리판을 살펴보세요. 2개가 있고 위아래로 스캔하게 되는데, 스캔을 많이 하다보면 그곳에 책 본드 등의 이물질이 묻는 경우가 있습니다. 이러한 경우 극세사나 안경천과 같이 부드러운 천에 물을 살짝 묻혀서 닦아주시면 아주 잘 닦이고 스캔 결과물도 훌륭해집니다. 


(2) ix500 제품의 구조상 전체가 검정색이라던가 단색을 스캔하는 경우, 미세한 줄이 생길 수 있습니다. 이물질 때문이 아니라 스캐너 내부 구조상 그림자가 생기는 것 같더라구요. 엄청 민감하신 분이 아닌 한 일반 도서 스캔에서는 전혀 거슬리는 점은 아닙니다. 다만, 컬러이미지 전용책을 스캔할 때는 이 점은 어쩔 수 없으니 참고하시기 바랍니다.




(3) 얼마전에 구글에서 Guetzli라는 JPEG압축 프로그램을 공개했습니다. 압축률을 35%까지 높여서 300KB짜리 사진의 경우 100KB정도용량으로 화질저하없이 줄인다고 합니다. 저도 아직까지 구글이 제공한 예제 이미지만 테스트 해보았기에, 다른 이미지들을 좀 더 테스트하고 나서 관련 내용은 포스팅하도록 하겠습니다. 구글에서 제공한 이미지는 173KB의 png 이미지가 37KB의 jpg 이미지로 변환하는데 성공하였는데, 그 외 이미지로 테스트하니 몇 가지 오류나는 경우가 있더라구요. 그리고 결과물은 좋지만, 생각보다 변환시간이 오래걸립니다. UI없이 command 명령으로만 변환이 가능하구요.)