중국시가넷 - 고서 복원 - 오프라인 책을 전자책으로 바꾸는 방법

오프라인 책을 전자책으로 바꾸는 방법

제작 도구:

1. 스캐너

반드시 좋은 스캐너는 아니지만, 좀 더 빨리 하는 것이 가장 좋다. 이렇게 하면 많은 시간을 절약할 수 있다. 돈이 충분하다면 A3 용지를 스캔할 수 있는 스캐너를 사서 두 페이지를 스캔하여 한 페이지를 만들 수 있다.

2.OCR 소프트웨어

FINEREADER, 이 소프트웨어와 그 해독은 바이두나 개에서 찾을 수 있다. 또한 많은 언어 팩을 가지고 있어 많은 언어를 식별할 수 있다. (중국어는 이상적이지 않고, 다른 사람을 찾을 수 있고, 동측 인식 능력이 매우 강하다.) 더 많은 언어 팩을 설치하는 것이 좋습니다. (PDF 직접 스캔을 진행 중인 경우 XP 와 함께 제공되는 캡처 도구를 사용할 수 있습니다. ) 을 참조하십시오

검사 전 준비:

1 .. 컴퓨터를 켜고 전원을 꽂는다 ... 이런 쓸데없는 말은 나는 더 이상 말하지 않을 것이다.

2. 구글에 가서 스캔하고 싶은 책의 견본이 있는지 알아보세요. 한 장이라도 꼭 다운로드해야 한다.

3. FINEREADER 설정:

A) 책의 크기를 측정하고, 도구 메뉴에서 옵션 옵션을 선택하고, 이미지 페이지 스캔/열기로 전환하고, 소스 선택 ... 버튼을 클릭하고 사용할 스캐너를 선택합니다. 그런 다음 아래의 "스캔 전 디스플레이 옵션 대화상자" 를 선택하지 않도록 더욱 정교한 인터페이스를 사용하도록 선택합니다. 다음으로 오른쪽에 있는 스캐너 설정 버튼을 클릭하여 방금 측정한 책의 치수를 기입하십시오. 이렇게 하면 스캐너가 지정된 위치로 스캔될 때 스캐너의 전체 길이를 거치지 않고 되돌아갈 수 있으므로 많은 시간을 절약할 수 있습니다. 마지막으로 스캔 간격을 설정합니다. 일반적으로 2 초로 설정합니다.

B) 이전 단계와 동일한 인터페이스에서 스캔 모드를 그레이스케일로 설정합니다 (300dpi). 흑백 모드를 사용하면 책의 삽화가 더 어두워진다.

C) 스캔할 책을 뒤집는다. 주로 안에 특별한 문자가 있는지 알아보는 것이다. 예를 들어, 일부 수학 책에는 공식과 같은 이상한 문자가 많이 있습니다. 해당 언어 팩을 설치해야합니다. 전체 언어 팩을 사용하지 않으려면 새 언어를 직접 정의할 수도 있습니다. 이 작업은 도구 메뉴의 언어 편집기 ... 에서 수행됩니다 ... 언어 팩 설치는 작업의 절반에 불과합니다. 소프트웨어가 언어 팩이나 사용자가 정의한 언어를 사용할 수 있도록 하려면 식별 작업을 완료하는 데 필요한 언어도 소프트웨어에 알려야 합니다. 도구 모음에는 드롭다운 목록 상자가 있습니다. 기본값은 영어입니다. 복수 언어 선택 ... 을 선택한 다음 팝업 대화 상자에서 해당 언어를 선택합니다. 언어 설정이 완료되었습니다. (참고: 이 기능은 거의 사용되지 않으며 일반 영어로는 충분합니다. ) 을 참조하십시오

D) 처리 메뉴를 클릭하고 시작 배경 인식을 선택하면 가장자리 스캔 가장자리 인식을 할 수 있습니다. 스캔 후 자동 식별이 끝납니다.

4. 스피커를 켜세요. 음악이 울리면 일을 시작합시다.

스캔 인식 시 주의해야 할 문제:

1. 만약 스캐너가 얇지 않다면, 옆에 책 몇 권을 두는 것이 가장 좋다. 높이는 스캐너와 같다. 이렇게 하면 책을 스캔할 때 책이 한쪽으로 떨어지지 않아 많은 힘을 절약할 수 있다.

2. 두꺼운 책을 가운데로 쓸어 내면 제본 척추가 위로 아치형이 되어 힘껏 눌러야 합니다. 그렇지 않으면 제본 부근의 텍스트가 왜곡되어 인식 효과에 영향을 줍니다. 일반적으로, 중간에 쓸어 갈 때, 책을 양쪽으로 당기거나 힘껏 뒤로 뒤집을 수 있지만, 이렇게 하면 책에 큰 해를 끼칠 수 있다. 친구의 책을 빌려 쓸면, 이렇게 하지 말고, 눌리지 않도록 주의해라. 도서관 책이라면 상관없어요

3. 100% 로 책의 그림을 식별할 수 있는 OCR 소프트웨어는 아직 없습니다. 그림에 가로줄이나 선이 매우 많은 경우 표로 간주되는 경우가 많습니다. 때로는 삼칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠칠 이 경우 식별 영역의 유형만 수동으로 지정할 수 있습니다. 방법은 매우 간단하다. 세로 도구 모음에서 그래픽 영역 버튼을 선택하고 스캔한 그래픽 위에 사각형 상자를 그리면 됩니다.

4. 텍스트 인식 영역의 크기가 변경되거나 새 텍스트 영역이 추가된 경우에만 페이지를 다시 인식해야 합니다. 텍스트 영역만 삭제하거나 텍스트 영역을 그래픽 영역으로 변경하는 경우 더 이상 식별할 필요가 없습니다.

5.FineReader 는 양식을 잘 처리하므로 일반적으로 양식의 로고를 변경할 필요가 없습니다. 양식에서 구분선을 추가하거나 제거하려면 세로 도구 모음의 응답 버튼만 사용하면 페이지를 인식하지 않고도 변경 결과가 즉시 표시됩니다.

6. 정확성을 보장하기 위해 OCR 이후 맞춤법 검사가 필요합니다. 가장 일반적인 오류는 L (소문자 L) 을 1 (아라비아 숫자), 0, O 와 혼동하는 것입니다. 많은 r0 이 ro 로 인식되는 것과 같은 법칙을 찾을 수 있다면 대체 함수를 사용하여 한 번에 교체할 수 있습니다. 이렇게 하면 더 이상 잘못된 힌트를 받지 않을 것이다.

라벨

이건 제가 직접 스캔한 전자책을 제작한 경험일 뿐입니다. FineReader 는 스키마 편집기와 같은 일부 기능을 아직 사용하지 않은 강력한 소프트웨어입니다. 이 글이 벽돌을 던져 옥을 끌어들이는 역할을 하여 전자책을 만들고 싶은 친구에게 도움이 되기를 바랍니다.

스캔 전자책을 만드는 것은 큰 공사이다. 고품질의 전자책을 만드는 데는 시간과 정력이 필요하지만, 전자책 한 권을 완성하면 마치 걸작처럼 느껴진다.