Есть PDF справочник на 500+ страниц. Его надо перегнать в HTML, оставив только чистый текст с сохранением форматирования. Но на каждой странице присутствует верхний колонтитул с алфавитным указателем и номером страницы, который потом смешивается с текстом и убрать его по отдельности нельзя, ибо шрифт в колонтитуле такой же как и в основном тексте.
Как запретить Finereader сканировать верхнюю часть каждой страницы?
Останні статті і огляди
Новини
Как в Finereader ограничить область сканируемого документа?
-
MaG!STeR
Member
- Звідки: Vancouver, Canada
-
siruf
Advanced Member
- Звідки: Киев
Если в ПДФ страницы приблизительно одного размера - то открыть его в Finereader, зайти в корректировку страниц - там где обрезка, выравнивание, поворот и т.п. Задать область без колонтитула и обрезать - применить ко всем страницам. Потом то что выйдет - сканировать.
Есть кстати шикарная программа для обработки перед сканированием, не знаю дружит ли она с пдф:
http://scantailor.sourceforge.net/?q=ru/node/4" target="_blank
Есть кстати шикарная программа для обработки перед сканированием, не знаю дружит ли она с пдф:
http://scantailor.sourceforge.net/?q=ru/node/4" target="_blank
-
zamolot
Member
- Звідки: Київ
Малярный скотч наклеить на стекло сканера 

-
MaG!STeR
Member
- Звідки: Vancouver, Canada
siruf
Спасибо, нашел.
Правда, уже по-своему решил вопрос. Сохранил каждую страницу в TIF, потом в фотошопе скриптом обрезал сверху каждое изображение, все сохранил и снова прогнал через Finereader.
Спасибо, нашел.
Правда, уже по-своему решил вопрос. Сохранил каждую страницу в TIF, потом в фотошопе скриптом обрезал сверху каждое изображение, все сохранил и снова прогнал через Finereader.
