Ecть некое количество книг (на английском) в PDF формате в хорошем качестве и не очень. Много картинок и графических вставок, которые текст обтекает. Текст не всегда черный, иногда серый и желтый. Фонты - разнообразные. Вобщем не халява.
Интересно, можно ли это добро конвертировать в dос файл с текстом и картинками, никто не встречался?
Convert PDF -> DOC
-
- Уже с Приветом
- Posts: 3413
- Joined: 06 Nov 2000 10:01
- Location: MA
Convert PDF -> DOC
You do not have the required permissions to view the files attached to this post.
-
- Уже с Приветом
- Posts: 5738
- Joined: 04 Dec 2000 10:01
- Location: MN -> Moscow -> Thailand
-
- Уже с Приветом
- Posts: 3413
- Joined: 06 Nov 2000 10:01
- Location: MA
-
- Уже с Приветом
- Posts: 5738
- Joined: 04 Dec 2000 10:01
- Location: MN -> Moscow -> Thailand
Jedd wrote:pdf2html делает просто кучу картинок с худшим качеством и большим размером.![]()
OCR - это text recognition? Какие-нибудь доступные программы есть для этого?
Да, это распознавалка. Одна из лучших - FineReader, но она небесплатная и имеет очень хорошую защиту

В комплекте к любому сканеру обычно идет простенький OCR, можете попробовать. Для английского языка они работают обычно неплохо.
Настоящий хомяк в своей жизни должен сделать три вещи: пожрать, поспать и сдохнуть.