Convert PDF -> DOC

Jedd · Post by **Jedd** » 25 Mar 2003 05:54

Ecть некое количество книг (на английском) в PDF формате в хорошем качестве и не очень. Много картинок и графических вставок, которые текст обтекает. Текст не всегда черный, иногда серый и желтый. Фонты - разнообразные. Вобщем не халява.
Интересно, можно ли это добро конвертировать в dос файл с текстом и картинками, никто не встречался?

Shin · Post by **Shin** » 25 Mar 2003 08:33

Похоже на то, что там просто нет текста, одни картинки с нарисованным текстом.
Конвертировать можно попробовать конвертерами типа pdf2rtf или pdf2html, но чтобы получить текст, боюсь, придется воспользоваться OCR.

Jedd · Post by **Jedd** » 25 Mar 2003 21:09

pdf2html делает просто кучу картинок с худшим качеством и большим размером.

OCR - это text recognition? Какие-нибудь доступные программы есть для этого?

Shin · Post by **Shin** » 26 Mar 2003 17:39

Jedd wrote:pdf2html делает просто кучу картинок с худшим качеством и большим размером.
OCR - это text recognition? Какие-нибудь доступные программы есть для этого?

Да, это распознавалка. Одна из лучших - FineReader, но она небесплатная и имеет очень хорошую защиту

В комплекте к любому сканеру обычно идет простенький OCR, можете попробовать. Для английского языка они работают обычно неплохо.