Convert PDF -> DOC

Полезные советы, благоустройство и др.
User avatar
Jedd
Уже с Приветом
Posts: 3413
Joined: 06 Nov 2000 10:01
Location: MA

Convert PDF -> DOC

Post by Jedd »

Ecть некое количество книг (на английском) в PDF формате в хорошем качестве и не очень. Много картинок и графических вставок, которые текст обтекает. Текст не всегда черный, иногда серый и желтый. Фонты - разнообразные. Вобщем не халява.
Интересно, можно ли это добро конвертировать в dос файл с текстом и картинками, никто не встречался?
You do not have the required permissions to view the files attached to this post.
User avatar
Shin
Уже с Приветом
Posts: 5738
Joined: 04 Dec 2000 10:01
Location: MN -> Moscow -> Thailand

Post by Shin »

Похоже на то, что там просто нет текста, одни картинки с нарисованным текстом.
Конвертировать можно попробовать конвертерами типа pdf2rtf или pdf2html, но чтобы получить текст, боюсь, придется воспользоваться OCR.
Настоящий хомяк в своей жизни должен сделать три вещи: пожрать, поспать и сдохнуть.
User avatar
Jedd
Уже с Приветом
Posts: 3413
Joined: 06 Nov 2000 10:01
Location: MA

Post by Jedd »

pdf2html делает просто кучу картинок с худшим качеством и большим размером. :|
OCR - это text recognition? Какие-нибудь доступные программы есть для этого?
User avatar
Shin
Уже с Приветом
Posts: 5738
Joined: 04 Dec 2000 10:01
Location: MN -> Moscow -> Thailand

Post by Shin »

Jedd wrote:pdf2html делает просто кучу картинок с худшим качеством и большим размером. :|
OCR - это text recognition? Какие-нибудь доступные программы есть для этого?


Да, это распознавалка. Одна из лучших - FineReader, но она небесплатная и имеет очень хорошую защиту :)
В комплекте к любому сканеру обычно идет простенький OCR, можете попробовать. Для английского языка они работают обычно неплохо.
Настоящий хомяк в своей жизни должен сделать три вещи: пожрать, поспать и сдохнуть.

Return to “Прочее”