Список форумов
|
Добавить сообщение
|
Правила
| 01.12.2024, воскресенье, 09:54:32
Ответ на сообщение в форуме
"Проблемы OCR и электронных библиотек"
:
Обязательно заполните поле:
Текст сообщения
Обязательно заполните поле:
Ваше имя
Ваше имя:
Город:
Е-Маil:
Сайт:
> [237. Gen]. > > [236. Сергей Сотников]. > > > [233. Gen]. > > > > > Подскажите программку/утилитку/скрипт чтоб убрать "жесткие" переводы строк из книг скачанных из lib.ru? > > > > ClearTXT (
http://www.gribuser.ru/freeware/cleartxt/index.shtml
) > > Мощная программа. Вот описание из хелпа: > > > > ----------------------------------------------------- > > Программа преобразует текстовые файлы в HTML. Параграфы, заголовки, эпиграфы и прочие элементы документа выявляются и сохраняются в виде форматирования HTML. Так же в программу встроен ╚Reader╩ со всеми необходимыми функциями. > > Программа способна распознать практически любой текст, начиная от созданного в ╚лексиконе╩ и заканчивая псевдо-html из библиотеки Мошкова (с опорой на теги и вместо абзацев). > > Широко понятная аналогия ╚автоформат╩ в MS Word. Разница (огромная) в качестве распознавания и возможностях управления процессом. > > Если Вы хоть раз сталкивались с задачей переформатирования текстовых файлов, Вы уже знаете, насколько это непросто. Эта программа оправдает ваши самые смелые ожидания и сделает этот процесс если не элементарным, то максимально производительным и удобным как для End-Usera, так и для пользователя с особыми предпочтениями. > > Reader позволяет делать заметки, закладки, форматировать весь документ под ваши предпочтения (например, сделать зеленый текст на черном фоне с шрифтом Verdana 14 пунктов) и многое другое. Все изменения (например, заметки) сохраняются и доступны в любом Web Browser-е. > > Программа включает все операции, необходимые при работе с e-Book. Большинство электронных книг на русском существуют в виде текстовых файлов, с помощью этой программы Вы можете подготовить электронную книгу к чтению, настроить ее внешний вид в соответствии с вашими предпочтениями и комфортно прочитать ее. > > ----------------------------------------------------- > > Вот оно! Теперь с помощью дикой последовательностьи "txt c lib.ru" -> "ClearTxt: txt to Html" -> "convert.exe: сделать разбивку на слога в html" -> "MS Word: html to doc" -> "ReaderWorks: doc to lit" наконец то получил читабельный ebook в lit формате. > Если не использовать Word, а пытаться конвертнуть html в lit сразу - в lite кракозябры вместо киррилицы. > > Но все же нсть одна проблема. Сделанные подобным образом книги читаются отлично yf notebookе, но не на moem PDA (Pocket PC, Dell Axim). Вместо букв - квадратики. > > Очевидно, что проблема со шрифтами. Другие книги, тоже сделанные RaederWorks, но немной, читаются отлично и на Notebook и на PDA. Их шрифт другой, и не такой крупный. > Вопрос: можно ли узнать имена шрифтов оспользованных в lite? > Можно ли их заменить? При генерации lita ReaderWorks'ом я не нашел никаких настроек связанных со шрифтами. > > Thanks, > Gen
Сортировать форумы по возрастанию даты публикации?
(Использовать эту опцию не рекомендуется)