Список форумов
|
Добавить сообщение
|
Правила
| 01.12.2024, воскресенье, 04:06:27
Ответ на сообщение в форуме
"Проблемы OCR и электронных библиотек"
:
Обязательно заполните поле:
Ваше имя
Обязательно заполните поле:
Текст сообщения
Ваше имя:
Город:
Е-Маil:
Сайт:
> [140. Zmiy]. > > [139. Вячеслав Сачков]. > > > > Может быть, я тебя неправильно понял, но общий принцип борьбы с неправильным разбиением на абзацы такой. В FP6 есть опция "Разрыв строк между абзацами". Имеет смысл пробовать с ней и без нее и сравнивать. Я попробовал. Если гнать сразу в дос, в какой-нибудь нафигатор, точно сильно лучше - с ликвидацией ненужных пустых строк по только что описанной здесь методике. В виндовозе не пробовал, поэтому не скажу. Но, наверно, помогает. > > Возможно и не понял... --------------;-) > > ФР5/6 при сохранении в ТХТ с "разрывом строк между абзацами" вставляет эти "разрывы" (пустые строки) аналогично - неправильно - после своего же, неправильно определенного, конца абзаца (перевода строки)... > > Label_l40 : > Если захочется поэкспериментировать, то скачай мои файлы, что я предлагал, и опиши методику сохранения текста из ФР5/6 в куда-нибудь и обработки его так, чтобы получился вариант test4.tx1, где ФР4 абсолютно точно воспроизвел разбиение на абзацы, выделив их тремя пробелами и при этом они полностью совпадают с абзацами из TIFFов...
Сортировать форумы по возрастанию даты публикации?
(Использовать эту опцию не рекомендуется)