Список форумов |  Добавить сообщение |  Правила |  01.12.2024, воскресенье, 13:54:12
СПИСОК ФОРУМОВ
01.12.2024
04:27 Главная гостевая книга библиотеки(3694)
24.11.2024
16:42 "Разыскиваются книжки", доска объявлений(15475)
20.11.2024
11:47 Обо всем - мнения(3131)
07:16 Русские впечатления о заграничной жизни(9431)
01.10.2024
13:10 Проблемы OCR и электронных библиотек(1967)
09.09.2024
04:35 Книжки, которые скоро будут выложены(47)
06.05.2024
02:06 О возвышенной поэзии(1568)
02.02.2024
15:33 Книжки, которые стоит прочитать(5187)
12.11.2023
00:25 Мнения читателей о дизайне библиотеки(1478)
Lib.Ru

Проблемы OCR и электронных библиотек
Тема форума: В этом форуме обсуждаются общие проблемы связанные с поддержкой электронных библиотек и сканированием книг.

А так же обсуждение статьи Вадима Ершова "О коллективных сайтах"

Отсортировано по [убыванию] [возрастанию]   

СООБЩЕНИЯ ЗА 03.09.2003
331. Павел, Самара (afpavel@yandex.ru) 22:05:17 [ответить]
      Мужики, возникла проблема! Помоги кто может!
      Установил Fine Reader 6, несколько месяцев работало всё нормально, но потом почему то, полетела функция сохранения результатов сканирования, при попытке сохранить отсканированный текст в Worde или в буфере обмена программа выдает внутреннюю програмную ошибку и пишет: D:\Fine Reader6\.\FineObjects\Inc\Errors.h, 150. Такого адреса не существует, программа и дистрибутив находятся на диске C:\. Пробовал переустанавливать,чистил реестр, удалял всё связанное с OCR, вновь переустанавливал - ничего не помогает. Может кто-нибудь знает в чём дело, буду очень признателен.


СООБЩЕНИЯ ЗА 04.09.2003
332. Zmiy, Минск (zmiy@inbox.ru) 12:28:02 [ответить]
     
      Информация :
     
      Вышел FineReader 7.0 : http://www.abbyy.ru/press_release.asp?param=28667>http://www.abbyy.ru/press_release.asp?param=28667
     
      Скачал англ.триал, установил, проверил, докладаю :
     
      1) доп.языки скачиваются с интернета
      2) англ.версия не сохраняет результаты на рус.яз. (написано даже в Helpе) - это типа защита... ;)
      3) по распознаванию - объективно не улучшилась, субъективно улучшилась из-за того, что там где ФР5/6 показывал неуверенности типа "неуверенно распознанные символы", то ФР7 уже не показывает...
      Судя по всему "качество" они улучшили как раз за счет того, что не показывают некоторые "неуверенности"...
      Нужно проверить качество на очень плохо отсканированном тексте...
      4) по сохранению оформления - не улучшилось - как ФР5/6 неправильно определял абзацы, так и ФР7 неправильно определяет...
      Я надеялся что в ФР7 они над этим поработают и сделают так как было в ФР4, где оформление правильно воссоздается (по крайней мере разбиение на абзацы), но оказалось, что я размечтался...
     
      Проверка производилась по тем же тестовым TIFFам - http://zpdd.chat.ru/files/test-tif.rar>http://zpdd.chat.ru/files/test-tif.rar
      Сравнение оформления у ФР4/5/6 - http://zpdd.chat.ru/files/test-txt.rar>http://zpdd.chat.ru/files/test-txt.rar
     
      Вывод : Можно переходить на ФР7 !
     
      P.S. Кто-нибудь - также протестируйте ФР7 и скажите результаты ваших тестов...


333. PDF-Library, Augsburg, Germany (info@imwerden.de) 14:45:29 [ответить]
      > 332. Zmiy.
      > 2) англ.версия не сохраняет результаты на рус.яз. (написано даже в Helpе) - это типа защита... ;)
     
      Привет, Змиюга!
     
      Это как так понимать??? Я работаю под немецким Windows, где русская версия FR никогда не идет, даже под Win-ХР. Значит ли это, что теперь я не могу либо Win, либо FR-7 использовать?


334. Zmiy, Минск (zmiy@inbox.ru) 17:05:11 [ответить]
      > 333. PDF-Library.
      > > 332. Zmiy.
      > > 2) англ.версия не сохраняет результаты на рус.яз. (написано даже в Helpе) - это типа защита... ;)
      >
      > Привет, Змиюга!
      >
      > Это как так понимать??? Я работаю под немецким Windows, где русская версия FR никогда не идет, даже под Win-ХР. Значит ли это, что теперь я не могу либо Win, либо FR-7 использовать?
     
      FR7 - Справка - Справка - Активация -
     
     
      Компания ABBYY принимает меры по борьбе с компьютерным пиратством и защите прав на интеллектуальную собственность. Пиратство причиняет ущерб не только производителям программного обеспечения, но и конечным пользователям. Приобретая лицензионные продукты, пользователи получают программные продукты без каких-либо изменений, сделанных третьими лицами, в то время как пиратские продукты не могут гарантировать этого.
     

     
      . . .
     
     
      В зависимости от версии продукта и территории его распространения, возможны следующие ограничения по функциональности:
     
      Невозможность сохранения и печати распознанного текста на языках с кириллическим алфавитом (ABBYY FineReader 7.0 Professional Edition);
      Невозможность сохранения и печати распознанного текста на всех поддерживаемых языках (ABBYY FineReader 7.0 Professional Edition);
      Версия ABBYY FineReader 7.0 Corporate Edition без активации не работает.
     


335. KpucmuHa, Mekcuko (crisarb@yahoo.com) 20:56:35 [ответить]
      Hola


336. Илья, Таллин 22:03:33 [ответить]
      > > 2) англ.версия не сохраняет результаты на рус.яз. (написано даже в Helpе) - это типа защита... ;)
     
      Вот мерзавцы. Редкостные. Головная контора в Москве и нет русского языка в программе! К черту такой файнрыдр.
      Буду пользоваться 4-м или поиу аналоги.


СООБЩЕНИЯ ЗА 05.09.2003
337. Zmiy, Минск (zmiy@inbox.ru) 14:18:12 [ответить]
      > 336. Илья.
      > >> 2) англ.версия не сохраняет результаты на рус.яз. (написано даже в Helpе) - это типа защита... ;)
      >
      > Вот мерзавцы. Редкостные. Головная контора в Москве и нет русского языка в программе! К черту такой файнрыдр.
      > Буду пользоваться 4-м или поиу аналоги.
     
      Ну не надо уж так... ;)
      Нормальная (нетриальная) версия будет работать как нужно!
      А тем более достойных аналогов у ФР нету! Лучше уж в ФР мучаться, чем чем-то похуже... ;)
     
      Я вот продолжил тестирование ФР7.
     
      Взял ну очень плохо отсканированный TIFF (светлый - с недостатком яркости)...
      Распознал в ФР6 и ФР7 и не заметил, чтобы качество распознавания было другим! И там и там одинаковые ошибки! Где в ФР6 не распознавало, там же и ФР7 не распознает...
      Конечно, как я уже говорил ниже :), за счет того что некоторые "неуверенности" теперь не показываются, то да - качество получше... Но по-моему это чисто надуманное улучшение качества. Раньше, к примеру, все без исключения "неуверенности" показывались, а теперь достаточно во внутреннем словаре ФР найти неуверенное слово и сделать вывод, что неуверенности нет - слово же "человеческое" распозналось;). Не говоря уж о том, что в ФР5/6 "неуверенными" были даже пробелы!
      Поэтому те, кто после распознавания сразу сохранял текст и вычитывал в других редакторах, - для тех ничего не улучшится!
      Те же, кто после распознавания, проверял текст в самом ФР, тому конечно улучшение будет заметно! Скорость такой проверки будет повыше...
     
      Забавно другое - в каждой новой версии разработчики уверяют нас, что качество улучшилось на ...дцать процентов... Это если сложить все эти проценты получиться ж ох какая сумма - процентов 100 относительно, например, ФР4. ;) Но такого уж глобального улучшения, по крайней мере, я Н Е В И Ж У !!!
      Какие же это "внутренние тесты компании" проходит ФР, если в реальной работе больших улучшений не заметно...
     
      P.S. Я тут, конечно, не рассматриваю новинки в ФР6/7 типа распознавания PDF... Я тестировал только те функции, которые применяются при сканировании книг!


СООБЩЕНИЯ ЗА 07.09.2003
338. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 01:25:30 [ответить]
      Кста, а как быстро она пдф обрабатывает? (прошу указать притом частоту процессора и размер оперативки). Приблизительно, конечно.


СООБЩЕНИЯ ЗА 08.09.2003
339. Bowline, Москва (bowline@mail.ru) 07:32:03 [ответить]
      А кто-нибудь не знает, где Файн ридер этот взять? А то я что-то не найду...


340. Zmiy, Минск (zmiy@inbox.ru) 10:09:39 [ответить]
      > 339. Bowline.
      > А кто-нибудь не знает, где Файн ридер этот взять? А то я что-то не найду...
     
      www . abbyyusa . com в downloadax... Но это бесполезный trial (не качай зазря)...


СООБЩЕНИЯ ЗА 09.09.2003
341. п я я я п╟я , п я я п╟п╫п╟ (nurshat@ok.kz) 14:20:48 [ответить]
      п я п╬я я п©п╬п╪п╬я я .
      п я п╬ п╪п╬п╤п╣я п©п╬п╢я п╨п╟п╥п╟я я пЁп╢п╣ п╪п╬п╤п╫п╬ п╫п╟п╧я пё пЁя п╟я пёя п╣я п╨пёп╧ пёп╫я п╣я я п╣п╧я п╢п╩я п п╢п╪пёп╫пёя я я пёя п╬п╡п╟п╫пёпё Informix-я п╟, пё п╨п╟п╨ п╪п╬п╤п╫п╬ п╣пЁп╬ я я я п╟п╫п╬п╡пёя я . п п╬п╤п╣я я п╟п╧я п©п╬п╢я п╨п╟п╤п╣я п╣. п п╩я я я пёп╣ я я п╩п╨пё пЁп╢п╣ п╪п╬п╤п╫п╬ п╠я п╢п╣я п©п╬я пёя п╟я я .
     
      п п╟я п╟п╫п╣п╣ п╠п╩п╟пЁп╬п╢п╟я п╣п╫


342. textshare, 15:33:10 [ответить]
      В пятницу купил лицензионный FineReader 7 Professional.
      У меня грустное впечатление: функциональных изменений я не усмотрел, только перешли от установки с ключевой дискетой на активизацию по сети или телефону с привязкой к железу компа.
     
      Ставишь программу, она выдает номер, который должен зависить от твоего железа. (В руководстве написано, что "небольшой" апгрейд его не изменит, а для нового компа нужна новая активация) Мне по телефону код активации выдали мгновенно. Причем с перерывом в час я FR поставил и на свой ноутбук, и без вопросов получил второй код активации (!). Интересно бы попробовать и в третий раз :-)
     
      Есть предварительное впечатление, что Змей прав, и они снизили уровень проверки и пометки неуверенно распознанных слов и знаков.
      FR, кажется, стал опасно самостоятелен в выборе вариантов: я 3-4 раза ловил его на том, что он при распознании заменил слово и даже его не пометил, как неуверенно распознанное.
     
      Устранен один маленький но неудобный баг (а может и не баг, а так,неосмотр) - изменение инструмента работы с изображением при переходе от страницы к странице. Например, если я прохожусь по всему пакету и чищу изображения от грязи, виньеток или колонтитулов, то каждый раз после переходп к изображению новой страницы приходилось заново выбирать ластик.
     
      Конец короткого абзаца по-прежнему в 20% случаев не определяется и переход к новой строки в конец не вставляется. Были еще какие-то впечатления, но всего не упомню, если интересно - спрашивайте.
     
      Общее впечатление: FR 7 - чисто маркетинговый ход, чтобы еще раз получить деньги с больших корпоративных клиентов за активацию в привязке к железу.


343. Den, 19:54:42 [ответить]
      > 340. Zmiy.
      > > 339. Bowline.
      > > А кто-нибудь не знает, где Файн ридер этот взять? А то я что-то не найду...
      >
      > www . abbyyusa . com в downloadax... Но это бесполезный trial (не качай зазря)...
     
      А кряк под этот триал найти невозможно? Через тот же гугль?


СООБЩЕНИЯ ЗА 12.09.2003
344. Григорий, Ярославль 15:17:20 [ответить]
      Касательно файнридера. Если речь идет о книгах, с их сложным языков и различными авторскими придумками, распознавать стоит не 6 и 7-м, а 5-м ФР. Он меньше придумывает. Совершенно согласен с textshare, в том, что трудней именно эти придумки отлавливать, которые ворд не считает за ошибки.


СООБЩЕНИЯ ЗА 13.09.2003
345. bmn, (bmn@lib.ru) 10:32:46 [ответить]
      > и 7-м, а 5-м ФР. Он меньше придумывает. Совершенно согласен с
      Не согласен. 5-й тоже придумывает преизрядно.


346. Bowline, Москва (bowline@mail.ru) 11:40:02 [ответить]
      > 343. Den.
      > > 340. Zmiy.
      > > > 339. Bowline.
      > > > А кто-нибудь не знает, где Файн ридер этот взять? А то я что-то не найду...
      > >
      > > www . abbyyusa . com в downloadax... Но это бесполезный trial (не качай зазря)...
      >
      > А кряк под этот триал найти невозможно? Через тот же гугль?
     
      А может есть где не-трайал?


СООБЩЕНИЯ ЗА 14.09.2003
347. Артман, Волгоград (artman@mail.ru) 01:24:54 [ответить]
      Меня 5-й очень редко подводил, триал есть с каждым сканером, а если нужен кряк, то пишите - вышлю.


348. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 02:16:03 [ответить]
      Есть в сети книги типа ван Спэнкерен, история американской литературы (http://www.russian.rpo.at/pdf/ch1_lit.pdf>http://www.russian.rpo.at/pdf/ch1_lit.pdf), сделанные в pdf. В txt они корректно не конвертятся. Конвертация сама по себе достаточно простая, по принципу: латинская а соответствует русской ф, s - ы и т.д. Проблема в том, что после такой конвертации остается штук 5 русских букв, не имеющих соответствий в латинском наборе. Они обозначаются точками, и остается догадываться, какие это буквы на самом деле. Есть идеи для решения такой закавыки?


СООБЩЕНИЯ ЗА 18.09.2003
349. зТЙЗПТЙК, сТПУМБЧМШ 13:04:27 [ответить]
      > 345. bmn.
      > > и 7-м, а 5-м ФР. Он меньше придумывает. Совершенно согласен с
      > Не согласен. 5-й тоже придумывает преизрядно.
      Там это можно частично отключить, в большей степени, чем в шестом.


СООБЩЕНИЯ ЗА 19.09.2003
350. Один из..., 13:19:42 [ответить]
      Защита FR7 вскрыта...


351. V.Yesaulov, Moskva (yes@zonus.ru) 13:32:38 [ответить]
      > 350. Один из....
      > Защита FR7 вскрыта...
     
      Плачет по вам ФБР. Горькими слезами! :)


СООБЩЕНИЯ ЗА 21.09.2003
352. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 03:08:53 [ответить]
      > 351. V.Yesaulov.
      > > 350. Один из....
      > > Защита FR7 вскрыта...
      >
      > Плачет по вам ФБР. Горькими слезами! :)
     
      Фиг с ней, с фыбырой, она за бугром и до нее нам никаких дел нету. Действительные проблемы я вижу в другом. Их две. Первая. Из-за того, что программы и приложения платные, для общества в целом больше убытков, чем прибыли. Вторая. Хороший кряк ФР, в частности, - очень даже большая редкость. А сам по себе кряк как таковой - дело совершенно обычные, которое у сотен тысяч наших соотечественников никаких эмоций и вопросов вообще не вызывает. Поскольку сообщение о том, что крякнут 7-й ФР, я вопринимаю как пустой звук.


СООБЩЕНИЯ ЗА 24.09.2003
353. Zmiy, Минск (zmiy@inbox.ru) 16:18:06 [ответить]
      И опять о наших бар-ранах (о ФР7):
     
      Может этот ФР7 и распознает лучше на каких-то "внутренних тестах ABBYY" или стал лучше в каких-то применениях на PDFах, но все-таки он хуже ФР5 по сохранению оформления.
      Замечено следующее: если в ФР5 при сохранении в Word обычно используется выравнивание по ширине, то в ФР6/7 разработчики почему-то намудрили (наверное от слова "мудаки") и в тех же местах идет выравнивание влево, что я считаю вообще нонсенсом в DOC. Особенно это заметно на диалогах. Так еще ж в ФР6/7 появилось заполнение пробелами именно из-за того, что нужно же как-то растянуть строку, раз уж выравнивание влево... Два пробела подряд в файлах DOC - это тоже маразм!
      Если в ФР5 на тех местах, где шла склейка абзацев, идет выравнивание влево, то такие склейки легко находятся полуавтоматически, например, в Wordе. То на ФР6/7 эти же склейки не отличишь от нормальных ситуаций...
      У меня написана программа, которая из сохраненного в ФР специальным образом RTF файла, путем анализа этих самых выравниваний, делает текстовый файл с исправлениями склееных/разделенных абзацев. Так вот на ФР5 программа делает потрясающие результаты - в большинстве случаев после нее нет дополнительной правки абзацев. В то время как после ФР6/7 из-за таких заумностей, как выравнивание влево в нормальных абзацах, - делается много доисправлений...
     
      ...и я вернулся на ФР5.
     
      P.S. условный (для V.Yesaulovа): Если какая-то программа некорректно выполняет заявленные функции, то будете ли Вы покупать такую программу?


СООБЩЕНИЯ ЗА 26.09.2003
354. Zmiy, Минск (zmiy@inbox.ru) 01:36:14 [ответить]
      Всем! Всем! Всем!
     
      Вот же блин невнимательность!
      Показали мне в ФР7 возможность сохранения текста как было в ФР4 - с форматированием пробелами...
      Опции-Распознование-Тип страницы-Форматированный пробелами текст, но нужно ставить эту опцию перед распознованием... Так, что интересно - эта опция есть и в ФР5 и в ФР6... А я Вам тут мозги пудрю, а Вы не можете указать на решение... --------------;-)
      При таком варианте нет проблем с абзацами, которые остались при сохранении в вордовские форматы... Так что учтите, что если Вы делаете текст только в Ворде и не исправите ошибок выравнивания после ФР5/6/7, то при сохранении Вашего вордовского файла в TXT будет склейка/разделение абзацев!!!
     
      P.S. Ушел писать прогу преобразования сохраненного из ФР текста форматированного пробелами в правильный(!) текст, готовый к вставке в Ворд...


355. Zmiy, Минск (zmiy@inbox.ru) 12:19:59 [ответить]
     
      Вопрос на засыпку :
     
      Как в ФР найти символ "конец абзаца"???
      (не путайте с символом разрыв строки!)


356. Sokolov, N.Novgorod (sokolov_av@pochtamt.ru) 20:52:13 [ответить]
      > 355. Zmiy.
     
      > Вопрос на засыпку :
      >
      > Как в ФР найти символ "конец абзаца"???
      > (не путайте с символом разрыв строки!)
      А что - в 7-ом уже есть подержка подобных замен? Или имеется в виду копание в самих frf-файлах?


357. Moris, Moscow 23:57:28 [ответить]
      Простите, но вроде как у вас не работает поисковик =( а без него я ваабще ничего найти не могу =(


СООБЩЕНИЯ ЗА 27.09.2003
358. Zmiy, Минск (zmiy@inbox.ru) 00:19:03 [ответить]
      > 356. Sokolov.
      > > 355. Zmiy.
      >
      > > Вопрос на засыпку :
      > >
      > > Как в ФР найти символ "конец абзаца"???
      > > (не путайте с символом разрыв строки!)
      > А что - в 7-ом уже есть подержка подобных замен? Или имеется в виду копание в самих frf-файлах?
     
      поиск работает в фр5-6-7, но только для "мягкого переноса" и "разрыва строки"...
      а я ищу как можно найти "конец абзаца"...
      никто не знает?
     
      frf не поизменяешь - в фр5-6-7 после таких изменений не открывается страница... видно там какие-то контрольные суммы...


359. Sokolov, N.Novgorod (sokolov_av@pochta.ru) 11:11:38 [ответить]
      > 358. Zmiy.
      > > 356. Sokolov.
      > > > 355. Zmiy.
      > поиск работает в фр5-6-7, но только для "мягкого переноса" и "разрыва строки"...
      > а я ищу как можно найти "конец абзаца"...
      > никто не знает?
      >
      > frf не поизменяешь - в фр5-6-7 после таких изменений не открывается страница... видно там какие-то контрольные суммы...
     
      Насчет контрольных сумм не уверен. Дело в том, что каждый фрейм (абзац) пишется в отдельный блок -- сначала следует текст (в FR5-7 в Unicode, по-моему), за ним -- описание форматирования, привязка и т.д. При копании нарушается, наверное, привязка к изображению. А вот насчет поиска конца абзаца -- при сохранении форматировании пробелами весь текст в файле пишется в один фрейм (по крайней мере, в 4-ом).


СООБЩЕНИЯ ЗА 28.09.2003
360. kvik, Архангельск (vickers@atnet.ru) 13:45:09 [ответить]
      > 17. Григорий.
      > > 15. Zmiy.
      > > Вопрос ко всем :
      > > Q: У кого какой сканер, его цена и скорость сканирования в час для разворота книжки обычного(самого распространенного) формата?
      >
      > Сейчас основные сканеры:
      > Mustek 12000 SP Plus (SCSI) скорость сканирования А4 (300дпи) примерно 30 сек. С учетом обратного хода - чуть больше разворота в минуту. Тк. медленный обратный ход. Зато недорого.
      > Acer 640S (SCSI) - проход - чуть быстрее, откат быстрый. Гасит лампу.
      >
      > Замечательны (из опробованных планшетников) старые Хьюлеты - 4c например. 15-20 сек сканирование 10 - обратный ход. Гасит лампу при обратном ходе - тоже плюс. Только не достать их теперь.
      >
      > Совершенно глупо использовать дорогие с высокой цветопередачей сканеры. Они перед каждый проходом греют и калибруют лампу.
      > Вывод - чем дешевле (проще) - тем лучше.
      > SCSI - быстрее чем USB. Правда, такой вывод только на основании личного опыта.
      >
      > > У меня Mustek 1200CU (USB). Цена до 70$. Скорость 200 стр. в час (100 разворотов).
      >
      > Быстро. Меняю представление о ЮСБ.
      >
      > > Я сканю и распознаю сразу, чтоб видеть ошибки распознавания и соответствующе корректировать яркость...
      >
      > Корректирую яркость только в начале сканирования и меняю только в случае, если вижу, что качество печати меняется. Распознаю пакетно. По ночам. Правда после выделения блоков - просматриваю. Особенно если стихи. Бывает такое запилит...
      >
      > > Как понимать Thick-as-a-brick "страницы плохо раскрываются"??? Уточни...
      > > Как понимать Thick-as-a-brick "И времени нет"??? --------------;-) Компьютер-то и так занят... (если он один...)


361. kvik, Архангельск (vickers@atnet.ru) 13:46:53 [ответить]
      Помогите найти драйвера для mustek 12000sp plus (scsi) под 98 windows


СООБЩЕНИЯ ЗА 29.09.2003
362. Zmiy, Минск (zmiy@inbox.ru) 10:27:25 [ответить]
      > 361. kvik.
      > Помогите найти драйвера для mustek 12000sp plus (scsi) под 98 windows
     
      Вот тут что-то есть, но больно старое :
      http://www.mustek.com.tw/Download/driv_scanr/europe/12000spplus.html>http://www.mustek.com.tw/Download/driv_scanr/europe/12000spplus.html
     
      Тогда попробуй это :
      http://deck.net.ru/drivers/scanner/Mustek/ScanExpress>http://deck.net.ru/drivers/scanner/Mustek/ScanExpress%2012000SP/
     
      Если нет, то пробуй тут : (только нужно иметь сер.номер сканера)
      http://www.mustek.de/eng_/html/treiber/scanner_scanexpress_scsi.htm>http://www.mustek.de/eng_/html/treiber/scanner_scanexpress_scsi.htm
     
      Или тут, но по-русски : (тоже нужно иметь сер.номер сканера)
      http://www.mustek.ru/products/12000sep.htm>http://www.mustek.ru/products/12000sep.htm
     
      Если нет, тогда пробуй подобрать работающий драйвер на похожий сканер (например, Mustek ScanExpress 1200 III SP) тут :
      http://www.nix.ru/drivers/scanner_mustek.html>http://www.nix.ru/drivers/scanner_mustek.html


СООБЩЕНИЯ ЗА 02.10.2003
364. В.Воблин, 14:31:08 [ответить]
      Господа, кто уже поработал с седьмой версией ФайнРидера: ваше мнение? Какие на самом деле улучшения вы заметили? (если вообще).
     
      И очень интересно, есть ли разноца между сканерами по скорости прохода одной страницы при прочих равных улоовиях, замерял ли кто-нибудь этот параметр и что получилось. Я пытался говорить на эту тему с продавцами спец.магазина и ничего от них не услышал толкового на эту тему.


365. леа, ариель (alkraftmakher@hotmail.com) 18:59:14 [ответить]
      Обратите внимание, что некоторые книги невозможно скачать, например, В.Набоков повесть "Другие берега" и несколько книг Рекса Стаута, начиная с "Убийство по правилам". Может быть найдете время исправить это досадное недоразумение, потому как возможности читать online в интернете у меня нет, возможно и у других читателей тоже. И, кстати, очень неудобно скачивать книги из вашей библиотеки, нужно ждать, пока раскроется файл, потом отправлять его в gzip, куда удобнее скачивать книги в OCR Aldebaran, а выбор там не такой большой как у вас. Пожалуйста, подумайте над тем, как можно было бы читателям с минимальными затратами времени скачивать книги. Всего доброго


СООБЩЕНИЯ ЗА 03.10.2003
366. Zmiy, Минск (zmiy@inbox.ru) 00:29:19 [ответить]
      Уф...
     
      CLTXT - ЧИСТКА И СКЛЕЙКА ТЕКСТА ПОСЛЕ FINEREADERА (ВЕР. 2.00)
     
      ОПИСАНИЕ
     
      Программа предназначена для автоматической чистки и склейки текста, форматированного пробелами и неубранными переносами слов, либо текста после распознования книги в FineReaderе.
      Выходной файл с расширением OUT представляет собой текст в кодировке DOS(ALT), в котором каждая строка - это абзац.
     
     
      ВЫПОЛНЯЕМЫЕ ФУНКЦИИ
     
      - распознование кодировок WIN и DOS(ALT);
      - преобразование в кодовую страницу DOS(ALT);
      - удаление форматирования пробелами;
      - склейка строк в один абзац (абзац = одна строка);
      - склейка страниц;
      - удаление мусора и номеров страниц;
      - коррекция слов с переносами (по русскому словарю MS Word; по текущему тексту; по запросу у пользователя);
      - выделение подстраничных сносок по символу '*' ;
      - коррекция пробелов и знаков препинания;
      - выделение глав, подглав и т.д. переводом строки.
     
     
      Скачать программу можно здесь: http://zmiy.da.ru>http://zmiy.da.ru
      Качаем, пробуем, критикуем...


367. Эмин, Баку (azeribooks@narod.ru) 09:22:25 [ответить]
      > 366. Zmiy.
      > Уф...
      >
      > CLTXT - ЧИСТКА И СКЛЕЙКА ТЕКСТА ПОСЛЕ FINEREADERА (ВЕР. 2.00)
     
      Zmiy, при исполнении программы Виндоуз выдает ошибку "cltxt.exe - обнаружена ошибка. Приложение будет закрыто. Приносим извинения за неудобства.Передайте Microsoft сведения об ошибке. Отправить отчет, НЕ ПЕРЕДАВАТЬ" Система у меня ХР. Что делать?


368. Эмин, Баку (azeribooks@narod.ru) 13:13:03 [ответить]
      После обработки текста FR6.0 и затем aftescan-ом переносы никогда не соединяются. Приходтся все вручную обрабатывать.
      Например в тексте было вот так: "исполь-зовать", после обработки получается "исполь зовать". Может кто знает, как сделать так, чтобы автоматически все слова с переносами соединялись, т.е в конечном счете выглядело бы так: "использовать"?


369. Zmiy, Минск (zmiy@inbox.ru) 13:55:06 [ответить]
      > 367. Эмин.
      > > 366. Zmiy.
      > > Уф...
      > >
      > > CLTXT - ЧИСТКА И СКЛЕЙКА ТЕКСТА ПОСЛЕ FINEREADERА (ВЕР. 2.00)
      >
      > Zmiy, при исполнении программы Виндоуз выдает ошибку "cltxt.exe - обнаружена ошибка. Приложение будет закрыто. Приносим извинения за неудобства.Передайте Microsoft сведения об ошибке. Отправить отчет, НЕ ПЕРЕДАВАТЬ" Система у меня ХР. Что делать?
     
      А readme.txt прочитал? См. раздел "Системные требования"...
      С Office XP (Word XP) программа не будет работать! При проверке слов на дефис/перенос используется вызов спелчекера Wordа. Но работает это только с Word 97/2000, т.к. MS поменяли в Word XP функцию вызова спеллчекера... Я ищу выход из этой ситуации...


370. Zmiy, Минск (zmiy@inbox.ru) 14:01:08 [ответить]
      > 368. Эмин.
      > После обработки текста FR6.0 и затем aftescan-ом переносы никогда не соединяются. Приходтся все вручную обрабатывать.
      > Например в тексте было вот так: "исполь-зовать", после обработки получается "исполь зовать". Может кто знает, как сделать так, чтобы автоматически все слова с переносами соединялись, т.е в конечном счете выглядело бы так: "использовать"?
     
      А кто сказал что должно быть "использовать"??? Вдруг в книге герой заикается и там так и написано - "исполь-зовать"? Так нельзя автоматически править!
      После правки текста AfterScan выводит результаты, чего он там направил, в таблицу. Не поленись и пройди по строчкам - проверь, что он направил... Это не так уж и долго...


СООБЩЕНИЯ ЗА 05.10.2003
371. Lexa, (lexahr@inbox.ru) 13:42:40 [ответить]
      > 342. textshare.
      > В пятницу купил лицензионный FineReader 7 Professional.
      > Есть предварительное впечатление, что Змей прав, и они снизили уровень проверки и пометки неуверенно распознанных слов и знаков.
      > FR, кажется, стал опасно самостоятелен в выборе вариантов: я 3-4 раза ловил его на том, что он при распознании заменил слово и даже его не пометил, как неуверенно распознанное.
      >
     
      Есть такое. Ещё он почему-то иногда не распознаёт явные переносы, т.е. переносы в словах, которые точно есть в словаре.
     
      > Устранен один маленький но неудобный баг (а может и не баг, а так,неосмотр) - изменение инструмента работы с изображением при переходе от страницы к странице. Например, если я прохожусь по всему пакету и чищу изображения от грязи, виньеток или колонтитулов, то каждый раз после переходп к изображению новой страницы приходилось заново выбирать ластик.
     
      Это было ещё в FR6. Причём, насколько я помню, в триал-версии этой возможности не было. (Или может эта возможность добавилась после установки SP2?)


372. Lexa, (lexahr@inbox.ru) 13:49:18 [ответить]
      > 364. В.Воблин.
      > Господа, кто уже поработал с седьмой версией ФайнРидера: ваше мнение? Какие на самом деле улучшения вы заметили? (если вообще).
     
      Единственное улучшение, которое я заметил - стал иногда включать одиночную цифру (например, в названии главы) в текстовый блок.
     
      > И очень интересно, есть ли разноца между сканерами по скорости прохода одной страницы при прочих равных улоовиях, замерял ли кто-нибудь этот параметр и что получилось. Я пытался говорить на эту тему с продавцами спец.магазина и ничего от них не услышал толкового на эту тему.
     
      Есть. На моём текущем (UMAX Astra 4500) и предыдущем (Acer ScanPrisa640U) цифры соответственно таковы (для ч/б или grayscale, 300dpi, размер сканируемой области 185мм/240мм): 250 разворотов в час и 110 разворотов в час.


373. Andrej, Ekaterinburg (tverjakov@mail.ru) 14:39:42 [ответить]
     
      Кстати, о скорости сканирования.
     
      На моем Mustek BearPow 1200 при использовании встроенного в Файнридер TWAIN-драйвера скорость сканирования одного разворота у ФР6 примерно в 1,5 раза больше, чем у ФР5 (примерно 22 и 35 секунд соответственно) - и скорость проходки больше, и, главное, меньше пауза между страницами.
     
      Подскажите, плиз, как с этим у ФР7, увеличилась ли скорость?


СООБЩЕНИЯ ЗА 07.10.2003
374. Леонид, Киев (mos777@ukr.net) 05:33:37 [ответить]
      Самый лучший сканер для сканирования книг, на мой взгляд, Fujitsu ScanSnap.
      Двухсторонний до 15 стр/мин., автоподатчик 50 листов, USB, 300 dpi, цветной, обратите внимание:
      поддержка форматов Минимум: A8 Максимум: A3. СКАНЕР СРАЗУ СКАНИРУЕТ ВPDF ФАЙЛ. Цена в Киеве 658$. Минус - нужно потрошить книги. Подробнее: http://www.pirit.com.ua/scanners/fujitsu/scansnap.htm>http://www.pirit.com.ua/scanners/fujitsu/scansnap.htm
      Кстати, если кто купит подобное очень, прошу написать отзыв mos777@ukr.net
      Для вычитки лучше программы Rutaplaj пока не встречал. Rutaplaj - программа перевода и
      проверки орфографии, интегрированная в WORD. Разработчик Украина, но русскоязычный текст проверяет вплоть до запятых. Может, кто осилит в итоге специальную программу-плагин, которая сможет автоматически, сканировать, распознавать,
      передавать в Word, проверять орфографию, сохранять в TXT или WORD-файл. Думаю, для грамотного программиста работа по плечу. Почему нужен txt, а не PDF? Лично я в последнее время книги не
      читаю, а слушаю с помощью программы синтезатора речи "НИКОЛАЙ". На сегодняшний день с модулями-словарями качество неплохое. По крайней мере, иногда забываюсь, что читает компьютер.
      Никакого там электронного голоса типа "Я РОБОТ". Конечно, ребенку не поставишь - ударения зачастую неправильные. Идеальным вариантом, было бы сохранять два формата, если присутствуют иллюстрации, txt и PDF. Я сканированием книг пока не занимался, но хочу начать. По этой причине прошу НАПИСАТЬ МНЕ ЛЮДЕЙ ИЗ КИЕВА И УКРАИНЫ, занимающиеся сканированием книг,
      для координации действий и обмена редкими электронными книгами в первую очередь интересуют о теме: Экономика, финансы, история, политика, психология, право,маркетинг,
      учебники ... Мои координаты mos777@ukr.net , Киев-222, а/я 226, тел.: (044) 547-24-07д Леонид


375. PDF-Library, Augsburg, Germany (info@imwerden.de) 13:27:36 [ответить]
      Сейчас ехал на работу и слушал по радио (немецкому) : открывается Франкфуртская международная книжная ярмарка. Главная страна в этом году: Россия. И далее интервью с русскими школьниками: Что вы читаете ? Ответ: Пушкина, Шиллера, Достоевского.
      Немецкие комментаторы ошеломлены: никто не назвал Стивена Кинга etc.


376. InFAiR, Уфа (infair@rusoil.net) 17:20:44 [ответить]
      Привет всем OCR-щикам и спецалистам по txt.
      Вопрос: никто из Вас не встречал программ
      лингвистического анализа текстов
      (количество слов, % ошибок,
      подсчет слов, синонимов
      составление словарей и т.п).
      Нужна программа,
      способная работать с 4-5 тыс. файлов
      общим объемом 5-6 GB в txt/dos
      Спасибо.


СООБЩЕНИЯ ЗА 09.10.2003
377. Zmiy, Минск (zmiy@inbox.ru) 00:04:02 [ответить]
      > 367. Эмин.
      > > 366. Zmiy.
      > > Уф...
      > >
      > > CLTXT - ЧИСТКА И СКЛЕЙКА ТЕКСТА ПОСЛЕ FINEREADERА (ВЕР. 2.00)
      >
      > Zmiy, при исполнении программы Виндоуз выдает ошибку "cltxt.exe - обнаружена ошибка. Приложение будет закрыто. Приносим извинения за неудобства.Передайте Microsoft сведения об ошибке. Отправить отчет, НЕ ПЕРЕДАВАТЬ" Система у меня ХР. Что делать?
     
      Эмин, скачай Crypt Edit Spell Checker:
     
      http://zpdd.chat.ru/files/spellset.exe>http://zpdd.chat.ru/files/spellset.exe (1160605)
     
      установи его и все будет работать и в XP...


378. Mikolaj, Bydgoszcz 00:51:04 [ответить]
      Czesc!!
      Ucze sie rosyjskiego, ale nie wiem za bardzo o co chodzi!


СООБЩЕНИЯ ЗА 10.10.2003
379. V.Voblin, 03:16:18 [ответить]
      > 372. Lexa.
      > > 364. В.Воблин.
      > > с седьмой версией ФайнРидера: ваше мнение?...
      > Единственное улучшение, которое я заметил - стал иногда включать одиночную цифру (например, в названии главы) в текстовый блок.
      >
      > > ...есть ли разница между сканерами по скорости прохода одной страницы...
      >
      > Есть. На моём текущем (UMAX Astra 4500) и предыдущем (Acer ScanPrisa640U) цифры соответственно таковы ...: 250 разворотов в час и 110 разворотов в час.
     
      Lexa, сердечное спасибо за обстоятельный ответ.
      Интересно, какой интерфейс был у обоих ушпомянутых сканеров. USB?
     
      Всем спасибо за обсуждение Файнридера-7. Печально. Я бы им накидал рацпредложений, частично и с готовыми решениями на уровне псевдокода. И, уверен, у многих OCR-щиков накопилось :)


380. Maks, (plforms@yandex.ru) 11:37:32 [ответить]
      Кто интересуется более читабельным форматом текста, смотрите
      этот сайт http://plforms.narod.ru>http://plforms.narod.ru


381. slava, москва (slavaaa@yandex.ru) 14:52:50 [ответить]
      Приветствую всех участников форума.


382. slava, москва (slavaaa@yandex.ru) 15:03:21 [ответить]
      хотелось бы обсудить некий набор минимальных или максимальных требований к эл. книгам в сети.
      С целью некой стандартизации.
      За многие годы сканирования у меня сложился свой подход к этому вопросу.
      Мои книги можно посмотреть у меня на сайте.
      В моем варианте есть недостатки, но главное для меня - это максимальное приближение к бумажному варианту.


СООБЩЕНИЯ ЗА 11.10.2003
383. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 01:21:53 [ответить]
      > 376. InFAiR.
      > Привет всем OCR-щикам и спецалистам по txt.
      > Вопрос: никто из Вас не встречал программ
      > лингвистического анализа текстов
      > (количество слов, % ошибок,
      > подсчет слов, синонимов
      > составление словарей и т.п).
      > Нужна программа,
      > способная работать с 4-5 тыс. файлов
      > общим объемом 5-6 GB в txt/dos
      > Спасибо.
     
      Соответствующие модульки, как общеизвестно, имеются в штатном наборе паскакаля и сей. Считают авторские листы. А по заложенному в них алгоритму желаемое сделать проще пареного. Смышленые восьмикласники делают с этими иодулями чудеса. Но если чайникам вроде Вас подобные большущие секреты выдавать, то программеры будут в голодных корчах мучиться, что не будет правильно и гуманно. Каюсь перед программерами посему.


384. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 01:34:38 [ответить]
      > 382. slava.
      > хотелось бы обсудить некий набор минимальных или максимальных требований к эл. книгам в сети.
      > С целью некой стандартизации.
      > За многие годы сканирования у меня сложился свой подход к этому вопросу.
      > Мои книги можно посмотреть у меня на сайте.
      > В моем варианте есть недостатки, но главное для меня - это максимальное приближение к бумажному варианту.
      Прекрасно. Изложите Ваши соображения для всех в обобщенном виде, тогда будет что обсуждать. Чувствую, внимательно следя за Вашими работами, что я Ваш единомышленник, но если слово изреченное есть ложь, то неизреченное слово содержит нуль информации.


СООБЩЕНИЯ ЗА 12.10.2003
385. Константин, Екатеринбург 16:22:40 [ответить]
      Кхе-кхе...Я вообщето понимаю что не по адресу но всетаки...жил у меня сидюк Creative, гудел как пылесос "Урал", и поколол на днях диск - самоучитель по англискому "Tell Me More" диск староват, ноеще вполне хорош. Вобщем дайте урлю где можно будет купить подобный софт, а то по ссылкам кликать замаешся, заранее благодарен.


Continue