Список форумов
|
Добавить сообщение
|
Правила
| 30.11.2024, суббота, 23:46:41
Ответ на сообщение в форуме
"Проблемы OCR и электронных библиотек"
:
Обязательно заполните поле:
Текст сообщения
Обязательно заполните поле:
Ваше имя
Ваше имя:
Город:
Е-Маil:
Сайт:
> [105. InFAiR]. > > А книги не вычитываются? Все програмно происходит? Интересно сколько ошибок на разворот? Или их вообще нет :))) > > Книги не вычитываются. > Почти вся обработка производится программно. > Некоторые брошюры и глазами прочитать трудно. > В таких изданиях максимальная ошибка 70,5%. > Большинство книг удовлетворительного качества, > в них для текстовой части ошибки составляют до 0,002%. > Есть книги до 900 стр. без единой ошибки, но это исключение. > В среднем (на 1 тыс. книг) ошибка - 0,0025%. > Это, конечно больше, чем норма РГБ (0,0001%) - > по стандарту допускается 1 ошибка на 10 тыс. слов, > но на качество поиска это почти не влияет: > в среднем (на 100 книг) - 99,99% для обычного поиска; > 122% для вероятностного (fuzzy) поиска, > за счет снижения релевантности на 20-25%.
Сортировать форумы по возрастанию даты публикации?
(Использовать эту опцию не рекомендуется)