ВходНаше всё Теги codebook 无线电组件 Поиск Опросы Закон Четверг
18 сентября
1542734 Топик полностью
CS! (Сегодня, 07:13, просмотров: 16) ответил Adept на в качестве самообразования и удовлетворения любопытства, - чем не нравится файнридер? - В "доисторическую" эпоху без ИИ - был, если не ошибаюсь, лучшей системой OCR (и по разным оценкам, и по моему мнению), но последний раз пользовался им лет 10 назад. Конечно очень многое поменялось за это время, кажется ИИ, действительно должен без проблем распознавать (раз уж онлайн переводы "со слуха" работают в реалтайме почти безупречно, то эта уж задача должны быть
Да, в общем-то ничем особым. Когда-то очень давно пользовался им пару раз. Просто, мне казалось, что должны быть какие-то более интересные решения на сегодняшний день, и раз уж нейросетки хреново справляются с распознованием нужных мне сканов, то чего ждать устаревших (предположительно) на сегодня технологий. Тем более, ещё и работающую и безопасную версию надо найти - а безопасность кто гарантирует? Хорошие вредоносы сегодня и виртуалки и песочницы разных рассолов обходить 

умеют... В моём понимании, если OCR работает под нейросеткой, которая будет при распозновании текста будет следовать некоторым заданным пользователем параметрам, подробно описывающим содержание (язык, тематика, использованные фонты, расположение картинок (раз ему так сложно самому понять, что в каких-то местах нет текста с заданными фонтами, и лучше это не пытаться переводить), можно добиться лучших результатов преобразования в текстовый документ. Видимо, я переоценивал прогресс в этом направлении. Самому промты программировать, разбираться с API не хочется пока начинать, хотя стал было и в эту сторону посматривать. На гитхабе кое-что нашёл, но там тоже допиливать и прикручивать много чего нужно, с неизвестным результатом


Как-то тут недавно уже обжёгся - нужно было софтины полеченные поставить на отдельный ноут, чтобы не париться насчёт наличия в них вирусов, проверить их работу на железе, выбрать из рабочих наиболее подходящую. Так как софтины разные были, x32 и x64, пришлось две системы ставить. Думал, потрачу на всё про всё день-другой, а в итоге и за неделю не вышло всё намеченное установить. На третий день, после n-ых переустановок виндов, настроек и накатывания минимума необходимого инструментария, стал пользоваться клонированием разделов. И всё равно каждый раз какие-то новые спец. эффекты проявлялись при установке, пропатчивании и накатывании эмуляторов USB-ключей. Добиться одного из первых результатов, когда почти все софтины работали совместно, мне так и не удалось. Лучше бы сразу отступился от программы "максимум" и оставил всё, как есть - результат был даже лучше итогового. Вот я и подумал, что опять чем-то не тем занимаюсь, и решил обратиться к сообществу за советом. Дали по рукам - спасибо!)

Но на самом деле, я где-то в сети встречал выложенный кем-то документ - перевод на русский язык сканированной документации, автор хвалил использованную им связку LLM c OCR, как легко и быстро всё получилось - конкретики не помню, к сожалению, но дока смотрелась прилично. Поспрошал сами LLM-ы, получил неоднозначные рекомендации, в основном, тоже - идти на йух или около того).