ВходНаше всё Теги codebook 无线电组件 Поиск Опросы Закон Четверг
28 марта
966658 Топик полностью
fk0, легенда (24.12.2019 02:48, просмотров: 265) ответил MBedder на fb2 маст дай, пдф форева!
Проблема pdf в том, что часто его форматируют в широкую колонку и при чтении на мобильнике или буковки очень маленькие, или читать повернув на 90 градусов. Ну и возить пальцем тоже неудобно. Все длинные книжки удобнее в fb2 или html, где телефон может переформатировать текст под ширину экрана и пользовательский шрифт (опять же типичный Courier, например, хорош на бумаге, но не на дисплее, где обычно тёмный фон, белые буквы и нужны другие шрифты). Выдрать же текст из pdf и вывести произвольным шрифтом не всегда возможно: в postscript (и pdf) кодировка шрифта может оказаться вообще произвольной, какой попало (не одной из стандартных -- будут закодированы последовательно только используемые буквы). И текст может идти не последовательно, а быть разбросанным по всей странице с привязкой к координатам на листе. И из этого всего выделить абзацы -- задача для ИИ и машинного обучения. PDF хорош для технищенской литературы, просматриваемой с компьютера или печатаемой на бумагу. Потом ещё это относится к PDF/A, а обычный PDF может и вовсе шрифтов не содержать.
[ZX]