(no subject)
Jan. 26th, 2017 06:34 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
а есть ли какой эффективный способ экстракции аннотаций из архива пдф файлов, ну дабы не кликать по всем и не искать аннотации индивидуально?
ну и чтобы был некий мэп к исходному месту (статья и страница)
пропробовал qiqqa, что то не сделала ничего путного
ну и чтобы был некий мэп к исходному месту (статья и страница)
пропробовал qiqqa, что то не сделала ничего путного
no subject
Date: 2017-01-26 06:19 pm (UTC)no subject
Date: 2017-01-26 07:40 pm (UTC)Если как имидж -- то только распознаванием.
Можно прогнать пакетом через FineReader, а дальше работать уже с текстом.
Если статьи на английском, то есть еще куча инструментов:
https://www.sumnotes.net
https://www.pdf-online.com/osa/extract.aspx?o=annots
http://remembereverything.org/manage-pdf-highlights-annotations/ (описание того, как можно это делать)
http://unix.stackexchange.com/questions/31521/how-to-extract-annotations-from-pdf-files
http://www.pdfhighlights.com
http://zotfile.com
Сразу говорю: мопед не мой, ни разу не пробовал.