aleatorius: (stravinsky)
aleatorius ([personal profile] aleatorius) wrote2017-01-26 06:34 pm

(no subject)

а есть ли какой эффективный способ экстракции аннотаций из архива пдф файлов, ну дабы не кликать по всем и не искать аннотации индивидуально?

ну и чтобы был некий мэп к исходному месту (статья и страница)

пропробовал qiqqa, что то не сделала ничего путного

[identity profile] corey01.livejournal.com 2017-01-26 06:19 pm (UTC)(link)
у меня последний ноут как-то это делает, даже может помещать в список литературы. до этого пробовал mendeley но без особого успеха

[identity profile] pascendi.livejournal.com 2017-01-26 07:40 pm (UTC)(link)
Зависит от того, как сохранен pdf.
Если как имидж -- то только распознаванием.

Можно прогнать пакетом через FineReader, а дальше работать уже с текстом.

Если статьи на английском, то есть еще куча инструментов:
https://www.sumnotes.net
https://www.pdf-online.com/osa/extract.aspx?o=annots
http://remembereverything.org/manage-pdf-highlights-annotations/ (описание того, как можно это делать)
http://unix.stackexchange.com/questions/31521/how-to-extract-annotations-from-pdf-files
http://www.pdfhighlights.com
http://zotfile.com

Сразу говорю: мопед не мой, ни разу не пробовал.