aleatorius: (stravinsky)
aleatorius ([personal profile] aleatorius) wrote2016-07-27 05:17 pm

гипертекст

есть ли такие гипертекстовые игрушки, типа создаешь свою базу данных, например разносортную коллекцию научных статей каких, и каждой статье соответствуют какие то ключевые слова, плюс веса, плюс веса авторам, котыорые сам задаешь,

далее сетка ключевых слов должна как нибудь красиво визуализироваться, т.е. по ней можно ходить

было бы интересно если можно сделать какого робота с выходом в гугл, т.е. допустим на две статьи ссылаются в какой третей или ссылаются в рамках какого то проекта или отчета где то в интернете,

и это добавляет как ключевых слов так и связности, плюс расширяет саму базу данных.
Т.е. робот на какую то глубину автоматически апгредит базу данных -- и ты потом сам должен верифицировать изменения

Плюс возможность проекции -- типа проецируешь на некое ключевое слово, основное ключевое слово как заголовок и увязки с весом чуть меньшим -- подзаголовки.

[identity profile] pascendi.livejournal.com 2016-07-27 08:14 pm (UTC)(link)
Погуглите "кластеризация текстов" и "автоматическая индексация текстов", много интересного узнаете.

Вообще-то то, что Вы описываете -- это, если не прошлый век, то прошлое десятилетие.
Edited 2016-07-27 20:14 (UTC)

[identity profile] cass1an.livejournal.com 2016-07-27 08:18 pm (UTC)(link)
Есть такая штука Qiqqa, там есть что-то от этой функциональности вроде (expedition кажется называется). Есть Менделей, там тоже может быть. Вообще уже технологически возможны суперкрутые научные колотушки, но 1.консерватизм потенциальных пользователей 2.хреновая открытость баз (очень хорошо бы иметь полнотекстовой доступ, а низя) 3.злые происки врагов. А жаль, золотые годы пропадают, скоро и с такой штукой будет не справиться с fire hose тугой струи литературы.

В принципе я даже примерно думал, с какого конца за такую штуку можно браться в рамках одной области. Как ее сделать общенаучную - вообще хз. Даже задача идентификации авторов не решена нормально, по пять разных идентификаторов получается иметь. Вообще был бы суперстартап, но и трудности ожидают, какие Маску не снились. Причем, как уже заметили, не технические - алгоритмы даже довольно простые бы работали на ура, а именно "есть 10 гб авторов, отличить геолога Ли Си Цына из Гуанчжоу от биолога Ли Си Цина из Ханчжоу, если это один и тот же человек".
Edited 2016-07-27 20:21 (UTC)