Previous Entry Share Next Entry
Записки Филипка 4. Автоматизация познания или еще одна проблема с «источниками»
Солнечно
dzeso

Н.П.Богданов-Бельский "Новая сказка"

Любой Филипок, вроде меня рано или поздно понимает два момента, относительно источников. Во-первых, объем знаний у человечества уже таков, что нечто по-настоящему новое встречается не часто. В основном в наши дни это происходит в естественных науках. В гумманитарных же все уже не раз придумано, многожды раз записано и обсуждено. И второе открытие, это то, что все прочесть ты не сможешь от слов «совсем» и «никогда», а уж усвоить — и подавно. И с этим надо как-то научиться жить. В принципе уже сейчас объем моей библиотеки превышает оставшееся мне время жизни и ее пополнение - процесс в чем-то патологический. Возможно таким образом я вымещаю осознание собственной смертности, а может это инстинкт хомяка, делающего запасы «на зиму». Но в неделю у меня, как правило, случается «библиотечный» день, когда моя виртуальная книжная полка пополняется на несколько десятков книг.

В работе с библиотекой сильно помогает полнотекстовый поиск. Хотя вот лично для меня, как для бывшего программиста, - загадка, отчего на базе операционки не сделают уже нормальный полнотекстовый поиск. По большому счету и отдельного софта-то нормального для подобного поиска нет, даже вроде бы в специализированных системах для работы с источниками, вроде “Papers”, это не поиск, а недоразумение из 70-х. А казалось бы, задача для третьего курса вуза. Ну хорошо, если нормальную систему поиска делать, то для пятого. Но почему-то такого поиска нет, а раз нет, то можно и тупо полнотекстовым перебором пользоваться. Ведь даже и в этом случае часто проще заново найти нужное место, чем сделать выписку, и потом искать в «выписках».

Но наука не стоит на месте, прочел интересную статью Дмитрия Ветрова о «латентной семантической модели». Коротко суть там в том, что поисковые алгоритмы начинают давать интересные побочные эффекты, которые, на мой взгляд, носят революционный характер, хотя и проходят почему-то фоном. В чем революционность? Пусть пока и примитивно, но описываемые алгоритмы позволяют производить смысловые операции над значениями слов. То есть, если прибавить "Путин" + "Россия" и из результата вычесть "Америка", то алгоритм выдаст "Обама". И это не "эксперты" систему научили, это она сама "поняла" на базе автоматического анализа большого массива текстов. Конечно, пока это еще только принципиальная модель, но Ветров с коллегами пошли дальше. И их алгоритм теперь позволяет находить в тексте «новые» значения слов. Например слово «банк» может означать:

1. банк - как организацию, т.е. банк «Такой-то»
2. банк - как финансовый институт, т.е. «банки - кровеносная система экономики»
3. банк - в смысле базы данных или образцов
4. банк - как место, то есть слева от здания банка будет закусочная

И так далее. Это тоже пока прототип, то тем не менее, что это дает? Во-первых, осмысленный поиск, а не перебор всех вариантов найденных последовательностей слова «банк». А во-вторых, возможность задавать смысловые операции, например запрос {«найти хронологические несуразности в истории» - «идиоты»} избавит от террабайт всякой фоменковщины. И тогда,имея аккуратно подобранную библиотеку (в смысле «банк» :) ) источников, можно было бы оперативно получать ответы на возникающие вопросы. Вот я отчетливо помню, как у М.Л. Гаспарова я читал анализ демографический ситуации в Греции периода упадка. Я помню шрифт на странице в той книге, цвет обоев в комнате, где я это читал, но суммарно потратил наверно несколько дней на то, чтобы найти этот момент в работах Гаспарова и не смог. А тут раз бы…

Но работать надо с тем, что есть. Увы. И поэтому в следующий раз все же о том, что делать пока инженеры Гугл нас не осчастливили.



Posts from This Journal by “Мысли” Tag


  • 1
Фундаментально не согласен с двумя позициями
1) Что в гуманитарной науке уже все сказано
2) Что человек в принципе не может освоить все имеющееся в наличии знание
Мне кажется, что человек может - обладая более мощными обобщающими конструкциями - освоить любой обьем знания. Но для этого надо делать новые шаги в гуманитарных науках, а не топтаться на месте, ожидая счастья от инженеров Гугла

Ну и какой "новый" шаг сделали вы? :)

  • 1
?

Log in

No account? Create an account