Команда учёных из США докладывает, что обычная модель дозволяет делать довольно четкие прогнозы будущих упоминаний научных статей в СМИ на базе базы данных, собранной в течение приблизительно 5 крайних лет.
«Нам бы хотелось предсказывать как можно ранее и поточнее, какие конкретно статьи покажутся впечатляющими и необходимыми для аудитории, - ведает один из создателей исследования, Дашунь Ван (Dashun Wang) из исследовательского центра Томаса Уотсона в Нью-Йорке (IBM).
Математическая модель прогнозирования опирается на ключевики, по которым статья цитируется в 1-ые годы опосля публикации. Умопомрачительно, но модели не надо знать даже создателя, предмет статьи либо журнальчик, в каком она была в первый раз размещена.
Заместо этого создатели представили, что на популярность статьи влияют всего три фактора. 1-ый - это, очевидно, привлекательность самой идеи. 2-ой фактор - становится ли статья цитируемой сходу опосля выхода (это способно сделать её ещё наиболее популярной, срабатывает сетевой эффект, делающий известное ещё известнее). 3-ий фактор - это новизна инфы. Когда она исчезает, цитирование статьи равномерно спадает до нуля.
Вместе с Альбертом-Ласло Барабази (Albert-László Barabási), сетевым теоретиком из Северо-Восточного института, и Чаомин Сон (Chaoming Song), физиком из института Майами, Ван выстроил модель, учитывающую все три фактора с математической поправкой на актуальность.
На выходе она выдаёт всепригодную кривую, которая иллюстрирует скорость роста популярности и спада энтузиазма к научной работе. С маленькими погрешностями модель может предсказывать спектр влияния будущей статьи и более вероятные цитаты из неё.
Исследователи проверили свою модель на научных работах по физике, размещенных с 1960-х годов. Их прогнозы основывались на пятилетней базе цитирования. Они нашли, что спустя 25 лет цитирование 93,5% работ понижается согласно их прогнозам.
По мнению Вана, прогнозы могут быть изготовлены на базе данных, собранных и наименее чем за 5 лет, так как пик цитирования приходится приблизительно на 1-ые два года опосля выхода статьи, а потом популярность равномерно потухает.
Математическая модель применима также и к статьям 1990-х и 2000-х годов. Но, 6,5% статей на сто процентов опровергают результаты прогноза: некие работы не получали известность либо уважение в течение первых 5 лет опосля публикации, но потом в один момент как будто обретали “2-ое дыхание” и становились очень влиятельными в научной сфере.
Учёные, не принимавшие роли в данном исследовании, но работающие в той же сфере, похвалили модель команды Вана. Но они же высказали мировоззрение, что прогнозирование влияния статьи спустя 5 лет опосля её публикации фактически не имеет смысла. К тому же, следует осознавать, что популярность статей безизбежно разнится в зависимости от сферы деятельности учёного. Другими словами биологи постоянно будут цитировать друг дружку больше, чем физиков.
В дальнейшем Ван планирует усовершенствовать свою модель, введя в неё наиболее сложные элементы - такие, как тема статьи либо место публикации.
“На данный момент мы учитывали только малозначимые причины. Умопомрачительно, что удалось достичь такового уровня предсказуемости, беря во внимание только статистику цитирования со временем”, - говорит он.
Ван и его коллеги также добавляют, что модель можно применять и для прогнозирования грядущего сходу пары публикаций. К примеру, всех работ, размещенных в одном журнальчике, одним институтом либо под управлением 1-го определенного учёного. Так что в некий степени даже персональная карьера научного сотрудника скоро будет прогнозируемой.
В последнее время группа Вана надеется сделать веб-сайт, который сумеет выдавать прогноз цитирования для хоть какой научной работы.
Также по теме: Фуррор бестселлеров предскажет математическая модель Наука обязана создавать. Эфир программы “Наука 2.0” Открытие ученых: миром правит одна сверхкорпорация Проверить алгеброй московские пробки