USING GRAPH EMBEDDINGS FOR WIKIPEDIA LINK PREDICTION

Abstract

Link prediction is an important area of study in network analysis and graph theory which tries to answer the question of whether two nodes in the graph might have an association in the future. Nowadays, graphs are ubiquitously present in our lives (social networks, circuits, roads etc.), which is why the problem is crucial to the development of intelligent applications. In the past, there have been proposed methods of solving link prediction problem through algebraic formulations and heuristics, however, their expressive power and transferability fell short. Recently, graph embedding methods have risen to popularity because of their effectiveness and the ability to transfer knowledge between tasks. Inspired by the famous in machine learning and natural language processing research Word2Vec approach, these methods try to learn a distributed vector representation, called an embedding, of graph nodes. After that a binary classifier given a pair of embeddings predicts the probability of the existence of a link between the encoded nodes. In this paper, we review several graph embedding approaches for the problem of Wikipedia link prediction, namely Wikipedia2vec, Role2vec, AttentionWalk and Walkets. Wikipedia link prediction tries to find pages that should be interlinked due to some semantic relation. We evaluate prediction accuracy on a hold-out set of links and show which one proves to be better at mining associations between Wikipedia concepts. The results include qualitative (principal component analysis dimensionality reduction and visualization) and quantitative (accuracy) differences between the proposed methods. As a part of the conclusion, further research questions are provided, including new embedding architectures and the creation of a graph embedding algorithms benchmark.

Authors and Affiliations

Roman Shaptala, Gennadiy Kyselev

Keywords

Related Articles

Development of agent-oriented software components to retrieve the marketing information from the web

<span>The article is devoted to researching the processes of extracting marketing information from the Web space. Conclusions are drawn on the need to introduce an information marketing system into modern business activi...

Алгоритм построения стационарного нормального марковского 3d-поля: динамические уравнения движения, статистические распределения вероятностей, визуализация

<span>Рассмотрено трехмерное поле, обладающее свойствами стационарности, нормальности и марковости. На основе иерархического подхода проведен вероятностный анализ рассматриваемых случайных величин, процессов и полей. Пос...

ІНФОРМАЦІЙНО-ЕКСТРЕМАЛЬНЕ МАШИННЕ НАВЧАННЯ СИСТЕМИ КОНТРОЛЮ ЗНАНЬ

Розглядається алгоритм машинного навчання комп’ютеризованої системи контролю знань за тестовими завданнями. При цьому машинне навчання здійснюється в рамках інформаційно-екстремальної інтелектуальної технології аналізу д...

Прогнозирование потребительского спроса на сезонные товары с использованием вектора кривой продаж

<span>Предложен метод прогнозирования спроса на сезонные товары с использованием вектора распределения объемов продаж в течение года или вектора кривой продаж, компонентами которого являются объемы недельных продаж рассм...

АНАЛИЗ ИНФОРМАЦИИ В НЕЙРОМОРФНЫХ ИНФОРМАЦИОННЫХ МОДЕЛЯХ НЕЙРОНОВ

<p class="204">Ррассматривается системный принцип построения детекторных искусственных нейронных сетей (ДНС). Этот принцип основан на определении и детектировании структурных элементов распознаваемых образов, а также их...

Download PDF file
  • EP ID EP603781
  • DOI 10.20998/2079-0023.2019.01.09
  • Views 108
  • Downloads 0

How To Cite

Roman Shaptala, Gennadiy Kyselev (2019). USING GRAPH EMBEDDINGS FOR WIKIPEDIA LINK PREDICTION. Вісник Національного технічного університету «ХПІ». Серія: Системний аналiз, управління та iнформацiйнi технологiї, 0(1), 48-52. https://www.europub.co.uk/articles/-A-603781