📚 The CoCalc Library - books, templates and other resources
cocalc-examples / martinthoma-latex-examples / publications / Proseminar-Netzwerkanalyse / Einleitung.tex
132928 viewsLicense: OTHER
Im Folgenden werden in \cref{sec:Motivation} einige Beispiele, in denen1der DYCOS-Algorithmus Anwendung finden könnte, dargelegt. In2\cref{sec:Problemstellung} wird die Problemstellung formal definiert3und in \cref{sec:Herausforderungen} wird auf besondere Herausforderungen der4Aufgabenstellung hingewiesen.56\subsection{Motivation}\label{sec:Motivation}7Teilweise beschriftete Graphen sind allgegenwärtig. Publikationsdatenbanken mit8Publikationen als Knoten, Literaturverweisen und Zitaten als Kanten sowie von9Nutzern vergebene Beschriftungen (sog. {\it Tags}) oder Kategorien als10Knotenbeschriftungen; Wikipedia mit Artikeln als Knoten, Links als Kanten und11Kategorien als Knotenbeschriftungen sowie soziale Netzwerke mit Eigenschaften12der Benutzer als Knotenbeschriftungen sind drei Beispiele dafür. Häufig sind13Knotenbeschriftungen nur teilweise vorhanden und es ist wünschenswert die14fehlenden Knotenbeschriftungen automatisiert zu ergänzen.1516\subsection{Problemstellung}\label{sec:Problemstellung}17Gegeben ist ein Graph, dessen Knoten teilweise beschriftet sind. Zusätzlich18stehen zu einer Teilmenge der Knoten Texte bereit. Gesucht sind nun19Knotenbeschriftungen für alle Knoten, die bisher noch nicht beschriftet sind.\\2021\begin{definition}[Knotenklassifierungsproblem]\label{def:Knotenklassifizierungsproblem}22Sei $G_t = (V_t, E_t, V_{L,t})$ ein gerichteter Graph, wobei $V_t$ die23Menge aller Knoten, $E_t \subseteq V_t \times V_t$ die Kantenmenge und24$V_{L,t} \subseteq V_t$ die Menge der beschrifteten Knoten jeweils zum25Zeitpunkt $t$ bezeichne. Außerdem sei $L_t$ die Menge aller zum Zeitpunkt26$t$ vergebenen Knotenbeschriftungen und $f:V_{L,t} \rightarrow L_t$ die27Funktion, die einen Knoten auf seine Beschriftung abbildet.2829Weiter sei für jeden Knoten $v \in V$ eine (eventuell leere) Textmenge30$T(v)$ gegeben.3132Gesucht sind nun Beschriftungen für $V_t \setminus V_{L,t}$, also33$\tilde{f}: V_t \setminus V_{L,t} \rightarrow L_t$. Die Aufgabe, zu $G_t$34die Funktion $\tilde{f}$ zu finden heißt35\textit{Knotenklassifierungsproblem}.36\end{definition}3738\subsection{Herausforderungen}\label{sec:Herausforderungen}39Die Graphen, für die dieser Algorithmus konzipiert wurde, sind viele40$\num{10000}$~Knoten groß und dynamisch. \enquote{Dynamisch} bedeutet in diesem41Kontext, dass neue Knoten und eventuell auch neue Kanten hinzu kommen bzw.42Kanten oder Knoten werden entfernt werden. Außerdem stehen textuelle Inhalte zu43den Knoten bereit, die bei der Klassifikation genutzt werden können. Bei44kleinen Änderungen sollte nicht alles nochmals berechnen werden müssen, sondern45basierend auf zuvor berechneten Knotenbeschriftungen sollte die Klassifizierung46angepasst werden.474849