📚 The CoCalc Library - books, templates and other resources
cocalc-examples / martinthoma-latex-examples / publications / Proseminar-Netzwerkanalyse / Related-Work.tex
132928 viewsLicense: OTHER
%!TEX root = Ausarbeitung-Thoma.tex1Sowohl das Problem der Knotenklassifikation, als auch das der2Textklassifikation, wurde bereits in verschiedenen Kontexten analysiert. Jedoch3scheinen bisher entweder nur die Struktur des zugrundeliegenden Graphen oder4nur Eigenschaften der Texte verwendet worden zu sein.56So werden in \cite{bhagat,szummer} unter anderem Verfahren zur7Knotenklassifikation beschrieben, die wie der in \cite{aggarwal2011}8vorgestellte DYCOS-Algorithmus, um den es in dieser Ausarbeitung geht, auch auf9Random Walks basieren.1011Obwohl es auch zur Textklassifikation einige Paper gibt12\cite{Zhu02learningfrom,Jiang2010302}, geht doch keines davon auf den13Spezialfall der Textklassifikation mit einem zugrundeliegenden Graphen ein.1415Die vorgestellten Methoden zur Textklassifikation variieren außerdem sehr16stark. Es gibt Verfahren, die auf dem bag-of-words-Modell basieren17\cite{Ko:2012:STW:2348283.2348453} wie es auch im DYCOS-Algorithmus verwendet18wird. Aber es gibt auch Verfahren, die auf dem19Expectation-Maximization-Algorithmus basieren \cite{Nigam99textclassification}20oder Support Vector21Machines nutzen \cite{Joachims98textcategorization}.2223Es wäre also gut Vorstellbar, die Art und Weise wie die Texte in die24Klassifikation des DYCOS-Algorithmus einfließen zu variieren. Allerdings ist25dabei darauf hinzuweisen, dass die im Folgenden vorgestellte Verwendung der26Texte sowohl einfach zu implementieren ist und nur lineare Vorverarbeitungszeit27in Anzahl der Wörter des Textes hat, als auch es erlaubt einzelne Knoten zu28klassifizieren, wobei der Graph nur lokal um den zu klassifizierenden Knoten29betrachten werden muss.303132