Book a Demo!
CoCalc Logo Icon
StoreFeaturesDocsShareSupportNewsAboutPoliciesSign UpSign In
Download

📚 The CoCalc Library - books, templates and other resources

132928 views
License: OTHER
1
%!TEX root = Ausarbeitung-Thoma.tex
2
Sowohl das Problem der Knotenklassifikation, als auch das der
3
Textklassifikation, wurde bereits in verschiedenen Kontexten analysiert. Jedoch
4
scheinen bisher entweder nur die Struktur des zugrundeliegenden Graphen oder
5
nur Eigenschaften der Texte verwendet worden zu sein.
6
7
So werden in \cite{bhagat,szummer} unter anderem Verfahren zur
8
Knotenklassifikation beschrieben, die wie der in \cite{aggarwal2011}
9
vorgestellte DYCOS-Algorithmus, um den es in dieser Ausarbeitung geht, auch auf
10
Random Walks basieren.
11
12
Obwohl es auch zur Textklassifikation einige Paper gibt
13
\cite{Zhu02learningfrom,Jiang2010302}, geht doch keines davon auf den
14
Spezialfall der Textklassifikation mit einem zugrundeliegenden Graphen ein.
15
16
Die vorgestellten Methoden zur Textklassifikation variieren außerdem sehr
17
stark. Es gibt Verfahren, die auf dem bag-of-words-Modell basieren
18
\cite{Ko:2012:STW:2348283.2348453} wie es auch im DYCOS-Algorithmus verwendet
19
wird. Aber es gibt auch Verfahren, die auf dem
20
Expectation-Maximization-Algorithmus basieren \cite{Nigam99textclassification}
21
oder Support Vector
22
Machines nutzen \cite{Joachims98textcategorization}.
23
24
Es wäre also gut Vorstellbar, die Art und Weise wie die Texte in die
25
Klassifikation des DYCOS-Algorithmus einfließen zu variieren. Allerdings ist
26
dabei darauf hinzuweisen, dass die im Folgenden vorgestellte Verwendung der
27
Texte sowohl einfach zu implementieren ist und nur lineare Vorverarbeitungszeit
28
in Anzahl der Wörter des Textes hat, als auch es erlaubt einzelne Knoten zu
29
klassifizieren, wobei der Graph nur lokal um den zu klassifizierenden Knoten
30
betrachten werden muss.
31
32