Book a Demo!
CoCalc Logo Icon
StoreFeaturesDocsShareSupportNewsAboutPoliciesSign UpSign In
Download

📚 The CoCalc Library - books, templates and other resources

132935 views
License: OTHER
1
Den DYCOS-Algorithmus kann in einigen Aspekten erweitert werden. So könnte man
2
vor der Auswahl des Vokabulars jedes Wort auf den Wortstamm zurückführen. Dafür
3
könnte zum Beispiel der in \cite{porter} vorgestellte Porter-Stemming-Algorithmus verwendet werden. Durch diese Maßnahme wird das Vokabular kleiner
4
gehalten wodurch mehr Artikel mit einander durch Vokabular verbunden werden
5
können. Außerdem könnte so der Gini-Koeffizient ein besseres Maß für die
6
Gleichheit von Texten werden.
7
8
Eine weitere Verbesserungsmöglichkeit besteht in der Textanalyse. Momentan ist
9
diese noch sehr einfach gestrickt und ignoriert die Reihenfolge von Wörtern
10
beziehungsweise Wertungen davon. So könnte man den DYCOS-Algorithmus in einem
11
sozialem Netzwerk verwenden wollen, in dem politische Parteiaffinität von
12
einigen Mitgliedern angegeben wird um die Parteiaffinität der restlichen
13
Mitglieder zu bestimmen. In diesem Fall macht es jedoch einen wichtigen
14
Unterschied, ob jemand über eine Partei gutes oder schlechtes schreibt.
15
16
Eine einfache Erweiterung des DYCOS-Algorithmus wäre der Umgang mit mehreren
17
Beschriftungen.
18
19
DYCOS beschränkt sich bei inhaltlichen Zweifachsprüngen auf die
20
Top-$q$-Wortknoten, also die $q$ ähnlichsten Knoten gemessen mit der
21
Aggregatanalyse, allerdings wurde bisher noch nicht untersucht, wie der
22
Einfluss von $q \in \mathbb{N}$ auf die Klassifikationsgüte ist.
23
24