Book a Demo!
CoCalc Logo Icon
StoreFeaturesDocsShareSupportNewsAboutPoliciesSign UpSign In
Download

📚 The CoCalc Library - books, templates and other resources

132934 views
License: OTHER
1
\documentclass[a5paper,9pt]{scrartcl}
2
\usepackage{amssymb, amsmath} % needed for math
3
\usepackage[utf8]{inputenc} % this is needed for umlauts
4
\usepackage[ngerman]{babel} % this is needed for umlauts
5
\usepackage[T1]{fontenc} % this is needed for correct output of umlauts in pdf
6
% \usepackage[margin=2.5cm]{geometry} %layout
7
\usepackage{hyperref} % links im text
8
\usepackage{color}
9
\usepackage{framed}
10
\usepackage{parskip}
11
\usepackage{braket} % needed for \Set
12
\usepackage{enumerate} % for advanced numbering of lists
13
\usepackage{minted} % needed for the inclusion of source code
14
\clubpenalty = 10000 % Schusterjungen verhindern
15
\widowpenalty = 10000 % Hurenkinder verhindern
16
17
\hypersetup{
18
pdfauthor = {Martin Thoma},
19
pdfkeywords = {ASR},
20
pdftitle = {Entropie-Distanz von Martin Thoma}
21
}
22
23
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
24
% Custom definition style, by %
25
% http://mathoverflow.net/questions/46583/what-is-a-satisfactory-way-to-format-definitions-in-latex/58164#58164
26
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
27
\makeatletter
28
\newdimen\errorsize \errorsize=0.2pt
29
% Frame with a label at top
30
\newcommand\LabFrame[2]{%
31
\fboxrule=\FrameRule
32
\fboxsep=-\errorsize
33
\textcolor{FrameColor}{%
34
\fbox{%
35
\vbox{\nobreak
36
\advance\FrameSep\errorsize
37
\begingroup
38
\advance\baselineskip\FrameSep
39
\hrule height \baselineskip
40
\nobreak
41
\vskip-\baselineskip
42
\endgroup
43
\vskip 0.5\FrameSep
44
\hbox{\hskip\FrameSep \strut
45
\textcolor{TitleColor}{\textbf{#1}}}%
46
\nobreak \nointerlineskip
47
\vskip 1.3\FrameSep
48
\hbox{\hskip\FrameSep
49
{\normalcolor#2}%
50
\hskip\FrameSep}%
51
\vskip\FrameSep
52
}}%
53
}}
54
\definecolor{FrameColor}{rgb}{0.25,0.25,1.0}
55
\definecolor{TitleColor}{rgb}{1.0,1.0,1.0}
56
57
\newenvironment{contlabelframe}[2][\Frame@Lab\ (cont.)]{%
58
% Optional continuation label defaults to the first label plus
59
\def\Frame@Lab{#2}%
60
\def\FrameCommand{\LabFrame{#2}}%
61
\def\FirstFrameCommand{\LabFrame{#2}}%
62
\def\MidFrameCommand{\LabFrame{#1}}%
63
\def\LastFrameCommand{\LabFrame{#1}}%
64
\MakeFramed{\advance\hsize-\width \FrameRestore}
65
}{\endMakeFramed}
66
\newcounter{definition}
67
\newenvironment{definition}[1]{%
68
\par
69
\refstepcounter{definition}%
70
\begin{contlabelframe}{Definition \thedefinition:\quad #1}
71
\noindent\ignorespaces}
72
{\end{contlabelframe}}
73
\makeatother
74
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
75
% Begin document %
76
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
77
\begin{document}
78
\section{Entropie-Distanz}
79
80
\begin{definition}{Entropie}
81
Sei $\Omega := \Set{z_1, z_2, \dots, z_n}$ eine endliche Zeichenmenge und
82
$X: Z \rightarrow \mathbb{R}$ eine Zufallsvariable über dem Wahrscheinlichkeitsraum
83
$(\Omega, \mathbb{P})$. Dann heißt
84
\[H_1 = - \sum_{z \in \Omega} \mathbb{P}(z) \log_2 (\mathbb{P}(z))\]
85
\textbf{Entropie}.
86
\end{definition}
87
88
Die Entropie wird maximal bei Gleichverteilung, also bei $P(z_i) = \frac{1}{|\Omega|}$.
89
Dann gilt: $H = \log_2 |\Omega|$. Entsprechend wird die Entropie normiert,
90
indem durch $\log_2 |\Omega|$ geteilt wird:
91
\[H_{Norm} = \frac{H}{\log_2 |\Omega|}\]
92
Der Wertebereich der normierten Entropie $H_{Norm}$ ist $[0, 1]$.
93
94
\begin{definition}{Gewichtete Entropiedistanz}
95
Seien $d_1, d_2$ disktrete Wahrscheinlichkeitsverteilung über $(\Omega, P)$,
96
die mit $n_1, n_2 \in \mathbb{N}_0$ Daten geschätzt wurden.
97
98
Dann ist die \textbf{gewichtete Entropiedistanz} von $d_1$ und $d_2$ definiert durch
99
\[H_{dist}(d_1, d_2) := \left |\frac{n_1}{n_1+n_2} H(d_1) - \frac{n_2}{n_1+n_2} H(d_2) \right|\]
100
\end{definition}
101
102
Die folgenden Zeilen erstellen folgende Objekte:
103
\begin{itemize}
104
\item \verb+FeatureSet+: Das FeatureSet macht die Signalverarbeitung im
105
Janus Spracherkenner. Das FeatureSet beinhaltet Objekte vom Typ
106
\verb+SVector+ oder \verb+FMatrix+.
107
\item \verb+CodebookSet+: Eine Menge von Codebooks. Jedes Codebook stellt
108
eine Gauß-Verteilung dar. Ein Codebook wird vollständig durch seine
109
Kovarianzmatrix und den Mittelwertsvektor beschrieben.
110
\item \verb+DistribSet+: Eine Menge von Gauß-Mixturen. Jede Mixtur verweist
111
auf eine Menge von $n$ Codebooks (Gauß-Verteilungen) und gewichtet diese
112
mit reelen Zahlen $c_i \in \mathbb{R}$. Damit dies wiederum eine
113
Gauß-Verteilung ergibt, muss jedes Gewicht nicht-negativ sein und die
114
Summe $\sum_{i=1}^n c_i = 1$ ergeben.
115
\end{itemize}
116
\inputminted[linenos, numbersep=5pt, tabsize=4]{tcl}{step1.tcl}
117
118
Der Befehl in Zeile~1 erzeugt das \verb+CodebookSet+ und fügt ein Codebook mit
119
dem Namen \verb+cb+, dem Feature-Space namen \verb+dummy+, 2~Referenzvektoren
120
in einem 1-dimensionalen Feature-Raum hinzu.
121
122
Die Gauß-Mixtur \verb+ds1+ gewichtet den ersten Referenzvektor mit $c_1 = 0.3$
123
und den zweiten mit $c_2 = 0.7$. Für diese Gauß-Mixtur gibt es 2~Trainingsdaten
124
125
Die Entropie der Verteilungen ist:\nobreak
126
\begin{align*}
127
H_1(ds1) &= -(0.3 \cdot \log_2 0.3 + 0.7 \cdot \log_2 0.7) \approx 0.88\\
128
H_1(ds2) &= -(0.4 \cdot \log_2 0.4 + 0.6 \cdot \log_2 0.6) \approx 0.97\\
129
H_1(ds3) &= -(0.8 \cdot \log_2 0.8 + 0.2 \cdot \log_2 0.2) \approx 0.72
130
\end{align*}
131
132
Nun gilt:
133
134
\begin{align*}
135
H_{dist}(ds1, ds2) &\approx |\frac{2}{5} \cdot 0.88 - \frac{3}{5} \cdot 0.97| = 0.23\\
136
H_{dist}(ds1, ds3) &\approx |\frac{2}{5} \cdot 0.88 - \frac{3}{5} \cdot 0.72| = 0.08\\
137
H_{dist}(ds2, ds3) &\approx |\frac{1}{2} \cdot 0.97 - \frac{1}{2} \cdot 0.72| = 0.125\\
138
\end{align*}
139
140
Da \verb+ds1+ und \verb+ds3+ die geringste Distanz haben, sind sie sich nach
141
dem Entropiedistanzmaß am Ähnlichsten. Die Zusammenlegung dieser beiden
142
Verteilungen richtet also den geringsten Schaden an.
143
144
\textbf{Antwort für Teilaufgabe c}: Das Modell \verb+E(S|Y)-b+ ist sich selbst
145
am ähnlichsten.
146
147
\end{document}
148
149