📚 The CoCalc Library - books, templates and other resources
cocalc-examples / martinthoma-latex-examples / presentations / causality-presentation / backup / main.tex
132930 viewsLicense: OTHER
%!TEX root = interventions.tex1\section{Interventions}2\subsection{Definition}3\begin{frame}{Interventionen}4\begin{block}{Interventionsverteilung}5Sei $\mathbb{P}^\mathbf{X}$ die zu einer SEM6$\mathcal{S} := (\mathcal{S}, \mathbb{P}^N)$ gehörende Verteilung. \onslide<2->{Dann7kann eine (oder mehr) Strukturgleichungen aus $\mathcal{S}$ ersetzt8werden ohne einen Zyklus im Graphen zu erzeugen.} \onslide<3->{Die Verteilung des9neuen SEM $\tilde{\mathcal{S}}$ heißt dann10\textit{Interventionsverteilung}.}1112\onslide<4->{Bei den Variablen, deren Strukturgleichungen ersetzt wurden, sagt man,13wurde \textit{interveniert}.}1415\onslide<5->{Die neue Verteilung wird mit16\[\mathbb{P}_{\tilde{\mathcal{S}}}^{\mathbf{X}} = \mathbb{P}_{\mathcal{S}, do(X_j:=\tilde{f}(\tilde{\mathbf{PA}}_j, \tilde{N}_j))}^{\mathbf{X}}\]17beschrieben.}1819\onslide<6->{Die Menge der Rauschvariablen in $\mathcal{S}$ beinhaltet nun einige20\enquote{neue} und einige \enquote{alte} $N$'s. $\mathcal{S}$ muss21paarweise unabhängig sein.}22\end{block}23\end{frame}2425\begin{frame}{Nieren-Beispiel}26\begin{table}27\begin{tabular}{lrr}28\toprule29~ & \multicolumn{2}{c}{\textbf{Behandlungserfolg}} \\30\cmidrule{2-3}31~ & \multicolumn{1}{c}{\textbf{A}} & \multicolumn{1}{c}{\textbf{B}} \\ \midrule32Kleine Nierensteine & \textbf{93\%} & 87\% \\33Große Nierensteine & \textbf{73\%} & 69\% \\34\textbf{Gesamt} & 78\% & \textbf{83\%} \\35\bottomrule36\end{tabular}37\end{table}3839\begin{figure}[!h]40\centering41\begin{tikzpicture}[->,>=stealth',shorten >=1pt,auto,node distance=2.5cm,42thick,main node/.style={circle,fill=blue!10,draw,font=\sffamily\Large\bfseries}]43\node (Z) at (1,1) {Z};44\node (T) at (0,0) {T};45\node (R) at (2,0) {R};4647\foreach \from/\to in {Z/T,Z/R,T/R}48\draw (\from) -> (\to);49\end{tikzpicture}50\end{figure}5152\begin{align*}53Z &= N_Z, \;\;\;& N_Z &\sim Ber(\nicefrac{1}{4})\\54T &= \lfloor 2 \cdot (1-Z+N_T) \rfloor \;\;\; & N_T &\sim \mathcal{N}(0, 1)\\55R &= \lfloor 2 \cdot (0.6 \cdot (1-Z) + 0.4 \cdot (1-T) + N_R) \rfloor \;\;\; & N_R &\sim \mathcal{N}(0, 1)56\end{align*}57\end{frame}5859% \begin{frame}{Interventionen: Spezialfälle}60% \begin{block}{Interventionsverteilung}61% Wenn $\tilde{f}(\tilde{\mathbf{PA}_j}, \tilde{N}_j)$ eine Punktmasse62% auf ein $a \in \mathbb{R}$ legt schreibt man63% \[\mathbb{P}_\mathcal{S, do(X_j := \tilde{f}(\tilde{\mathbf{PA}_j}, \tilde{N}_j))}^{\mathbf{X}}\]64% und nennt die Intervention65% \textbf{perfekt}.\\6667% Eine Intervention mit $\tilde{\mathbf{PA}_j} = \mathbf{PA}_j$ wird68% \textbf{mangelhaft} genannt.69% \end{block}70% \end{frame}7172\begin{frame}[t]{Beispiel 2.2.2: Ursache und Effekt}73Es sei $\mathcal{S}$ gegeben durch74\begin{align}75X &= N_X\\76Y &= 4 \cdot X + N_Y77\end{align}78mit $N_X, N_Y \overset{\text{iid}}{\sim} \mathcal{N}(0, 1)$ und den79Graphen $X \rightarrow Y$.80\only<2-9>{81Dann gilt:82\begin{align}83\mathbb{P}_\mathcal{S}^Y = \mathcal{N}(0, 4^2 + 1) &\onslide<3->{\neq \mathcal{N}(8, 1)} \onslide<4->{= \mathbb{P}_{\mathcal{S}, do(X:=2)}^{Y}} \onslide<5->{= \mathbb{P}_\mathcal{S}^{Y|X=2}}\\84&\onslide<6->{\neq \mathcal{N}(12, 1)} \onslide<7->{= \mathbb{P}_{\mathcal{S}, do(X:=3)}^{Y}} \onslide<8->{= \mathbb{P}_\mathcal{S}^{Y|X=3}}85\end{align}86\onslide<9->{$\Rightarrow$ Intervention auf $X$ beeinflusst die Verteilung von $Y$.}87}88\only<10-13>{89Aber:9091\begin{align}92\mathbb{P}_{\mathcal{S}, do(Y:=2)}^{X} &= \mathcal{N}(0, 1)\\93\onslide<11->{&= \mathbb{P}_\mathcal{S}^X}\\94\onslide<12->{&= \mathbb{P}_{\mathcal{S}, do(Y:=3.14159)}^{X}}\\95\onslide<13->{&\neq \mathbb{P}_\mathcal{S}^{X|Y=2}}96\end{align}97}98\only<14->{\\99Beispiel: $X$ (rauchen) $\rightarrow Y$ (weiße Zähne)100\begin{itemize}101\item<15-> Es besteht eine Asymmetrie zwischen Ursache ($X$) und Effekt ($Y$).102\item<16-> $\mathbb{P}_{\mathcal{S}, do(Y:=\tilde{N}_Y)}^{X,Y} \Rightarrow X \perp\!\!\!\perp Y$103\item<17-> $\mathbb{P}_{\mathcal{S}, do(X:=\tilde{N}_X)}^{X,Y} \text{ und } Var(\tilde{N}_X) > 0 \Rightarrow X \not\perp\!\!\!\perp Y$104\end{itemize}105}106\end{frame}107108\section{Totaler kausaler Effekt}109\subsection{Totaler kausaler Effekt}110\begin{frame}{Totaler kausaler Effekt}111\begin{block}{Totaler kausaler Effekt}112Gegeben sei ein SEM $\mathcal{S}$. Dann gibt es einen113(totalen) kausalen Effekt von $X$ nach $Y$ genau dann wenn114\[\exists \tilde{N}_X : X \not\!\perp\!\!\!\perp Y \text{ in } \mathbb{P}_{\mathcal{S}, do(X:=\tilde{N}_X)}^{\mathbf{X}}\]115gilt.116\end{block}117\end{frame}118119\begin{frame}[t]{Totaler kausaler Effekt: Äquivalenzen}120Folgende Aussagen sind äquivalent:121122\begin{enumerate}[label=(\roman*)]123\item $\exists \tilde{N}_{X_1} \hphantom{\text{ mit vollem Support }}: X_1 \not\!\perp\!\!\!\perp X_2 \text{ in } \mathbb{P}_{\mathcal{S}, do(X_1:=\tilde{N}_{X_1})}^{\mathbf{X}}$124\item $\exists x^\triangle \exists x^\square: \mathbb{P}_{\mathcal{S}, do(X_1:=x^\triangle)}^{X_2} \neq \mathbb{P}_{\mathcal{S}, do(X_1:=x^\square)}^{X_2}$125\item $\exists x^\triangle \hphantom{\exists x^\square}: \mathbb{P}_{\mathcal{S}, do(X_1:=x^\triangle)}^{X_2} \neq \mathbb{P}_\mathcal{S}^{X_2}$.126\item $\forall \tilde{N}_{X_1} \text{ mit vollem Support }: X_1 \not\!\perp\!\!\!\perp X_2 \text{ in } \mathbb{P}_{\mathcal{S}, do(X_1:=\tilde{N}_{X_1})}^{\mathbf{X}}$127\end{enumerate}128129\only<2>{130\textbf{Beweisplan:}\\131(i) $\Rightarrow$ (ii) $\Rightarrow$ (iv) $\Rightarrow$ (i)\\132$\neg$(i) $\Rightarrow$ $\neg$ (iii) äquivalent zu (iii) $\Rightarrow$ (i)\\133(ii) $\Rightarrow$ (iii)134}135\only<3-5>{136\begin{align}137p_{\mathcal{S}, do(X_1:=x_1)}^{X_2}(x_2) &= \int \prod_{j \neq 1} p_j(x_j|x_{pa(j)}) \mathrm{d}x_3 \dots \mathrm{d}x_p \nonumber138\only<4->{\\&= \int \prod_{j \neq 1} p_j(x_j|x_{pa(j)}) \frac{\tilde{p}(x_1)}{\tilde{p}(x_1)}\mathrm{d}x_3 \dots \mathrm{d}x_p \nonumber}139\only<5->{\\&= p_{\mathcal{S}, do(X_1:=\tilde{N}_1)}^{X_2 | X_1=x_1}(x_2)\tag{A.1}\label{eq:A.1}}140\end{align}141\only<5->{mit $\tilde{p}(x_1) > 0$.}142}143\only<6>{144\begin{align}145X_2 \not\perp\!\!\!\perp X_1 \text{ in } \mathbb{Q} \Leftrightarrow &\exists x_1^\triangle, x_1^\square \nonumber\\146&\text{mit } q(x_1^\triangle), q(x_1^\square) > 0\nonumber\\147&\text{und } \mathbb{Q}^{X_2|X_1=x_1^\triangle} \neq \mathbb{Q}^{X_2 | X_1=x_1^\square}\tag{A.2}\label{eq:A.2}148\end{align}149}150151\only<7>{152\begin{align}153X_2 \not\perp\!\!\!\perp X_1 \text{ in } \mathbb{Q} \Leftrightarrow &\exists x_1^\triangle \nonumber\\154&\text{mit } q(x_1^\triangle) > 0\nonumber\\155&\text{und } \mathbb{Q}^{X_2|X_1=x_1^\triangle} \neq \mathbb{Q}^{X_2}\tag{A.3}\label{eq:A.3}156\end{align}157}158159\only<8-10>{160\textbf{Beweisplan:} (i) $\Rightarrow$ (ii)\\161\onslide<9->{(i) $\overset{A.2}{\Rightarrow} \exists x_1^\triangle, x_1^\square$ mit162pos. Dichte unter $\tilde{N_1}$ sodass $\mathbb{P}_{\mathcal{S}, do(X_1:=\tilde{N_1})}^{X_2|X_1=x_1^\triangle} \neq \mathbb{P}_{\mathcal{S}, do(X_1:=\tilde{N_1})}^{X_2 | X_1=x^\square}$\\}163\onslide<10->{$\overset{A.1}{\Rightarrow} (ii)$}164}165\only<11-13>{166\textbf{Beweisplan:} (ii) $\Rightarrow$ (iv)\\167\onslide<12->{(ii) $\overset{A.1}{\Rightarrow} \exists x_1^\triangle, x_1^\square$ mit pos. Dichte unter $\hat{N_1}$ sodass $\mathbb{P}_{\mathcal{S}, do(X_1:=\hat{N_1})}^{X_2|X_1=x_1^\triangle} \neq \mathbb{P}_{\mathcal{S}, do(X_1 := \hat{N_1})}^{X_2 | X_1 = x_1^\square}$}168\onslide<13->{$\overset{A.2}{\Rightarrow} (iv)$}169}170\only<14>{171\textbf{Beweisplan:} (iv) $\Rightarrow$ (i)\\172Trivial173}174\only<15-17>{175\textbf{Beweisplan:} $\neg$(i) $\Rightarrow$ $\neg$ (iii)\\176\onslide<16->{Es gilt: $\mathbb{P}_\mathcal{S}^{X_2} = \mathbb{P}_{\mathcal{S}, do(X_1 := N_1^*)}^{X_2}$, wobei $N_1^*$ wie $\mathbb{P}_\mathcal{S}^{X_2}$ verteilt ist.\\}177\onslide<17->{178\begin{align}179\neg (i) &\Rightarrow X_2 \perp\!\!\!\perp X_1 \text{ in } \mathbb{P}_{\mathcal{S}, do(X_1 := N_1^*)}^{\textbf{X}}\\180&\overset{A.3}{\Rightarrow} \mathbb{P}_{\mathcal{S}, do(X_1 :=N_1^*)}^{X_2| X_1=x^\triangle} = \mathbb{P}_{\mathcal{S}, do(X_1 := N_1^*)}^{X_2} \;\;\;\forall x^\triangle \text{ mit } p_1(x^\triangle) > 0\\181&\overset{A.1}{\Rightarrow} \mathbb{P}_{\mathcal{S}, do(X_1:=x^\triangle)}^{X_2} = \mathbb{P}_\mathcal{S}^{X_2} \;\;\; \forall x^\triangle \text{ mit } p_1(x^\triangle) > 0\\182&\overset{\neg (ii)}{\Rightarrow} \neg (iii)183\end{align}184}185}186\only<18>{187\textbf{Beweisplan:} (ii) $\Rightarrow$ (iii)\\188Trivial (TODO: wirklich?)189}190\end{frame}191192\begin{frame}{Beispiel 2.2.6: Randomisierte Studie}193\begin{itemize}194\item<1-> Weise eine Behandlung $T$ zufällig (nach $\tilde{N_T}$) einem195Patienten zu. Das könnte auch ein Placebo sein.196\item<2-> Im SEM: Daten aus $\mathbb{P}_{\mathcal{S}, do(T:=\tilde{N_T})}^{\mathbf{X}}$197\item<3-> Falls immer noch Abhängigkeit zw. Behandlung und Erfolg198vorliegt $\Rightarrow T$ hat einen totalen kausalen Effekt auf199den Behandlungserfolg.200\end{itemize}201\end{frame}202203\begin{frame}{Beispiel 2.2.7: Nicolai's running-and-health Beispiel}204Das zugrundeliegende (\enquote{wahre}) SEM $\mathcal{S}$, welches die Daten205generierte, hat die Form:206207\begin{align}208A &= N_A &&\text{mit } N_A \sim Ber(\nicefrac{1}{2})\\209H &= A + N_H \mod 2 &&\text{mit } N_H \sim Ber(\nicefrac{1}{3})\\210B &= H + N_B \mod 2 &&\text{mit } N_B \sim Ber(\nicefrac{1}{20})211\end{align}212213mit dem Graphen $A \rightarrow H \rightarrow B$ und\\214$N_A, N_H, N_B$ unabhängig.215216\begin{itemize}217\item<1-> $B$ ist hilfreicher für die Vorhersage von $H$ als $A$.218\item<2-> Intervention von $A$ hat auf $H$ einen größeren Einfluss als Intervention von $B$.219\end{itemize}220\end{frame}221222\begin{frame}{Proposition 2.2.9}223\begin{enumerate}[label=(\roman*)]224\item<1-> Falls es keinen gerichteten Pfad von $X$ nach $Y$ gibt, dann225gibt es keinen kausalen Effekt.226\item<2-> Manchmal gibt es einen gerichteten Pfad, aber keinen kausalen227Effekt.228\end{enumerate}229230\onslide<3->{Beweis von (i): Folgt aus der Markov-Eigenschaft des231interventierten SEMs. }\onslide<4->{Nach dem Entfernen der232in $X$ eingehenden Kanten gilt: $X$ und $Y$ sind233$d$-separiert, falls es keinen direkten Pfad von $X$ nach234$Y$ gibt. \\}235\onslide<5->{Beweis von (ii) durch Gegenbeispiel: Sei236\begin{align}237X &= N_X\\238Z &= 2X + N_Z\\239Y &= 4X - 2Z + N_Y240\end{align}241Dann gilt: $Y = - 2N_Z + N_Y$ und daher $X \perp\!\!\!\perp$ für alle $N_X$. $\square$242}243\end{frame}244245% \begin{frame}{Nierensteine}246% \begin{columns}247% \begin{column}{0.45\textwidth}248% \begin{center}\textbf{Modell A}\end{center}249% \end{column}250% \begin{column}{0.45\textwidth}251% \begin{center}\textbf{Modell B}\end{center}252% \end{column}253% \end{columns}254% \end{frame}255256