学校 1 | 学校 2 | |
---|---|---|
生徒数 | 約 600 人 | 約 600 人 |
標本サイズ | 31 人 | 28 人 |
平均点 | 50.81 | 46.15 |
正規分布に従う 2 標本
を考える。
よって
とし、仮設検定を行う。
\(t_{n_1+n_2-2, \frac{\alpha}{2} }\)を \(P\left( T > t_{n_1+n_2-2, \frac{\alpha}{2} } \right) = \frac{\alpha}{2}\)となる点とすると、
学校 1 の母平均\(\theta_1\)について
であった。
これらは以下のように解釈し直せる。
\[\begin{aligned} Y_{i,1} &= \mu + \delta + \epsilon_{i,1} \\ Y_{i,2} &= \mu - \delta + \epsilon_{i,2} \\ \{\epsilon_{i,j}\} &\sim \text{i.i.d. normal}(0, \sigma^2) \end{aligned}\]
\(\theta_1 = \mu + \delta, \theta_2 = \mu - \delta\)とすると、
と解釈できる。
\[\begin{aligned} p(\mu, \delta, \sigma^2) &= p(\mu) \times p(\delta) \times p(\sigma^2) \\ \mu &\sim \text{normal}(\mu_0, \gamma_0^2) \\ \delta &\sim \text{normal}(\delta_0, \tau_0^2) \\ \sigma^2 &\sim \text{inverse-gamma}( \frac{\nu_0}{2}, \frac{\nu_0 \sigma_0^2}{2} ) \end{aligned}\]
\[\begin{aligned} p(\mu | \boldsymbol{y}_1, \boldsymbol{y}_2, \delta, \sigma^2) &\propto p(\boldsymbol{y}_1, \boldsymbol{y}_2, \delta, \sigma^2 | \mu) \times p(\mu) \\ &= p(\boldsymbol{y}_1, \boldsymbol{y}_2| \delta, \sigma^2, \mu) \times p(\delta) p(\sigma^2) p(\mu) \\ &\propto p(\boldsymbol{y}_1| \delta, \sigma^2, \mu) \times p(\boldsymbol{y}_2| \delta, \sigma^2, \mu) \times p(\mu) \\ &= \prod_{i=1}^{n_1} p(y_{i,1}| \delta, \sigma^2, \mu) \times \prod_{i=1}^{n_2} p(y_{i,2}| \delta, \sigma^2, \mu) \times p(\mu) \\ &\propto \exp \left\{ -\frac{1}{2\sigma^2} \sum_{i=1}^{n_1} (y_{i,1} - \mu - \delta)^2 \right\} \times \exp \left\{ -\frac{1}{2\sigma^2} \sum_{i=1}^{n_2} (y_{i,2} - \mu + \delta)^2 \right\} \times \exp \left\{ -\frac{1}{2\gamma_0^2} (\mu - \mu_0)^2 \right\} \\ &= \exp \left\{ -\frac{1}{2\sigma^2} \left[ \sum_{i=1}^{n_1} (\mu^2 - 2(y_{i,1} - \delta)\mu + (y_{i,1} - \delta)^2) + \sum_{i=1}^{n_2} (\mu^2 - 2(y_{i,2} + \delta)\mu + (y_{i,2} + \delta)^2) \right] -\frac{1}{2\gamma_0^2} (\mu^2 - 2\mu_0\mu + \mu_0^2) \right\} \\ &\propto \exp \left\{ -\frac{1}{2\sigma^2} \left[ n_1 \mu^2 - 2\mu \sum_{i=1}^{n_1} (y_{i,1} - \delta) + n_2 \mu^2 - 2\mu \sum_{i=1}^{n_2} (y_{i,2} + \delta) \right] -\frac{1}{2\gamma_0^2} (\mu^2 - 2\mu_0\mu) \right\} \\ &= \exp \left\{ - \frac{1}{2} \left(\frac{n_1 + n_2}{\sigma^2} + \frac{1}{\gamma_0^2} \right) \mu^2 + \left(\frac{\sum_{i=1}^{n_1} (y_{i,1} - \delta) + \sum_{i=1}^{n_2} (y_{i,2} + \delta)}{\sigma^2} + \frac{\mu_0}{\gamma_0^2} \right) \mu \right\} \\ &= \exp \left\{ - \frac{1}{2 \gamma_n^2} \mu^2 + \frac{\mu_n}{\gamma_n^2} \mu \right\} \\ &\propto \exp \left\{ - \frac{1}{2 \gamma_n^2} \left(\mu^2 - 2\mu \mu_n + \mu_n^2 \right) \right\} \\ &= \exp \left\{ - \frac{1}{2 \gamma_n^2} (\mu - \mu_n)^2 \right\} \\ &\propto \text{dnorm}(\mu | \mu_n, \gamma_n) \end{aligned}\]
\[\begin{aligned} \{\delta | &\boldsymbol{y}_1, \boldsymbol{y}_2, \mu, \sigma^2\} \sim \text{normal}(\delta_n, \tau_n^2), \text{ where} \\ & \delta_n = \tau_n^2 \times \left[ \frac{\delta_0}{\tau_0^2} + \frac{\sum_{i=1}^{n_1} (y_{i,1} - \mu)}{\sigma^2} -\frac{\sum_{i=1}^{n_2} (y_{i,2} - \mu)}{\sigma^2} \right] \\ & \tau_n^2 = \left[ \frac{1}{\tau_0^2} + \frac{n_1 + n_2}{\sigma^2} \right]^{-1} \end{aligned}\]
\[\begin{aligned} p(\delta | \boldsymbol{y}_1, \boldsymbol{y}_2, \mu, \sigma^2) &\propto p(\boldsymbol{y}_1, \boldsymbol{y}_2, \mu, \sigma^2 | \delta) \times p(\delta) \\ &\propto p(\boldsymbol{y}_1, \boldsymbol{y}_2| \mu, \sigma^2, \delta) \times p(\mu) p(\sigma^2) p(\delta) \\ &\propto p(\boldsymbol{y}_1| \mu, \sigma^2, \delta) \times p(\boldsymbol{y}_2| \mu, \sigma^2, \delta) \times p(\delta) \\ &= \prod_{i=1}^{n_1} p(y_{i,1}| \mu, \sigma^2, \delta) \times \prod_{i=1}^{n_2} p(y_{i,2}| \mu, \sigma^2, \delta) \times p(\delta) \\ &\propto \exp \left\{ -\frac{1}{2\sigma^2} \sum_{i=1}^{n_1} (y_{i,1} - \mu - \delta)^2 \right\} \times \exp \left\{ -\frac{1}{2\sigma^2} \sum_{i=1}^{n_2} (y_{i,2} - \mu + \delta)^2 \right\} \times \exp \left\{ -\frac{1}{2\tau_0^2} (\delta - \delta_0)^2 \right\} \\ &= \exp \left\{ -\frac{1}{2\sigma^2} \left[ \sum_{i=1}^{n_1} (\delta^2 - 2(y_{i,1} - \mu)\delta + (y_{i,1} - \mu)^2) + \sum_{i=1}^{n_2} (\delta^2 + 2(y_{i,2} - \mu)\delta + (y_{i,2} - \mu)^2) \right] -\frac{1}{2\tau_0^2} (\delta^2 - 2\delta_0\delta + \delta_0^2) \right\} \\ &\propto \exp \left\{ -\frac{1}{2\sigma^2} \left[ n_1 \delta^2 - 2\delta \sum_{i=1}^{n_1} (y_{i,1} - \mu) + n_2 \delta^2 + 2\delta \sum_{i=1}^{n_2} (y_{i,2} - \mu) \right] -\frac{1}{2\tau_0^2} (\delta^2 - 2\delta_0\delta) \right\} \\ &= \exp \left\{ - \frac{1}{2} \left(\frac{n_1 + n_2}{\sigma^2} + \frac{1}{\tau_0^2} \right) \delta^2 + \left(\frac{\sum_{i=1}^{n_1} (y_{i,1} - \mu) - \sum_{i=1}^{n_2} (y_{i,2} - \mu)}{\sigma^2} + \frac{\delta_0}{\tau_0^2} \right) \delta \right\} \\ &= \exp \left\{ - \frac{1}{2 \tau_n^2} \delta^2 + \frac{\delta_n}{\tau_n^2} \delta \right\} \\ &\propto \exp \left\{ - \frac{1}{2 \tau_n^2} \left(\delta^2 - 2\delta \delta_n + \delta_n^2 \right) \right\} \\ &= \exp \left\{ - \frac{1}{2 \tau_n^2} (\delta - \delta_n)^2 \right\} \\ &\propto \text{dnorm}(\delta | \delta_n, \tau_n) \end{aligned}\]
\[\begin{aligned} \{\sigma^2 | &\boldsymbol{y}_1, \boldsymbol{y}_2, \mu, \delta\} \sim \text{inverse-gamma}( \frac{\nu_n}{2}, \frac{\nu_n \sigma_n^2}{2}), \text{ where} \\ & \nu_n = \nu_0 + n_1 + n_2 \\ & \nu_n \sigma_n^2 = \nu_0 \sigma_0^2 + \sum_{i=1}^{n_1} (y_{i,1} - [\mu + \delta])^2 + \sum_{i=1}^{n_2} (y_{i,2} - [\mu - \delta])^2 \end{aligned}\]
\[\begin{aligned} & \quad p(\sigma^2 | \boldsymbol{y}_1, \boldsymbol{y}_2, \mu, \delta) \\ &\propto p(\boldsymbol{y}_1, \boldsymbol{y}_2, \mu, \delta | \sigma^2) \times p(\sigma^2) \\ &= p(\boldsymbol{y}_1, \boldsymbol{y}_2| \mu, \delta, \sigma^2) \times p(\mu) p(\delta) p(\sigma^2) \\ &\propto p(\boldsymbol{y}_1| \mu, \delta, \sigma^2) \times p(\boldsymbol{y}_2| \mu, \delta, \sigma^2) \times p(\sigma^2) \\ &= \prod_{i=1}^{n_1} p(y_{i,1}| \mu, \delta, \sigma^2) \times \prod_{i=1}^{n_2} p(y_{i,2}| \mu, \delta, \sigma^2) \times p(\sigma^2) \\ &\propto (\sigma^2)^{- \frac{n_1}{2} } \exp \left\{ -\frac{1}{2\sigma^2} \sum_{i=1}^{n_1} (y_{i,1} - [\mu + \delta])^2 \right\} \times (\sigma^2)^{- \frac{n_2}{2} } \exp \left\{ -\frac{1}{2\sigma^2} \sum_{i=1}^{n_2} (y_{i,2} - [\mu - \delta])^2 \right\} \times (\sigma^2)^{-\frac{\nu_0}{2} - 1} \exp \left\{ -\frac{\nu_0 \sigma_0^2}{2\sigma^2} \right\} \\ &= (\sigma^2)^{- \frac{n_1 + n_2 + \nu_0}{2} - 1} \exp \left\{ -\frac{1}{2\sigma^2} \left[ \sum_{i=1}^{n_1} (y_{i,1} - [\mu + \delta])^2 + \sum_{i=1}^{n_2} (y_{i,2} - [\mu - \delta])^2 + \nu_0 \sigma_0^2 \right] \right\} \\ &= (\sigma^2)^{- \frac{\nu_n}{2} - 1} \exp \left\{ -\frac{\nu_n \sigma_n^2 }{2\sigma^2} \right\} \\ &\propto \text{dinverse-gamma}(\sigma^2 | \frac{\nu_n}{2}, \frac{\nu_n \sigma_n^2}{2}) \end{aligned}\]
交換可能でない: 大学 1,2,3,4 年次それぞれの累積 GPA
任意の\(i \in \{1,2, \dots\}\)について\(Y_i \in \mathcal{Y}\)とする。任意の\(n\)に対して、 \(Y_1, \dots, Y_n\)に対する信念のモデルは \(\{1, \dots, n\}\)の任意の置換\(\pi\)に対して、交換可能であるとする。つまり、 \[ p(y_1, \dots, y_n) = p(y_{\pi(1)}, \dots, y_{\pi(n)}) \] が成り立っているとする。このとき、パラメータ\(\phi\)と、\(\phi\)に関する事前分布\(p(\phi)\)と、標本モデル\(p(y|\phi)\)が存在して、モデルは次のように書ける。 \[ p(y_1, \dots, y_n) = \int \left\{ \prod_1^n p(y_i|\phi) \right\} p(\phi) d\phi \]
データ\(Y_1, \dots, Y_n\)に交換可能性を仮定すると、
が存在し、以下のような定式化が可能である。
グループ\(j\)のデータは交換可能であるとすると(妥当な仮定)、あるパラメータ\(\phi_j\)が存在して、
と定式化できる。
したがって、
と定式化できる。
\[\begin{aligned} &p(\theta_1, \dots, \theta_m, \mu, \tau^2, \sigma^2 | \boldsymbol{y}_1, \dots, \boldsymbol{y}_m) \\ \propto &p(\theta_1, \dots, \theta_m, \mu, \tau^2, \sigma^2) \times p(\boldsymbol{y}_1, \dots, \boldsymbol{y}_m | \theta_1, \dots, \theta_m, \mu, \tau^2, \sigma^2) \\ \propto &p(\mu, \tau^2, \sigma^2) \times p(\theta_1, \dots, \theta_m | \mu, \tau^2, \sigma^2) \times p(\boldsymbol{y}_1, \dots, \boldsymbol{y}_m | \theta_1, \dots, \theta_m, \mu, \tau^2, \sigma^2) \\ \propto &p(\mu) p(\tau^2) p(\sigma^2) \left\{ \prod_{j=1}^m p(\theta_j | \mu, \tau^2) \right\} \left\{ \prod_{j=1}^m \prod_{i=1}^{n_j} p(y_{i,j} | \theta_j, \sigma^2) \right\}. \\ \end{aligned}\]
\[\begin{aligned} \{\mu | \theta_1, \dots, \theta_m, \tau^2\} &\sim \text{normal}(\frac{ m\bar{\theta}/\tau^2 + \mu_0/\gamma_0^2 }{ m/\tau^2 + 1/\gamma_0^2 }, [m/\tau^2 + 1/\gamma_0^2]^{-1}) \\ \{1/\tau^2 | \theta_1, \dots, \theta_m, \mu\} &\sim \text{gamma}(\frac{\eta_0 + m}{2}, \frac{\eta_0 \tau_0^2 + \sum_{j=1}^m (\theta_j - \mu)^2}{2}). \\ \end{aligned}\]
\(\mu\)に関しては、section 5.2 と全く同じ方法で導出できる。 \[\begin{aligned} y \sim p(\theta, \sigma^2) &\rightarrow \theta \sim p(\mu, \tau^2) \\ \theta \sim p(\mu_0, \tau_0^2) &\rightarrow \mu \sim p(\mu_0, \gamma_0^2) \\ \sigma^2 &\rightarrow \tau^2 \\ \end{aligned}\] とおきかえるだけ。
ここで、指数部分は\(-\frac{1}{2}\)を一旦無視して、
と置けるので、
\(1/\tau^2\)に関しては、section 6.3 と全く同じ方法で導出できる。
\[\begin{aligned} \theta &\rightarrow y \\ \mu &\rightarrow \theta \\ 1/\tau^2 &\rightarrow \tilde{\sigma}^2 \\ \end{aligned}\]
とおきかえるだけ。
\(\begin{aligned} p(\theta_j | \mu, \tau^2, \sigma^2, \boldsymbol{y}_1, \dots, \boldsymbol{y}_m) \propto p(\theta_j | \mu, \tau^2) \prod_{i=0}^{n_j} p(y_{i,j} | \theta_j, \sigma^2) \end{aligned}\) より、 \[ \{\theta_j | y_{1,j}, \dots, y_{n_j,j}, \sigma^2 \} \sim \text{normal}(\frac{ n_j\bar{y}_j/\sigma^2 + \mu/\tau^2 }{ n_j/\sigma^2 + 1/\tau^2 }, [n_j/\sigma^2 + 1/\tau^2]^{-1}) \]
\(\mu\)の完全条件付き分布と同様に、 section 5.2 と全く同じ方法で導出できる。 \[\begin{aligned} y_i \sim p(\theta, \sigma^2) &\rightarrow y_{i,j} \sim p(\theta_j, \sigma^2) \\ \theta \sim p(\mu, \tau_0^2) &\rightarrow \theta_j \sim p(\mu, \tau^2) \\ \end{aligned}\] とおきかえるだけ。
\[\begin{aligned} p(\sigma^2 | \theta_1, \dots, \theta_m, \boldsymbol{y}_1, \dots, \boldsymbol{y}_m) &\propto p(\sigma^2) \prod_{j=1}^m \prod_{i=1}^{n_j} p(y_{i,j} | \theta_j, \sigma^2) \\ &\propto (\sigma^2)^{-(\nu_0/2 + 1)} \exp \left\{ -\frac{\nu_0 \sigma_0^2}{2 \sigma^2} \right\} (\sigma^2)^{ \frac{-\sum_{j=1}^m n_j}{2} } \exp \left\{ -\frac{1}{2 \sigma^2} \sum_{j=1}^m \sum_{i=1}^{n_j} (y_{i,j} - \theta_j)^2 \right\} \\ &= (\sigma^2)^{- \left( \frac{1}{2} \left[\nu_0 \sum_{j=1}^m n_j \right] + 1 \right)} \exp \left\{ -\frac{1}{2 \sigma^2} \left[ \nu_0 \sigma_0^2 + \sum_{j=1}^m \sum_{i=1}^{n_j} (y_{i,j} - \theta_j)^2 \right] \right\} \\ \end{aligned}\]
より、
\[ \left\{ \frac{1}{\sigma^2} | \boldsymbol{\theta}, \boldsymbol{y}_1, \dots, \boldsymbol{y}_m \right\} \sim \text{gamma} \left( \frac{1}{2} \left[\nu_0 \sum_{j=1}^m n_j \right], \frac{1}{2} \left[ \nu_0 \sigma_0^2 + \sum_{j=1}^m \sum_{i=1}^{n_j} (y_{i,j} - \theta_j)^2 \right] \right) \]
\[\begin{aligned} \{\mu | \theta_1, \dots, \theta_m, \tau^2\} &\sim \text{normal}(\frac{ m\bar{\theta}/\tau^2 + \mu_0/\gamma_0^2 }{ m/\tau^2 + 1/\gamma_0^2 }, [m/\tau^2 + 1/\gamma_0^2]^{-1}) \\ \{1/\tau^2 | \theta_1, \dots, \theta_m, \mu\} &\sim \text{gamma}(\frac{\eta_0 + m}{2}, \frac{\eta_0 \tau_0^2 + \sum_{j=1}^m (\theta_j - \mu)^2}{2}). \\ \{\theta_j | y_{1,j}, \dots, y_{n_j,j}, \sigma^2 \} &\sim \text{normal}(\frac{ n_j\bar{y}_j/\sigma^2 + \mu/\tau^2 }{ n_j/\sigma^2 + 1/\tau^2 }, [n_j/\sigma^2 + 1/\tau^2]^{-1}) \\ \left\{ 1/\sigma^2 | \boldsymbol{\theta}, \boldsymbol{y}_1, \dots, \boldsymbol{y}_m \right\} &\sim \text{gamma} \left( \frac{1}{2} \left[\nu_0 \sum_{j=1}^m n_j \right], \frac{1}{2} \left[ \nu_0 \sigma_0^2 + \sum_{j=1}^m \sum_{i=1}^{n_j} (y_{i,j} - \theta_j)^2 \right] \right) \end{aligned}\]