第6章 特徴空間の変換(2)

特徴空間の変換

  1. 正規化
  2. 次元の削減
    1. より良い特徴量を選択
    2. 線形変換により次元を削減
  3. 識別に適した空間を作る⇒Fisherの方法

KL展開

KL展開は識別に適した空間を作っているわけではない。
KL展開により、元の空間をできるだけ保存したより次元の低い空間を作ることができる。
d次元ベクトルx1,x2,・・・,xnに対応するスカラーy1,y2,・・・,ynを作ることを考える。
\mathbf{m}=\bar{\mathbf{x}}=\frac{1}{n}\sum_{p=1}^n \mathbf{x}_p
\tilde{m}=\frac{1}{n}\sum_{p=1}^n y_p=\frac{1}{n}\sum_{p=1}^n w^tx_p=w^tm
\begin{matrix} \tilde{\sigma}^2 & = & \overline{(y-\tilde{m})^2} \\ & = & \overline{(\mathbf{w}^t \mathbf{x}-\mathbf{w}^t\mathbf{m})^2} \\ & = & \mathbf{w}^t \overline{(\mathbf{x}-\mathbf{m})(\mathbf{x}-\mathbf{m})^t}\mathbf{w} \\ & = & \mathbf{w}^t \Sigma \mathbf{w} \end{matrix}
ただしΣは共分散行列:\Sigma = \frac{1}{n}\sum_{p=1}^n (\mathbf{x}_p-\mathbf{m})(\mathbf{x}_p-\mathbf{m})^t
Σの(d個の)固有値固有ベクトルを求めると、
\Sigma \mathbf{w}_j = \lambda_j\mathbf{w}_j (j=1,...,d)
基底ベクトルの正規直交性より
\mathbf{w}_i^t\mathbf{w}_j=\delta_{ij}*1
したがって
\begin{matrix} \tilde{\sigma}_j^2 & = & w_j^t \Sigma w_j \\ & = &  \lambda_j w_j^t w_j \\ & = & \lambda_j \end{matrix}

(考えてる間に講義に置いてかれた。)

新しい空間に変換すると
\mathbf{y}=W^t\mathbf{x}

  1. \tilde{\Sigma} = \Lambda
  2. ||\mathbf{y}||=\mathbf{y}^t\mathbf{y}=\mathbf{x}^tWW^t\mathbf{x}=\mathbf{x}^t\mathbf{x}=||\mathbf{x}||
  3. 主軸x1⇒y1
  4. \tilde{\sigma}^2=\lambda_j固有値の大きい軸が前に来る)
KL展開の計算手順(こっちのほうがわかりやすい)
  1. 平均ベクトルmを求める
  2. 共分散行列Σを求める(mを使う)
  3. 共分散行列Σの固有値固有ベクトル(d組)を求める。
    • このときλの大きい順に並べておく。
  4. 全部でd個あるうち、(次元削減のため)d^組先頭から持ってくる
  5. y_j=\mathbf{w}_j^t\mathbf{x} (j=1,...,d\^ )で変換する。
注意すべき点
  1. 次元数dとパターン数m:パターン数と次元数(特徴数)が同数あるほどパターンが少ない場合、Σが正則でなくなる。
  2. 相関の強い特徴を増やしても、固有ベクトルが0になるだけ。

KL展開は、分散を大きくするだけで、分離するわけではないが、フィッシャーの方法は分離するように軸を作る。

試験:7/19予定