SSブログ

最小2乗法 - その4 [最小2乗法のイメージ]

せっかく行列を考えたんだからすこし違う方向から見ていることにする。式-8をもういちど考える。
1123eq25.png
これは不能の方程式だった...

4  代数的な考え方

式-8(すなわち式-25)を行列で書いてみると
1123eq26.png
となる。この行列G′はn > mなので縦長の行列になっている。この代数的な構造を考えてみる。

図-1のように、このG′はm次元ベクトル空間Rmからn次元ベクトル空間Rnへの写像と見ることができる。像空間IG′の列ベクトルの張る空間である。何度も書くけどn > mなのでG′の列ベクトルがすべて独立だったとしても像空間はRn全体を張ることはできない。つまり像空間はRnの真部分空間になる。
1123fig01.png
もし、yが像空間Iの中にあれば解があるが、必ずしもそうではない。従って一般的には条件が多すぎるので解はない、ということになる。

これをもう少しわかりやすくするために、例としてn=3、m=2の場合を考えてみる。その場合G′は3行2列の行列で、R2からR3への写像になる。

図-2のようにyは3次元空間内にある。いっぽう像空間Iは平面になる。
1123fig02.png
Gaは図中のrのようにI内にしかない。そして一般的にはyI内にはないので、aをどのようにとったとしてもGayと一致させることはできない。つまり解はない。

では、一歩さがって図-3のようなI内でyにもっとも近いベクトルを探すことにしよう。
1123fig03.png
この「もっとも近い」というのは図中のϵが最も短くなるrを次善の解としよう、ということである。

式-26からこのϵは
1123eq28.png
である。

これが一番短くなるのは、長さを計算するまでもなく、Iと直交する、つまりrとの内積が0になる場合である。すなわち
1123eq29.png
ベクトルの内積は行列の積と同じスタイルで書くと
1123eq29a.png
なのでこれで書き換えて整理すると
1123eq30.png
この式は両辺スカラなので方程式としては数が足りない。しかし、aが0ベクトルでは意味がない(解ではない)ので
1123eq31.png
である必要がある。これは式だけ見てるとわからないけど両辺m個の要素のベクトルである。つまりこれだと式と変数の数が一致している。もうすこし書き換えると
1123eq32.png
となる。行列で書いてあるけど、G′は式-27にある通り
1123eq33.png
だった。

従って
1123eq33a.png
だから、式-32を要素で書くと
1123eq34.png
となる。ということは式-32は式-13とまったく同じ、ということになる。ちなみに式-32の形のほうを正規方程式と呼ぶこともある(中身は同じだけど)。

つまりどういうことかというと、誤差の2乗和を最小にするという条件は、条件過剰の方程式系に対して実現可能なものの中でもっとも「近い」ものを選ぶのと同じになる、ということである。これはもとはといえばベクトルの長さをユークリッドノルムで測る、ということに起因している。

この辺のことを良く知ってる人にとってはこのこと、つまり残差の2乗和を最小にすることと、代数的に近いベクトルを解とすることが一致するのはごく当たり前のことである。しかし、僕はその昔この事実に気がついたとき、代数のイメージは面白いと思った。
nice!(0)  コメント(0)  トラックバック(0) 

nice! 0

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

トラックバック 0

献立11/23献立11/24 ブログトップ

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。