SSブログ

楽譜アーカイブアプリ - その26 ヒストグラムによるノイズ除去 [考え中の問題]

一昨日からスキャン画像のノイズ除去を考え始めた。対象にしているのが一般の画像ではなく楽譜なので、例えば孤立点を取り除くようなノイズ除去アルゴリズムでは付点音符の「テン」が無くなってしまいかねない。昨日はFourier変換を使う方法を考えた。使い慣れているのでわかりやすいが、いろいろなノイズを対象にしようとするとパラメータが増えてしまう。それに何かと言えばFourier変換ばっかしだし。もうちょっと違うやり方を考えてみる。

9.3.1  ヒストグラムデータから

ラティテュード補正のときにヒストグラムデータを作る。これを利用できないか。ノイズ除去と言ってもスペース部(何も書かれていない部分)を検出できればいいだけだし。

例えば
  1. 全体をタイルに分割する
  2. タイルごとのヒストグラムを計算する
  3. スペース部は黒が少ないはず、ある基準を作ってそれを検出する
  4. スペース部と判断されたらそのタイル全体を白で塗りつぶす
とするのはどうか。元のデータはモノクロ画像であり、もしちゃんと読めていたら図-9.1のようになるだろう。
0128fig0901.png
赤線は楽譜のある部分で青線は何も書かれていないスペース部である。真っ白と真っ黒のピクセルが多く、そこにピクセル数のピークがあるのが楽譜のある部分で、スペース部は黒のピークがなくなるはず。こういう特徴の差を見つければいい。

ところがこんな条件のいいデータはないだろう。たいてい図-9.2こんなだろう。しかしこれでもピークがふたつあるかどうかで判断できるだろう。
0128fig0902.png
では図-9.3のようなデータになったらどうだろう。
0128fig0903.png
これはコントラストが悪く、白と黒の区別があまりついていない場合である。インクの色が飛んだ上に紙が変色しているような場合である。こんなのでも人間が見ればちゃんと読めたりするものである。

これを何らかの基準を設けてスペースかそうでないかを判断するのは難しい。

さらに、図-9.4のような場合もあるだろう。
0128fig0904.png
これはいわゆる「ノイズに埋もれる」という場合である。この場合は人間が見ても判断できないようなこともあるだろう。

図-9.3や図9.4のようなヒストグラムのなった場合は白旗をあげるしかないだろうな。

なやましいのは図-9.5のような場合。
0128fig0905.png
これはやはり青線はスペース部だろうけど、これをプログラマチックに判断するにはどうすればいいか。それにあんがいこういうデータが多いかもしれない。

ちょっと実際のデータを取ってみてどういう傾向が一般的かを見る必要がある。
nice!(0)  コメント(0)  トラックバック(0) 

nice! 0

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

トラックバック 0

献立01/28献立01/29 ブログトップ

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。