画像の二値化について

はじめに

画像の二値化とは、あるグレー画像（8bit）を白（255）と黒（0）の 2 色のみの二値画像（1bit）に変換する処理のことです。閾値を設けることで、ある値以上のピクセルを白、ある値未満のピクセルを黒といったように変換します。画像を 2 色に変換することで画像処理の対象物の境界が明確になり様々な画像分析が可能になります。例えば、画像中にある物体の境界を明確化することによって物体検出をしやすくしたり、物体面積の算出を行ったりできます。本記事ではその画像の二値化の流れと代表的な手法について紹介します。

二値化の概要

画像の二値化は画像から物体の輪郭を抽出する処理です。対象物体の輪郭をきれいに抽出するためには適切な閾値の設定を行う必要があります。そこで、画像から得られる情報をもとに自動的に閾値を決定する手法「適応的二値化」「大津の二値化（判別分析法）」について紹介してます。

大津の二値化（判別分析法）

大津の二値化はグレースケール画像のヒストグラムを求め、分離度がもっとも大きくなるときの画素値を閾値にします。

以下は画素値を x 軸、画素の数を y 軸にとるヒストグラムの例です。

アルゴリズム

大津の二値化の処理手順は以下の通りです。

1.　入力からヒストグラムを求める。

2.　ヒストグラムから最大値 $I_{max}$ 、最小値 $I_{min}$ 、平均値 $\mu_{0}$ を求めます。

3.　 $I_{min}～I_{max}$ の範囲内で、ある閾値 T を選びます。

4.　閾値 T でヒストグラムを 2 つのクラスに分離します。

5.　クラスごとの分散 $\sigma_{n}^{2}$ 、平均値 $\mu_{n}$ 、画素数 $p_{n}$ を求めます。

6.　以下の式でクラス内分散 $\sigma_{w}^{2}$ とクラス間分散 $\sigma_{b}^{2}$

\sigma_{w}^{2} = \frac{p_1\sigma_{1}^{2}+p_2\sigma_{2}^{2}}{p_1+p_2}

\sigma_{b}^{2} = \frac{p_1\lparen\mu_1 - \mu_0\rparen^2 + p_2\lparen\mu_2 - \mu_0\rparen^2}{p_1 + p_2}

6 で求めた分散から分離度 $S$ （クラス内、クラス外分散の比）を求める。

S = \frac{\sigma_{b}^{2}}{\sigma_{w}^{2}}

8.　３～７を繰り返し、分離度 $S$ を $I_{min}～I_{max}$ の範囲内にあるすべての $T$ の分だけ求め、分離度 $S$ が最大になる T を二値化処理に用いる閾値に決定します。

適応的二値化

適応的二値化処理は小領域を設定し、画像中の小領域ごとに閾値の値を計算します。そのため領域ごとに光源環境が変わってしまうような画像に対して有効です。

アルゴリズム

以下の画像は 3x3 の局所領域（近傍 8 画素）で適応的二値化処理の例です。

結果の比較

大津の二値化と適応的二値化の比較画像です。

大津の二値化はパラメータが少なく、処理が高速なため、組み込みに使われることが多いそうですが、画像の輝度のムラがある場合うまく処理を行ってくれません。対して、適応的二値化は部分的な輝度のムラがある場合でもうまく二値化できることができています。

まとめ

今回は代表的な二値化処理手法である大津の二値化と適応的二値化処理にういて紹介しました。opencv ライブラリで今回紹介した 2 つの二値化処理を実装することができます。両方ともメリット、デメリットがあるため、タスクに応じて使い分けるのがよいでしょう。

画像の二値化について

はじめに

二値化の概要

大津の二値化（判別分析法）

アルゴリズム

適応的二値化

アルゴリズム

結果の比較

まとめ

参考