大津の二値化法(おおつのにちかほう、Otsu's method、大津の方法などとも呼ばれる)とは、コンピュータビジョンや画像処理において、自動画像しきい値処理を行うために使用される手法。その名は大津展之にちなむ。最も単純な形式では、アルゴリズムはピクセルをforegroundとbackgroundの2つのクラスに分ける1つの強度しきい値を返す。このしきい値はクラス内の強度分散を最小化することにより、または同等にクラス間の分散を最大化することにより決定される。

大津の二値化はフィッシャーの判別分析の1次元の離散に相当するものであり、ジェンクス最適化法に関連しており、強度ヒストグラムで行われる大域最適なK平均法と同等である。マルチレベルのしきい値処理へ拡大することは最初の論文で説明されており、以降計算効率の高い実装が提案されている。

大津の二値化

アルゴリズムは、2つのクラスの分散の加重和として定義されるクラス内分散を最小化するしきい値を探す。

σ w 2 ( t ) = ω 0 ( t ) σ 0 2 ( t ) ω 1 ( t ) σ 1 2 ( t ) {\displaystyle \sigma _{w}^{2}(t)=\omega _{0}(t)\sigma _{0}^{2}(t) \omega _{1}(t)\sigma _{1}^{2}(t)}

加重 ω 0 {\displaystyle \omega _{0}} ω 1 {\displaystyle \omega _{1}} はしきい値 t {\displaystyle t} により分けられた2つのクラスの確率であり、 σ 0 2 {\displaystyle \sigma _{0}^{2}} σ 1 2 {\displaystyle \sigma _{1}^{2}} はこれら2つのクラスの分散である。

クラスの確率 ω 0 , 1 ( t ) {\displaystyle \omega _{0,1}(t)} はヒストグラムの L {\displaystyle L} 個のビンから計算される。

ω 0 ( t ) = i = 0 t 1 p ( i ) ω 1 ( t ) = i = t L 1 p ( i ) {\displaystyle {\begin{aligned}\omega _{0}(t)&=\sum _{i=0}^{t-1}p(i)\\[4pt]\omega _{1}(t)&=\sum _{i=t}^{L-1}p(i)\end{aligned}}}

2つのクラスでは、クラス内分散を最小化することはクラス間分散を最大化することと同じである。

σ b 2 ( t ) = σ 2 σ w 2 ( t ) = ω 0 ( t ) ( μ 0 μ T ) 2 ω 1 ( t ) ( μ 1 μ T ) 2 = ω 0 ( t ) ω 1 ( t ) [ μ 0 ( t ) μ 1 ( t ) ] 2 {\displaystyle {\begin{aligned}\sigma _{b}^{2}(t)&=\sigma ^{2}-\sigma _{w}^{2}(t)=\omega _{0}(t)(\mu _{0}-\mu _{T})^{2} \omega _{1}(t)(\mu _{1}-\mu _{T})^{2}\\&=\omega _{0}(t)\omega _{1}(t)\left[\mu _{0}(t)-\mu _{1}(t)\right]^{2}\end{aligned}}}

これはクラス確率 ω {\displaystyle \omega } とクラス平均 μ {\displaystyle \mu } で表され、クラス平均 μ 0 ( t ) {\displaystyle \mu _{0}(t)} μ 1 ( t ) {\displaystyle \mu _{1}(t)} および μ T {\displaystyle \mu _{T}} は、

μ 0 ( t ) = i = 0 t 1 i p ( i ) ω 0 ( t ) μ 1 ( t ) = i = t L 1 i p ( i ) ω 1 ( t ) μ T = i = 0 L 1 i p ( i ) {\displaystyle {\begin{aligned}\mu _{0}(t)&={\frac {\sum _{i=0}^{t-1}ip(i)}{\omega _{0}(t)}}\\[4pt]\mu _{1}(t)&={\frac {\sum _{i=t}^{L-1}ip(i)}{\omega _{1}(t)}}\\\mu _{T}&=\sum _{i=0}^{L-1}ip(i)\end{aligned}}}

である。以上の関係は以下のように簡単に確かめることができる。

ω 0 μ 0 ω 1 μ 1 = μ T ω 0 ω 1 = 1 {\displaystyle {\begin{aligned}\omega _{0}\mu _{0} \omega _{1}\mu _{1}&=\mu _{T}\\\omega _{0} \omega _{1}&=1\end{aligned}}}

クラス確率とクラス平均は、繰り返し計算することができる。このアイデアは効果的なアルゴリズムを生む。

アルゴリズム

  1. 各強度レベルのヒストグラムと確率を計算する。
  2. ω i ( 0 ) {\displaystyle \omega _{i}(0)} μ i ( 0 ) {\displaystyle \mu _{i}(0)} の初期値を設定する。
  3. t = 1 , {\displaystyle t=1,\ldots } 最大強度までの全ての考えうるしきい値で次のステップを行う。
    1. ω i {\displaystyle \omega _{i}} μ i {\displaystyle \mu _{i}} を更新する。
    2. σ b 2 ( t ) {\displaystyle \sigma _{b}^{2}(t)} を計算する。
  4. 望ましいしきい値は σ b 2 ( t ) {\displaystyle \sigma _{b}^{2}(t)} が最大となる値である。

MATLABまたはOctaveでの実装

histogramCountsはさまざまなグレーレベルのグレースケール画像(通常は8ビット画像)の256画素のヒストグラムである。levelは画像のしきい値 (double) である。


MatlabにはImage Processing Toolboxに組み込み関数graythresh()multithresh()があり、それぞれ大津の手法とマルチ大津の手法(Multi Otsu's method)で実装されている。

Pythonでの実装

この実装にはNumPyライブラリが必要である

OpenCVやScikit-imageなどの画像処理専用のPythonライブラリは、アルゴリズムの組み込み実装を提案する。

限界とバリエーション

大津の方法は、ヒストグラムが2つのピークの間に深く鋭い谷を持つ二峰性分布を有するときにうまく機能する。

他の全ての大域的なしきい値処理と同様に、ノイズが大きく、対象のサイズが小さく、明暗が不均一で、クラス内の分散がクラス間の分散よりも大きい場合にパフォーマンスが低下する。このような場合、大津の方法を局所的に適用することが開発されている。

さらに、大津の方法の数学的根拠は、画像のヒストグラムを分散が等しくサイズが等しい2つの正規分布の混合としてモデル化する。しかし、大津のしきい値処理はこれらの仮定を満たさない場合でも満足のいく結果をもたらす可能性がある。同様に統計検定(大津の方法が密接に関連する)は、動作の仮定が完全に満たされていない場合でも正しく実行される。しかし、これらの仮定から生じる深刻な逸脱を無くすために、Kittler-Illingworthの方法などの大津の方法のいくつかのバリエーションが提案されている。

ノイズの多い画像に対するバリエーション

大津の方法の限界に対処するためにさまざまな拡張が開発されてきた。人気のある拡張の1つは、ノイズの多い画像のオブジェクトセグメンテーションのタスクに適した2次元大津の方法である。ここでは、特定のピクセルの強度値をそのすぐ近傍の平均強度と比較することでセグメンテーション結果を改良する。

各ピクセルで、近傍の平均グレーレベル値が計算される。与えられたピクセルのグレーレベルを L {\displaystyle L} 個の離散値に分割し、平均グレーレベルも同じ L {\displaystyle L} 個の値に分割する。その後、ピクセルのグレーレベルと近傍の平均のペア ( i , j ) {\displaystyle (i,j)} が形成される。各ペアは L × L {\displaystyle L\times L} 個の考えうる2次元ビンの1つに属する。ペア ( i , j ) {\displaystyle (i,j)} の出現の総数(頻度) f i j {\displaystyle f_{ij}} を画像のピクセルの総数 N {\displaystyle N} で割ったものは、2次元ヒストグラムで同時確率密度関数を定義する。

P i j = f i j N , i = 0 L 1 j = 0 L 1 P i j = 1 {\displaystyle P_{ij}={\frac {f_{ij}}{N}},\qquad \sum _{i=0}^{L-1}\sum _{j=0}^{L-1}P_{ij}=1}

そして、2次元大津の方法は、2次元ヒストグラムに基づいて次のように開発されている。

2つのクラスの確率は、次のように表せる。

ω 0 = i = 0 s 1 j = 0 t 1 P i j ω 1 = i = s L 1 j = t L 1 P i j {\displaystyle {\begin{aligned}\omega _{0}&=\sum _{i=0}^{s-1}\sum _{j=0}^{t-1}P_{ij}\\\omega _{1}&=\sum _{i=s}^{L-1}\sum _{j=t}^{L-1}P_{ij}\end{aligned}}}

2つのクラスの強度平均ベクトルと合計平均ベクトルは次のように表せる。

μ 0 = [ μ 0 i , μ 0 j ] T = [ i = 0 s 1 j = 0 t 1 i P i j ω 0 , i = 0 s 1 j = 0 t 1 j P i j ω 0 ] T μ 1 = [ μ 1 i , μ 1 j ] T = [ i = s L 1 j = t L 1 i P i j ω 1 , i = s L 1 j = t L 1 j P i j ω 1 ] T μ T = [ μ T i , μ T j ] T = [ i = 0 L 1 j = 0 L 1 i P i j , i = 0 L 1 j = 0 L 1 j P i j ] T {\displaystyle {\begin{aligned}\mu _{0}&=[\mu _{0i},\mu _{0j}]^{T}=\left[\sum _{i=0}^{s-1}\sum _{j=0}^{t-1}i{\frac {P_{ij}}{\omega _{0}}},\sum _{i=0}^{s-1}\sum _{j=0}^{t-1}j{\frac {P_{ij}}{\omega _{0}}}\right]^{T}\\\mu _{1}&=[\mu _{1i},\mu _{1j}]^{T}=\left[\sum _{i=s}^{L-1}\sum _{j=t}^{L-1}i{\frac {P_{ij}}{\omega _{1}}},\sum _{i=s}^{L-1}\sum _{j=t}^{L-1}j{\frac {P_{ij}}{\omega _{1}}}\right]^{T}\\\mu _{T}&=[\mu _{Ti},\mu _{Tj}]^{T}=\left[\sum _{i=0}^{L-1}\sum _{j=0}^{L-1}iP_{ij},\sum _{i=0}^{L-1}\sum _{j=0}^{L-1}jP_{ij}\right]^{T}\end{aligned}}}

ほとんどの場合、非対角の確率はわずかであるため、次のことを簡単に確認することができる。

ω 0 ω 1 1 {\displaystyle \omega _{0} \omega _{1}\cong 1}
ω 0 μ 0 ω 1 μ 1 μ T {\displaystyle \omega _{0}\mu _{0} \omega _{1}\mu _{1}\cong \mu _{T}}

クラス間離散行列は次のように定義される。

S b = k = 0 1 ω k [ ( μ k μ T ) ( μ k μ T ) T ] {\displaystyle S_{b}=\sum _{k=0}^{1}\omega _{k}[(\mu _{k}-\mu _{T})(\mu _{k}-\mu _{T})^{T}]}

離散行列のトレースは次のように表される。

tr ( S b ) = ω 0 [ ( μ 0 i μ T i ) 2 ( μ 0 j μ T j ) 2 ] ω 1 [ ( μ 1 i μ T i ) 2 ( μ 1 j μ T j ) 2 ] = ( μ T i ω 0 μ i ) 2 ( μ T j ω 0 μ j ) 2 ω 0 ( 1 ω 0 ) {\displaystyle {\begin{aligned}&\operatorname {tr} (S_{b})\\[4pt]={}&\omega _{0}[(\mu _{0i}-\mu _{Ti})^{2} (\mu _{0j}-\mu _{Tj})^{2}] \omega _{1}[(\mu _{1i}-\mu _{Ti})^{2} (\mu _{1j}-\mu _{Tj})^{2}]\\[4pt]={}&{\frac {(\mu _{Ti}\omega _{0}-\mu _{i})^{2} (\mu _{Tj}\omega _{0}-\mu _{j})^{2}}{\omega _{0}(1-\omega _{0})}}\end{aligned}}}

ここで

μ i = i = 0 s 1 j = 0 t 1 i P i j {\displaystyle \mu _{i}=\sum _{i=0}^{s-1}\sum _{j=0}^{t-1}iP_{ij}}
μ j = i = 0 s 1 j = 0 t 1 j P i j {\displaystyle \mu _{j}=\sum _{i=0}^{s-1}\sum _{j=0}^{t-1}jP_{ij}}

1次元の大津の方法と同様に、最適なしきい値 ( s , t ) {\displaystyle (s,t)} は、 tr ( S b ) {\displaystyle \operatorname {tr} (S_{b})} を最大化することで取得される。

アルゴリズム

s {\displaystyle s} t {\displaystyle t} は、1次元の大津の方法と同様に繰り返し取得される。 s {\displaystyle s} t {\displaystyle t} の値は、 tr ( S b ) {\displaystyle \operatorname {tr} (S_{b})} の最大値を取得するまで変更される。つまり、

tr ( S b ) {\displaystyle \operatorname {tr} (S_{b})} を評価するために、高速再起動的プログラミングアルゴリズムを使用して時間パフォーマンスを向上させることができることに留意してください。しかし、動的プログラミングのアプローチを使用しても、2次元大津の方法は依然として時間計算量が非常に複雑である。したがって、計算コストを削減するために多くの研究が行われてきた。

合計領域テーブルを使用して3つのテーブルを作製する場合は、 P i j {\displaystyle P_{ij}} を合計し、 i P i j {\displaystyle i*P_{ij}} を合計し、 j P i j {\displaystyle j*P_{ij}} を合計し、その時のランタイムの複雑性は(O(N_pixels), O(N_bins*N_bins))の最大値である。しきい値に関して粗い解像度のみが必要な場合はN_binsを減らすことができることに注意してください。

en:Summed-area table参照

Matlabでの実装

関数の入力と出力

histsは、グレースケール値と近傍平均グレースケール値のペアの 256 × 256 {\displaystyle 256\times 256} の2次元ヒストグラムである。

totalは、所与の画像のペアの数である。これは各方向の2次元ヒストグラムのビンの数により決まる。

thresholdは取得されたしきい値である。

不平衡な画像に対するバリエーション

画像のクラスのグレーレベルは正規分布とみなすことができるが、サイズや分散が等しくない場合、大津のアルゴリズムの仮定は満たされない。Kittler-Illingworthのアルゴリズム(最小エラーしきい値処理とも呼ばれる)はこのような場合を処理するための大津の方法のバリエーションである。このアルゴリズムを数学的に説明する方法はいくつかある。それらの1つは、試験される各しきい値について結果の2値画像の正規分布のパラメータがデータが与えられた最尤推定により推定されたことを考慮することである。

このアルゴリズムは大津の方法よりも優れているように見えることがあるが、推定される新しいパラメータが導入されるためアルゴリズムが過剰パラメータ化されて不安定になる可能性がある。大津の方法からの仮定が少なくとも部分的に有効であると考えられる多くの場合において、オッカムの剃刀に従ってKittler-Illingworthのアルゴリズムよりも大津の方法を優先する方が好ましい場合がある。

出典

外部リンク

  • Implementation of Otsu's thresholding method as GIMP-plugin using Script-Fu (a Scheme-based language)
  • Lecture notes on thresholding – covers the Otsu method
  • A plugin for ImageJ using Otsu's method to do the threshold
  • A full explanation of Otsu's method with a working example and Java implementation
  • Implementation of Otsu's method in ITK
  • Otsu Thresholding in C# – a straightforward C# implementation with explanation
  • Otsu's method using MATLAB
  • Otsu Thresholding with scikit-image in Python

OpenCVでつくろうARスタンプアプリ in 熊本 (2ページ目) Togetter [トゥギャッター]

2値化(大津の2値化) 画像認識の技術ブログ マクセルフロンティア株式会社

画像処理(二値化)

ムラ太の画像処理クイズ2「ヒストグラム」 画像認識の技術ブログ マクセルフロンティア株式会社

OpenCVでつくろうARスタンプアプリ in 熊本 (2ページ目) Togetter [トゥギャッター]