Ruan Yifeng: ガウスぼかしアルゴリズム

Ruan Yifeng: ガウスぼかしアルゴリズム

通常、画像処理ソフトウェアには、画像にぼかし効果を加えるための「ぼかし」フィルターが用意されています。

「ぼかし」アルゴリズムは多数ありますが、そのうちの 1 つは「ガウスぼかし」と呼ばれます。画像処理には正規分布(「ガウス分布」とも呼ばれます)を使用します。

この記事では「ガウスぼかし」アルゴリズムを紹介します。これは非常にシンプルで理解しやすいアルゴリズムであることがわかります。本質的には、これは多くの場面に適用できるデータ平滑化技術であり、画像処理は直感的な応用例を提供します。

1. ガウスぼかしの原理

いわゆる「ぼかし」は、各ピクセルが周囲のピクセルの平均値を取るものとして理解できます。

上の図では、2 が中央の点であり、周囲の点はすべて 1 です。

「中間点」は「周囲の点」の平均をとって 1 になります。数値的には、これは一種の「平滑化」です。グラフィック的には、これは「ぼやけた」効果に相当し、「中間点」の詳細が失われます。

当然ですが、平均を計算する際の値の範囲が広くなればなるほど、「ぼかし効果」は強くなります。

上記は、元の画像、ぼかし半径 3 ピクセル、ぼかし半径 10 ピクセルの画像です。ぼかし半径が大きいほど、画像はぼやけます。数値的に見ると、値はより滑らかになります。

次の質問は、各ポイントは周囲のピクセルの平均値を取る必要があるため、重みはどのように割り当てるべきかということです。

単純な平均化を使用する場合、画像は連続しており、点が近いほど関係が近くなり、点が遠いほど関係が遠くなるため、明らかにあまり合理的ではありません。したがって、加重平均の方が合理的であり、ポイントが近いほど重みが大きくなり、ポイントが遠いほど重みが小さくなります。

2. 正規分布の重み

正規分布は明らかに望ましい重量分布パターンです。

グラフ上では、正規分布はベル型の曲線です。中心に近いほど値は大きくなり、中心から離れるほど値は小さくなります。

平均値を計算するときは、「中心点」を原点として使用し、正規曲線上の位置に応じて他の点に重みを割り当てるだけで、加重平均値が得られます。

3. ガウス関数

上記の正規分布は 1 次元ですが、画像は 2 次元なので、2 次元の正規分布が必要です。

正規分布の密度関数は「ガウス関数」と呼ばれます。その 1 次元形式は次のとおりです。

ここで、μ は x の平均、σ は x の分散です。平均を計算する場合、中心点が原点となるため、μ は 0 になります。

1 次元ガウス関数に従って、2 次元ガウス関数を導出できます。

この関数を使用すると、各ポイントの重みを計算できます。

4. 重みマトリックス

中心点の座標が (0,0) であると仮定すると、それに最も近い 8 つの点の座標は次のようになります。

[[98012]]

その他のポイントも同様です。

重み行列を計算するには、σ の値を設定する必要があります。 σ=1.5 と仮定すると、ぼかし半径 1 の重み行列は次のようになります。

これら 9 つのポイントの重みの合計は 0.4787147 です。これら 9 つのポイントの加重平均のみを計算する場合、それらの重みの合計は 1 に等しくなければなりません。したがって、最終的な重みマトリックスを取得するには、上記の 9 つの値を 0.4787147 で割る必要があります。

5. ガウスぼかしを計算する

重みマトリックスを使用すると、ガウスぼかし値を計算できます。

ピクセルが 9 個あり、グレースケール値 (0 ~ 255) が次のとおりであると仮定します。

各ポイントには、そのポイント独自の重み値が掛けられます。

得る

これら 9 つの値を合計したものが中心点のガウスぼかし値になります。

このプロセスをすべてのポイントに対して繰り返すと、ガウスぼかし画像が得られます。元の画像がカラー画像の場合、3 つの RGB チャネルに対して個別にガウス ブラーを実行できます。

6. 境界点の処理

ある点が境界上にあり、その周囲に十分な点がない場合はどうなるでしょうか?

回避策としては、既存のポイントを反対側の対応する位置にコピーして、完全なマトリックスをシミュレートします。

オリジナルリンク: http://www.ruanyifeng.com/blog/2012/11/gaussian_blur.html

<<:  すべての最大共通部分列を見つけるためのアルゴリズムの実装

>>:  ルーティングテーブルとルーター選択アルゴリズム

ブログ    
ブログ    
ブログ    

推薦する

顔認識技術の開発と実用的なソリューションの設計

顔認識技術は、Google、Facebook、Alibaba、Tencent、Baiduなどの国内外...

NeuRAD: 自動運転のためのニューラル レンダリング (複数のデータセットでの SOTA)

論文「NeuRAD: 自動運転のためのニューラル レンダリング」は、Zenseact、チャルマース工...

...

第19回全国大会報告書に人工知能が盛り込まれました!私の国のAIの4つの大きな利点と唯一の欠点

[[206874]]昨日、中国共産党第19回全国代表大会が開幕した。 AIの重要なポイントを強調して...

...

ロボットによるカスタマーサービスが本物か偽物かを見分けるのは難しいですか? !

[51CTO.com 速訳] 海外メディアの報道によると、ニュージーランドのソウルマシーンズ社は最...

Web3.0時代: インターネット上で作成したものはすべてあなたのものになります

Web3.0 の最も特別な点は、ユーザーが作成したデジタル コンテンツの所有権と管理権がユーザーに...

人工知能と現代の香水の発展

嗅覚系は、感情と連合学習を司る脳の領域に直接つながっている、体内の唯一の感覚系です。これが、匂いがこ...

【ビッグネーム登場、第2話】快溝タクシーの知能進化への道

インテリジェントな注文発送システムをゼロから構築するように依頼され、1 日の注文数が 40 万件だと...

人工知能がインターネットのパフォーマンスに与える影響

[[344519]]インテリジェント エッジ プラットフォームである Akamai のインスピレーシ...

人間を倒すのは人間自身であり、人工知能は人間を倒すだろう

私たちが住む世界では、炭素をベースとするほぼすべての生物は、遺伝子をその特異性の根拠として利用してい...

MetaHuman の効果は素晴らしいです!しかし、メタバースだけを考えると、パターンは少し小さくなります。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

「百度脳産業イノベーションフォーラム」が本格始動、伝統産業向けAIソリューションを提案

「将来、AIとは何の関係もないと主張する企業はなくなるだろう」これは、2018年の世界人工知能会議で...

人工知能の時代において、ロボットを超える子どもたちが身につけるべき能力とは何でしょうか?

[[428042]]今後予測できることは、人工知能の時代が徐々に深まり、私たちの生活がSF映画のリ...

清華大学と中国人工知能学会が2019年人工知能開発報告書を発表

2019年中国人工知能産業年次大会で「2019年人工知能発展報告書」が発表されました。唐潔教授は、関...