・GANによる画像処理
GANはディープラーニングの一種です。
ディープラーニングを用いて、カメラ用途では様々な応用ができますが
弱点もあります。
それは大量のデータが必要となることです。
機械学習のために、大量の画像データとタグ付けをしなければいけません。
このデータを集めるのが一番大変といっても過言ではありません。
しかも最近は、プライバシーなどの問題で
顔認識などに用いる顔画像は集めにくくなっています。
この問題を解決できる手段の一つがGANという手法です。
GANとはGenerative Adversarial Networkのことで、
日本語に訳すと「敵対的生成ネットワーク」
生成ネットワークなので、何かしらの画像を作成します。
このサイトは存在しないネコ(AIが生成)がF5を押すたびに生成されます。
ちょっと不自然なところもあったりしますが、
人物の顔などでやると、実在しない人物が生成できるため
肖像権が問題になりません。
GANは画像を生成するジェネレータ部と
生成された画像が本物か偽物か判断するディスクリミネイタ部で構成されます。
ジェネレータ部で学習によって作成された画像が
ディスクリミネイタ部で本物の写真かどうか判断します。
ジェネレータ部はディスクリミネイタをだませるように
どんどん本物っぽい画像が作れるように成長します。
一方、ディスクリミネイタ部は偽物に騙されないように
どんどん判断の精度を上げていきます。
最終的には本物か偽物か判断できないレベルの画像を作ることができます。
GANによって大量の本物っぽいデータを作ることができれば、
ディープラーニングで大変なデータ集めをクリアすることが可能。
GANの例として、GANを用いた画像拡大のソフトを紹介します。
GigapixelA.I.
この画像を400%拡大します(5000万画素相当)
左:Photoshopで拡大 右:GigapixelAIで拡大
かなり精細に拡大できています。
ただし、これはGANで拡大時に作り出した画像なので
実物と違っている可能性があります。
だけど、自然風景とかだと実物がわからないので違和感がない。
正解を知っているものだと違和感が生じます。
左:Photoshopで拡大 右:GigapixelAIで拡大
和食・酒の文字が象形文字みたいになってしまった。
一年前に比べて、GANによる画像拡大もかなり良くなりましたが
まだ電子ズームの代わりとしてはつらいところがあります。
« ・北海道絶景名所2 | トップページ | ・フィルターホルダーKANIとNisi比較 »
「写真講座」カテゴリの記事
- ・面内ブレ(ブラー)を防ぐ(2024.09.12)
- ・星をより輝くように見える現像方法 (疑似ソフトフィルター)(2024.09.01)
- ・アトムレンズの黄変を直す2(2024.08.12)
- ・laowa 10mmF2.8 ZERO-Dを確認(2024.07.31)
- ・laowa 45mm F0.95で星撮影/ホタル撮影(2024.07.28)
コメント