2024年9月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          
無料ブログはココログ

« ・北海道絶景名所2 | トップページ | ・フィルターホルダーKANIとNisi比較 »

2019年7月 6日 (土)

・GANによる画像処理

GANはディープラーニングの一種です。
ディープラーニングを用いて、カメラ用途では様々な応用ができますが
弱点もあります。
それは大量のデータが必要となることです。
機械学習のために、大量の画像データとタグ付けをしなければいけません。
このデータを集めるのが一番大変といっても過言ではありません。

しかも最近は、プライバシーなどの問題で
顔認識などに用いる顔画像は集めにくくなっています。

この問題を解決できる手段の一つがGANという手法です。
GANとはGenerative Adversarial Networkのことで、
日本語に訳すと「敵対的生成ネットワーク」

生成ネットワークなので、何かしらの画像を作成します。

Cat1 Cat2
このサイトは存在しないネコ(AIが生成)がF5を押すたびに生成されます。
ちょっと不自然なところもあったりしますが、
人物の顔などでやると、実在しない人物が生成できるため
肖像権が問題になりません。

GANは画像を生成するジェネレータ部と
生成された画像が本物か偽物か判断するディスクリミネイタ部で構成されます。

Gan

ジェネレータ部で学習によって作成された画像が
ディスクリミネイタ部で本物の写真かどうか判断します。
ジェネレータ部はディスクリミネイタをだませるように
どんどん本物っぽい画像が作れるように成長します。
一方、ディスクリミネイタ部は偽物に騙されないように
どんどん判断の精度を上げていきます。
最終的には本物か偽物か判断できないレベルの画像を作ることができます。

GANによって大量の本物っぽいデータを作ることができれば、
ディープラーニングで大変なデータ集めをクリアすることが可能。

GANの例として、GANを用いた画像拡大のソフトを紹介します。
GigapixelA.I.

2004年に300万画素のカメラで撮影した画像
P8080107
等倍拡大
P8080107_2

この画像を400%拡大します(5000万画素相当)
左:Photoshopで拡大 右:GigapixelAIで拡大
P8080107big_all
かなり精細に拡大できています。
ただし、これはGANで拡大時に作り出した画像なので
実物と違っている可能性があります。
だけど、自然風景とかだと実物がわからないので違和感がない。

Big_all

Big_all_20190706112101

正解を知っているものだと違和感が生じます。

左:Photoshopで拡大 右:GigapixelAIで拡大
Dsc_0036_soi20bs2_iso00052_outs_big_all
和食・酒の文字が象形文字みたいになってしまった。

一年前に比べて、GANによる画像拡大もかなり良くなりましたが
まだ電子ズームの代わりとしてはつらいところがあります。

にほんブログ村 写真ブログ デジタル一眼(PENTAX)へ
にほんブログ村

 

« ・北海道絶景名所2 | トップページ | ・フィルターホルダーKANIとNisi比較 »

写真講座」カテゴリの記事

コメント

コメントを書く

(ウェブ上には掲載しません)

« ・北海道絶景名所2 | トップページ | ・フィルターホルダーKANIとNisi比較 »