GAN10年の進化：ハイブリッド化、人間中心、産業利用へ

2023.09.06

画像・Vision（画像認識、VLM、マルチモーダル、OCR）

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

【GANの10年】今年はGANが誕生して10年目です。以下は、歴史的研究の抜粋です。

○ Tanujit Chakraborty et al. Ten Years of Generative Adversarial Nets (GANs): A survey of the state-of-the-art

■2014年
GANが初めて誕生する

■2015年
高品質な画像を生成できるようになる（DCGAN）

■2016年
特定の条件で生成できるようになる（Conditional GAN）

■2017年
・ペアのないデータでの画像変換（CycleGAN）
・学習安定性の向上（Wasserstein GAN）
・テキストから高解像度の画像生成（StackGAN）
などができるようになる

■2018年
・解像度を段階的に高めること（ProGAN）
・動画の生成（VGAN）
などができるようになる

■2019年
多様なスタイルと特徴で画像生成できるようになる（StyleGAN）

■2020年
強化学習を用いたテキスト生成ができるようになる（SeqGAN）

■2021年
医療画像の効果的なセグメンテーションに使用される（RescueNet（unpaired GAN））

■2022年
・Transformerと統合して高解像度化（TransGAN）
・都市計画と交通管理に関するデータ生成（MetroGAN）
などができるようになる

■2023年
・都市の持続可能性の評価（RidgeGAN）
・LLMと統合してText2Audio（Mega-TTS）
などができるようになる

この10年を経て、GANが多様な分野で高度な問題に取り組むようになっていることが読み取れます。

論文によると、今後のトレンドは、①「ハイブリッド化」②「人間中心のGAN」③「産業利用」④「都市計画」⑤「地球科学」とのこと。

なお、最新のGANモデルは、一般的には過去のモデルを多くの側面で凌駕しています。しかし、特定のテーマや応用分野においては、過去のモデルが依然としてSOTAを維持している場合もあります。

○ 参照論文

📎 論文を読む（arxiv.org）

こちらもどうぞ