マイクロソフトのオープンソースAIツールが古い写真に新たな命を吹き込む

マイクロソフトのオープンソースAIツールが古い写真に新たな命を吹き込む

序文

GitHub Hot Trends Vol.046では、HGがMicrosoftのオープンソースAIツール「Bringing-Old-Photos-Back-to-Life」を紹介しました。

傷んだ古い写真に新たな命を吹き込むことができ、今週は 3,000 個近くの星を獲得しました。 この記事は、プロジェクトチームメンバーのZiyu WanがHacker Newsに掲載したプロジェクト紹介です。お楽しみください〜

概要

私たちはディープラーニングの手法を使って、劣化した古い写真を復元するつもりです。従来の教師あり学習による復元タスクとは異なり、実際の写真の経年劣化はより複雑であり、合成画像と実際の古い写真との間のドメインギャップにより、ネットワークは一般化できません。そこで、実際の写真と多数の合成画像ペアの両方を活用する、新しいトリプルドメイン翻訳ネットワークを提案します。具体的には、2 つの変分オートエンコーダ (VAE) をトレーニングして、古い写真ときれいな写真をそれぞれ 2 つの潜在空間に変換します。 ペアになったデータを合成して、2 つの潜在空間間の変換を学習します。コンパクトな潜在空間ではドメインギャップが閉じられているため、この翻訳ネットワークは実際の写真にうまく一般化できます。

さらに、古い写真に混在する複数の劣化問題に対処するために、傷やほこりなどの構造的欠陥を処理するための部分的な非ローカル ブロックを備えたグローバル ブランチと、ノイズやぼやけなどの非構造的欠陥を処理するためのローカル ブランチを設計します。 2 つのブランチは潜在空間で融合され、複数の劣化問題から古い写真を回復する能力が向上します。この方法は、写真の復元の視覚的な品質の点で既存の方法よりも優れています。

アーキテクチャの概要

  1. まず、2 つの変分オートエンコーダ (VAE) をトレーニングします。VAE1 は実際の写真 r ∈ R と合成画像 x ∈ X 用で、敵対的識別器を共同でトレーニングすることでドメインギャップを狭めます。VAE2 はクリーンな画像 y ∈ Y 用です。 VAE は、画像をコンパクトな潜在空間に変換するために使用されます。

  2. 破損した画像から、コンパクトな潜在空間内の部分的な非ローカル ブロックを含むクリーンな写真へのマッピングを学習します。

比較表

修復の詳細

クローズアップ表示

チームメンバーの Ziyu Wan が Bringing-Old-Photos-Back-to-Life の紹介を翻訳しました。興味のある方はぜひ試してみてください。プロジェクトのアドレスは次のとおりです。

  1. https://github.com/microsoft/古い写真を復活させる

<<:  すべてのプログラマーが知っておくべきソートアルゴリズムトップ10

>>:  今後数年間の AI 求人市場はどのようになるでしょうか?

ブログ    

推薦する

未来を垣間見るのに役立つ9つの主要な人工知能開発トレンド

人工知能はテクノロジー界でホットな話題となっている。それは人々の生活を変えただけでなく、考えられるあ...

...

Facebook は顔認識を中止することで本当にリスクを回避しているのでしょうか?人種差別は致命的である

名前にちなんでFacebookとしても知られるMateは、顔認識システムを無効化し、10億人以上の個...

...

誰も教えてくれないAI大規模導入の効率的なプロセス!

現在、AIに関するチュートリアルは数多くあります。オブジェクト検出、画像分類、NLP の実行方法、チ...

AIチップのスタートアップ企業CambrianがシリーズB資金調達で数億ドルの完了を発表

本日、AIチップのスタートアップ企業Cambrianが数億ドルのBラウンド資金調達を完了した。資金調...

一般的な基本的なソートアルゴリズムを今回から理解しましょう

[[383742]]この記事はWeChatの公開アカウント「Beta Learns JAVA」から転...

ピュー研究所の報告:2025年までにAIのせいで7500万人が解雇される

[[253650]]テクノロジー専門家の約 37% は、人工知能 (AI) と関連技術の進歩により、...

Gemini ProはGPT-3.5ほど優れていません。CMUは徹底的な比較研究を実施し、公平性、透明性、再現性を確保しています。

Google Gemini はどれほど強力ですか?カーネギーメロン大学は、専門的かつ客観的な第三者...

AIは実際にチップを生成できます! GPT-4はわずか19回の対話で130nmチップを構築し、チップ設計業界におけるHDLの大きな課題を克服しました。

GPT-4 はすでに人間がチップを作るのに役立っています!ニューヨーク大学タンドン工学部の研究者た...

PyGWalkerを使用して表形式のデータを視覚化および分析する

導入Jupyter Notebook に大量のデータがあり、それを分析して視覚化したいとします。 P...

インテリジェント運転ビッグデータの最先端の研究の進歩と典型的な応用

1. はじめにインテリジェント運転とは、一般的には、自動運転や車両のインターネット(IoV)などの技...

ChatGPTはユーザーがペイウォールを回避できないようにBing検索へのアクセスを停止

7月5日のニュース、6月28日、OpenAIのチャットボットChatGPTは、MicrosoftのB...

電力管理における人工知能の重要性

私たちの生活のあらゆる側面がテクノロジーと絡み合っている時代において、電力業界も例外ではありません。...