AIを使って古い写真をカラー化するのは本当に正確なのでしょうか?技術界と歴史界は1,000のポストを主張した

AIを使って古い写真をカラー化するのは本当に正確なのでしょうか?技術界と歴史界は1,000のポストを主張した

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

最近、古い写真のAIカラー化が流行っていますが、色は本当に正確なのでしょうか?

これに関して、20 世紀初頭のロシアのカラー写真を脱色し、それを AI によるカラー化の結果と比較するという実験を行った人がいました。

このような比較結果に対して、このネットユーザーは直接指摘した。

AI は常にくすんだ色を選択する傾向があり、空は常に灰色、人々の服装は非常にシンプル、地面はほこりや汚れでいっぱいになります。

しかし、さらに彼女は別の点についても懸念している。それは、AI によって、過去は「退屈で活気がなかった」という人々の偏見が強まるのではないかということだ。

彼女は古い写真のカラー化は人間の専門家に任せるべきだと考えています。

AI、いいえ☝️。

この投稿が公開されるとすぐに、Reddit の機械学習コミュニティと歴史愛好家コミュニティで白熱した議論が巻き起こりました。

1日も経たないうちに1,000棟以上の建物が建設され、合計35,000件の「いいね!」が集まりました。

しかし、その後、議論が激しすぎたため、元の投稿はモデレーターによって削除されました...

さまざまなコミュニティのネットユーザーは何について議論しているのでしょうか?

テクノロジーの世界: あなたのアルゴリズムは信頼できますか?

機械学習部門の出場者が最初に次のような質問をしました。

あなたが使用しているアルゴリズムは最先端のものですか?一見すると、損失関数は周囲のピクセルの平均二乗誤差 (MSE) のようなものを計算するように単純に設計されており、AI が低彩度の色を選択するように促します。

誰かが改善のアイデアを出しました。色相、彩度、明度の違いを個別に重み付けし、外れ値を「罰する」ことで、アルゴリズムが低彩度色を選択する動機を減らすことが提案されています。

写真に詳しい参加者は、カラー写真から RGB チャンネルを削除しても、元の白黒カメラ写真と同じにはならないと指摘しました。 Sigma SD1 Merill や Leica M Monochrom などのプロ仕様のセンサーは、はるかに広いダイナミック レンジをキャプチャします。

便宜上、現在のデータセットはすべてカラー画像を脱色して作成されており、実際のモノクロカメラ画像をトレーニングに使用したデータセットは見たことがありません。

反対する人たちは、白黒写真は誤解を招くものだと言う。

このピーマンの列を見てください。色を取り除いた後、食感は同じになり、人間はどれが赤でどれが緑か区別できません。

AI を魔法や奇跡のように扱うことはできない、また営利企業は AI が生成したコンテンツを事実として販売することはできないと考える人もいます。これは AI 倫理の問題ではなく、ビジネス倫理の問題です。

職人:一番大切なのは文化

写真のカラー化愛好家が集まる場所では、古い写真を手作業でカラー化する上で最も価値のある部分は、実は情報収集であると考えられています。

写真に写っているものがどのような色に見えるかを理解しようとするときには、常に興味深い歴史的な事柄を学ぶことができます。

AIで色付けした写真をネットに投稿することで、人々は技術の進歩を祝うことに焦点を当てている、と指摘する人もいる。古い写真の背後にある人間的な価値は見過ごされがちです。

AIは照明や影の計算に優れていると考える人もいますが、色の選択には依然として人間の専門家の指導が必要です。

AI は、人間がすべての作業を AI に丸投げするのではなく、インターンのように人間のアシスタントになるべきです。

人間とAIのコラボレーション

実際、人間がどのようにして AI に写真を着色させるかについての研究が行われています。この研究はSIGGRAPH 2017カンファレンスで発表されました。

デモでは、グレースケール画像内の任意のピクセルに人間が色を指定すると、AIが適用範囲を自動計算してリアルタイムでプレビューを表示します。

このアルゴリズムは、畳み込みニューラル ネットワーク (CNN)、グレースケール画像、および人間が指定した色を入力として使用し、色の分布を自動的に計算します。

トレーニング セットには、多くの有名な写真を含む 130 万枚のカラー写真の彩度を下げたバージョンが含まれています。色を選択した各人間のユーザーは、各写真に平均 1 分を費やしました。

このモデルは Caffe を使用して開発され、後に PyTorch バージョンが追加され、Github でオープンソース化されました。

CPU と GPU の両方のコンピューティングがサポートされているので、次のダウンロードで試すことができます。

Githubアドレス:
https://github.com/junyanz/interactive-deep-colorization

論文の宛先:
https://arxiv.org/abs/1705.02999

SIGGRAPH 講演:
https://www.youtube.com/watch?v=rp5LUSbdsys

<<:  Java プログラミング スキル - データ構造とアルゴリズム「マージ ソート」

>>:  IoTとAIはビジネスの生産性を向上させる完璧なパートナーです

ブログ    
ブログ    
ブログ    

推薦する

...

...

28 歳の中国人 Meta ソフトウェア エンジニアが、次のような理由で年収 37 万ドルの仕事を辞めました...

物語の主人公は中国人のソフトウェアエンジニア、エリック・ユーです。 2016年、Google、Met...

人工知能がウェブホスティング業界に優位性をもたらす

近年、ウェブホスティング業界は劇的に変化しました。そして、業界を永遠に変える可能性のあるいくつかのト...

...

ElevenLabs、元の話し手の声と感情を維持するAI翻訳吹き替え機能を発表

AIテキスト読み上げ会社ElevenLabsは10月11日、火曜日にAI Dubbingを発表した。...

...

...

ブロックチェーンは世界を変えつつありますが、人類はどこまで到達できるのでしょうか?

猫を飼うことで生じる混雑により、人々はブロックチェーンの力に驚嘆し始めました。数字で構成されたこの世...

【WOT2018】4人の重鎮専門家が企業ビジネスにおけるNLPの詳細な応用を分析

[51CTO.comより引用] 2018年11月30日から12月1日まで、WOT2018グローバル人...

チップ設計に特化したNVIDIAが、カスタマイズされた大規模言語モデルChipNeMoをリリース!

先日開幕した ICCAD 2023 カンファレンスで、NVIDIA チームは AI モデルを使用して...

パラメータは最大2兆個、GPT-4をはるかに超える!アマゾンの新型オリンパス大型モデルが公開、近日発表予定

大きなモデルの波から遠ざかっていたように見えるAmazonが、ついに最新の進捗状況を発表することにな...

人工知能プラットフォームソリューションにおける品質エンジニアリング設計

翻訳者 | 朱 仙中校正:孫淑娟導入私たちは人工知能の黄金時代にいます。 AI ソリューションを導入...

T1000が実現:我が国は液体金属駆動ロボットを開発中

[[247070]]液体ロボットといえば、誰もが真っ先に思い浮かべるのは映画「ターミネーター」のT1...