AIを使って古い写真をカラー化するのは本当に正確なのでしょうか?技術界と歴史界は1,000のポストを主張した

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

最近、古い写真のAIカラー化が流行っていますが、色は本当に正確なのでしょうか？

これに関して、20 世紀初頭のロシアのカラー写真を脱色し、それを AI によるカラー化の結果と比較するという実験を行った人がいました。

このような比較結果に対して、このネットユーザーは直接指摘した。

AI は常にくすんだ色を選択する傾向があり、空は常に灰色、人々の服装は非常にシンプル、地面はほこりや汚れでいっぱいになります。

しかし、さらに彼女は別の点についても懸念している。それは、AI によって、過去は「退屈で活気がなかった」という人々の偏見が強まるのではないかということだ。

彼女は古い写真のカラー化は人間の専門家に任せるべきだと考えています。

AI、いいえ☝️。

この投稿が公開されるとすぐに、Reddit の機械学習コミュニティと歴史愛好家コミュニティで白熱した議論が巻き起こりました。

1日も経たないうちに1,000棟以上の建物が建設され、合計35,000件の「いいね！」が集まりました。

しかし、その後、議論が激しすぎたため、元の投稿はモデレーターによって削除されました...

さまざまなコミュニティのネットユーザーは何について議論しているのでしょうか?

テクノロジーの世界: あなたのアルゴリズムは信頼できますか?

機械学習部門の出場者が最初に次のような質問をしました。

あなたが使用しているアルゴリズムは最先端のものですか?一見すると、損失関数は周囲のピクセルの平均二乗誤差 (MSE) のようなものを計算するように単純に設計されており、AI が低彩度の色を選択するように促します。

誰かが改善のアイデアを出しました。色相、彩度、明度の違いを個別に重み付けし、外れ値を「罰する」ことで、アルゴリズムが低彩度色を選択する動機を減らすことが提案されています。

写真に詳しい参加者は、カラー写真から RGB チャンネルを削除しても、元の白黒カメラ写真と同じにはならないと指摘しました。 Sigma SD1 Merill や Leica M Monochrom などのプロ仕様のセンサーは、はるかに広いダイナミックレンジをキャプチャします。

便宜上、現在のデータセットはすべてカラー画像を脱色して作成されており、実際のモノクロカメラ画像をトレーニングに使用したデータセットは見たことがありません。

反対する人たちは、白黒写真は誤解を招くものだと言う。

このピーマンの列を見てください。色を取り除いた後、食感は同じになり、人間はどれが赤でどれが緑か区別できません。

AI を魔法や奇跡のように扱うことはできない、また営利企業は AI が生成したコンテンツを事実として販売することはできないと考える人もいます。これは AI 倫理の問題ではなく、ビジネス倫理の問題です。

職人：一番大切なのは文化

写真のカラー化愛好家が集まる場所では、古い写真を手作業でカラー化する上で最も価値のある部分は、実は情報収集であると考えられています。

写真に写っているものがどのような色に見えるかを理解しようとするときには、常に興味深い歴史的な事柄を学ぶことができます。

AIで色付けした写真をネットに投稿することで、人々は技術の進歩を祝うことに焦点を当てている、と指摘する人もいる。古い写真の背後にある人間的な価値は見過ごされがちです。

AIは照明や影の計算に優れていると考える人もいますが、色の選択には依然として人間の専門家の指導が必要です。

AI は、人間がすべての作業を AI に丸投げするのではなく、インターンのように人間のアシスタントになるべきです。

人間とAIのコラボレーション

実際、人間がどのようにして AI に写真を着色させるかについての研究が行われています。この研究はSIGGRAPH 2017カンファレンスで発表されました。

デモでは、グレースケール画像内の任意のピクセルに人間が色を指定すると、AIが適用範囲を自動計算してリアルタイムでプレビューを表示します。

このアルゴリズムは、畳み込みニューラルネットワーク (CNN)、グレースケール画像、および人間が指定した色を入力として使用し、色の分布を自動的に計算します。

トレーニングセットには、多くの有名な写真を含む 130 万枚のカラー写真の彩度を下げたバージョンが含まれています。色を選択した各人間のユーザーは、各写真に平均 1 分を費やしました。

このモデルは Caffe を使用して開発され、後に PyTorch バージョンが追加され、Github でオープンソース化されました。

CPU と GPU の両方のコンピューティングがサポートされているので、次のダウンロードで試すことができます。

Githubアドレス:
https://github.com/junyanz/interactive-deep-colorization

論文の宛先:
https://arxiv.org/abs/1705.02999

SIGGRAPH 講演:
https://www.youtube.com/watch?v=rp5LUSbdsys

<<: Java プログラミングスキル - データ構造とアルゴリズム「マージソート」

>>: IoTとAIはビジネスの生産性を向上させる完璧なパートナーです

人工知能とセキュリティ：繋がる双子

ブログ

AIを使って古い写真をカラー化するのは本当に正確なのでしょうか?技術界と歴史界は1,000のポストを主張した

テクノロジーの世界: あなたのアルゴリズムは信頼できますか?

職人：一番大切なのは文化

人間とAIのコラボレーション

人工知能とセキュリティ：繋がる双子

IoT 革命の基盤を築く: 手遅れになる前に企業がデータ戦略を完成させる方法

スマートビルディング技術のトレンド: 5つの将来のアイデアと例

ドローンは農業にも活用されており、植物保護ドローンは侵入の防止と制御に非常に効果的です。

人工知能は一般的な仕事に取って代わるのでしょうか？心配しないで、この機会をつかんで次の10年をリードしてください

人工知能、機械学習、ディープラーニングの違いと関連性を説明する記事

推薦する

マイクロソフト、医療病理学の症例を分析する LLaVA-Med AI モデルを発表

『Thinking Chain: Six Intuitions about Big Models』の著者、ジェイソン・ウェイ氏

なぜRLの一般化は難しいのか：バークレーの博士が認知POMDPと暗黙の部分観測性から説明する

AIがDevOpsを加速させる10の方法

スマート交通技術が再び都市開発を推進する方法

TikTok本社は米国に残り、ByteDanceが管理権とコアアルゴリズムを保持する

中国の人工知能はどれほど強力か？将来ロボットが手術を行えるようになるか？外国人は信じられないと言う

人工知能は神経技術をどのように進歩させるのでしょうか?

適切な人工知能を選択するにはどうすればよいでしょうか?

ビジネスインテリジェンスを変革するAIの優れたユースケース

大企業の面接官によく聞かれるアルゴリズム図：スタック内の最小値を見つける方法がまだわかりませんか？

機械学習のテストセットをスケールアップする方法