AIを使って古い写真をカラー化するのは本当に正確なのでしょうか?技術界と歴史界は1,000のポストを主張した

AIを使って古い写真をカラー化するのは本当に正確なのでしょうか?技術界と歴史界は1,000のポストを主張した

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

最近、古い写真のAIカラー化が流行っていますが、色は本当に正確なのでしょうか?

これに関して、20 世紀初頭のロシアのカラー写真を脱色し、それを AI によるカラー化の結果と比較するという実験を行った人がいました。

このような比較結果に対して、このネットユーザーは直接指摘した。

AI は常にくすんだ色を選択する傾向があり、空は常に灰色、人々の服装は非常にシンプル、地面はほこりや汚れでいっぱいになります。

しかし、さらに彼女は別の点についても懸念している。それは、AI によって、過去は「退屈で活気がなかった」という人々の偏見が強まるのではないかということだ。

彼女は古い写真のカラー化は人間の専門家に任せるべきだと考えています。

AI、いいえ☝️。

この投稿が公開されるとすぐに、Reddit の機械学習コミュニティと歴史愛好家コミュニティで白熱した議論が巻き起こりました。

1日も経たないうちに1,000棟以上の建物が建設され、合計35,000件の「いいね!」が集まりました。

しかし、その後、議論が激しすぎたため、元の投稿はモデレーターによって削除されました...

さまざまなコミュニティのネットユーザーは何について議論しているのでしょうか?

テクノロジーの世界: あなたのアルゴリズムは信頼できますか?

機械学習部門の出場者が最初に次のような質問をしました。

あなたが使用しているアルゴリズムは最先端のものですか?一見すると、損失関数は周囲のピクセルの平均二乗誤差 (MSE) のようなものを計算するように単純に設計されており、AI が低彩度の色を選択するように促します。

誰かが改善のアイデアを出しました。色相、彩度、明度の違いを個別に重み付けし、外れ値を「罰する」ことで、アルゴリズムが低彩度色を選択する動機を減らすことが提案されています。

写真に詳しい参加者は、カラー写真から RGB チャンネルを削除しても、元の白黒カメラ写真と同じにはならないと指摘しました。 Sigma SD1 Merill や Leica M Monochrom などのプロ仕様のセンサーは、はるかに広いダイナミック レンジをキャプチャします。

便宜上、現在のデータセットはすべてカラー画像を脱色して作成されており、実際のモノクロカメラ画像をトレーニングに使用したデータセットは見たことがありません。

反対する人たちは、白黒写真は誤解を招くものだと言う。

このピーマンの列を見てください。色を取り除いた後、食感は同じになり、人間はどれが赤でどれが緑か区別できません。

AI を魔法や奇跡のように扱うことはできない、また営利企業は AI が生成したコンテンツを事実として販売することはできないと考える人もいます。これは AI 倫理の問題ではなく、ビジネス倫理の問題です。

職人:一番大切なのは文化

写真のカラー化愛好家が集まる場所では、古い写真を手作業でカラー化する上で最も価値のある部分は、実は情報収集であると考えられています。

写真に写っているものがどのような色に見えるかを理解しようとするときには、常に興味深い歴史的な事柄を学ぶことができます。

AIで色付けした写真をネットに投稿することで、人々は技術の進歩を祝うことに焦点を当てている、と指摘する人もいる。古い写真の背後にある人間的な価値は見過ごされがちです。

AIは照明や影の計算に優れていると考える人もいますが、色の選択には依然として人間の専門家の指導が必要です。

AI は、人間がすべての作業を AI に丸投げするのではなく、インターンのように人間のアシスタントになるべきです。

人間とAIのコラボレーション

実際、人間がどのようにして AI に写真を着色させるかについての研究が行われています。この研究はSIGGRAPH 2017カンファレンスで発表されました。

デモでは、グレースケール画像内の任意のピクセルに人間が色を指定すると、AIが適用範囲を自動計算してリアルタイムでプレビューを表示します。

このアルゴリズムは、畳み込みニューラル ネットワーク (CNN)、グレースケール画像、および人間が指定した色を入力として使用し、色の分布を自動的に計算します。

トレーニング セットには、多くの有名な写真を含む 130 万枚のカラー写真の彩度を下げたバージョンが含まれています。色を選択した各人間のユーザーは、各写真に平均 1 分を費やしました。

このモデルは Caffe を使用して開発され、後に PyTorch バージョンが追加され、Github でオープンソース化されました。

CPU と GPU の両方のコンピューティングがサポートされているので、次のダウンロードで試すことができます。

Githubアドレス:
https://github.com/junyanz/interactive-deep-colorization

論文の宛先:
https://arxiv.org/abs/1705.02999

SIGGRAPH 講演:
https://www.youtube.com/watch?v=rp5LUSbdsys

<<:  Java プログラミング スキル - データ構造とアルゴリズム「マージ ソート」

>>:  IoTとAIはビジネスの生産性を向上させる完璧なパートナーです

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

マイクロソフト、医療病理学の症例を分析する LLaVA-Med AI モデルを発表

6月14日、マイクロソフトの研究者らは、主に生物医学研究に使用され、CTやX線画像に基づいて患者の病...

『Thinking Chain: Six Intuitions about Big Models』の著者、ジェイソン・ウェイ氏

ジェイソン・ウェイを覚えていますか?思考連鎖の創始者は、命令チューニングに関する初期の研究を共同で主...

...

なぜRLの一般化は難しいのか:バークレーの博士が認知POMDPと暗黙の部分観測性から説明する

[[437395]]今日の強化学習 (RL) には、収束性が低いなど多くの問題があります。比較的弱い...

...

AIがDevOpsを加速させる10の方法

今年初めに発表されたデロイトのレポートによると、AIベースのソフトウェア開発ツールを提供するスタート...

スマート交通技術が再び都市開発を推進する方法

都市はバスに大金を賭けている。パンデミックが沈静化し、アメリカ人が仕事に復帰するにつれ、全国の都市や...

TikTok本社は米国に残り、ByteDanceが管理権とコアアルゴリズムを保持する

事情に詳しい関係者らは、米政府に提出した提案に基づき、バイトダンスがティックトックの本社を米国内に維...

中国の人工知能はどれほど強力か?将来ロボットが手術を行えるようになるか?外国人は信じられないと言う

写真は人工知能中国の人工知能はどれほど強力か?将来ロボットが手術を行えるようになるか?多くの中国人は...

人工知能は神経技術をどのように進歩させるのでしょうか?

ニューロテクノロジーは人間の神経系の原理に基づいており、人間の脳の極めて複雑なモデル構造を研究するこ...

適切な人工知能を選択するにはどうすればよいでしょうか?

採用プロセスで人工知能テクノロジーに切り替えるのは難しいかもしれませんが、これらのヒントに従って、会...

...

ビジネスインテリジェンスを変革するAIの優れたユースケース

ディープラーニング対応ソフトウェアから自動運転車、スマートロボットから IoT アプリケーションまで...

大企業の面接官によく聞かれるアルゴリズム図:スタック内の最小値を見つける方法がまだわかりませんか?

今日のインタビューの質問はこれです...トピックスタックデータ構造を定義します。この型でスタックの最...

機械学習のテストセットをスケールアップする方法

[[387235]]テスト セットのヒル クライミングは、トレーニング セットに影響を与えたり、予測...