AIを使って古い写真をカラー化するのは本当に正確なのでしょうか?技術界と歴史界は1,000のポストを主張した

AIを使って古い写真をカラー化するのは本当に正確なのでしょうか?技術界と歴史界は1,000のポストを主張した

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

最近、古い写真のAIカラー化が流行っていますが、色は本当に正確なのでしょうか?

これに関して、20 世紀初頭のロシアのカラー写真を脱色し、それを AI によるカラー化の結果と比較するという実験を行った人がいました。

このような比較結果に対して、このネットユーザーは直接指摘した。

AI は常にくすんだ色を選択する傾向があり、空は常に灰色、人々の服装は非常にシンプル、地面はほこりや汚れでいっぱいになります。

しかし、さらに彼女は別の点についても懸念している。それは、AI によって、過去は「退屈で活気がなかった」という人々の偏見が強まるのではないかということだ。

彼女は古い写真のカラー化は人間の専門家に任せるべきだと考えています。

AI、いいえ☝️。

この投稿が公開されるとすぐに、Reddit の機械学習コミュニティと歴史愛好家コミュニティで白熱した議論が巻き起こりました。

1日も経たないうちに1,000棟以上の建物が建設され、合計35,000件の「いいね!」が集まりました。

しかし、その後、議論が激しすぎたため、元の投稿はモデレーターによって削除されました...

さまざまなコミュニティのネットユーザーは何について議論しているのでしょうか?

テクノロジーの世界: あなたのアルゴリズムは信頼できますか?

機械学習部門の出場者が最初に次のような質問をしました。

あなたが使用しているアルゴリズムは最先端のものですか?一見すると、損失関数は周囲のピクセルの平均二乗誤差 (MSE) のようなものを計算するように単純に設計されており、AI が低彩度の色を選択するように促します。

誰かが改善のアイデアを出しました。色相、彩度、明度の違いを個別に重み付けし、外れ値を「罰する」ことで、アルゴリズムが低彩度色を選択する動機を減らすことが提案されています。

写真に詳しい参加者は、カラー写真から RGB チャンネルを削除しても、元の白黒カメラ写真と同じにはならないと指摘しました。 Sigma SD1 Merill や Leica M Monochrom などのプロ仕様のセンサーは、はるかに広いダイナミック レンジをキャプチャします。

便宜上、現在のデータセットはすべてカラー画像を脱色して作成されており、実際のモノクロカメラ画像をトレーニングに使用したデータセットは見たことがありません。

反対する人たちは、白黒写真は誤解を招くものだと言う。

このピーマンの列を見てください。色を取り除いた後、食感は同じになり、人間はどれが赤でどれが緑か区別できません。

AI を魔法や奇跡のように扱うことはできない、また営利企業は AI が生成したコンテンツを事実として販売することはできないと考える人もいます。これは AI 倫理の問題ではなく、ビジネス倫理の問題です。

職人:一番大切なのは文化

写真のカラー化愛好家が集まる場所では、古い写真を手作業でカラー化する上で最も価値のある部分は、実は情報収集であると考えられています。

写真に写っているものがどのような色に見えるかを理解しようとするときには、常に興味深い歴史的な事柄を学ぶことができます。

AIで色付けした写真をネットに投稿することで、人々は技術の進歩を祝うことに焦点を当てている、と指摘する人もいる。古い写真の背後にある人間的な価値は見過ごされがちです。

AIは照明や影の計算に優れていると考える人もいますが、色の選択には依然として人間の専門家の指導が必要です。

AI は、人間がすべての作業を AI に丸投げするのではなく、インターンのように人間のアシスタントになるべきです。

人間とAIのコラボレーション

実際、人間がどのようにして AI に写真を着色させるかについての研究が行われています。この研究はSIGGRAPH 2017カンファレンスで発表されました。

デモでは、グレースケール画像内の任意のピクセルに人間が色を指定すると、AIが適用範囲を自動計算してリアルタイムでプレビューを表示します。

このアルゴリズムは、畳み込みニューラル ネットワーク (CNN)、グレースケール画像、および人間が指定した色を入力として使用し、色の分布を自動的に計算します。

トレーニング セットには、多くの有名な写真を含む 130 万枚のカラー写真の彩度を下げたバージョンが含まれています。色を選択した各人間のユーザーは、各写真に平均 1 分を費やしました。

このモデルは Caffe を使用して開発され、後に PyTorch バージョンが追加され、Github でオープンソース化されました。

CPU と GPU の両方のコンピューティングがサポートされているので、次のダウンロードで試すことができます。

Githubアドレス:
https://github.com/junyanz/interactive-deep-colorization

論文の宛先:
https://arxiv.org/abs/1705.02999

SIGGRAPH 講演:
https://www.youtube.com/watch?v=rp5LUSbdsys

<<:  Java プログラミング スキル - データ構造とアルゴリズム「マージ ソート」

>>:  IoTとAIはビジネスの生産性を向上させる完璧なパートナーです

ブログ    

推薦する

人工知能は法曹界に新たな形を与えています。法務テクノロジー企業はどのようにしてクライアントにグローバルなサービスを提供できるのでしょうか?

法務テクノロジーには、弁護士とそのサポートスタッフが顧客に法務サービスを提供するのに役立つソフトウェ...

AI のゴッドファーザーであるヒントンは、なぜ自らが作り出した人工知能を恐れているのでしょうか?

ジェフリー・ヒントンは、コンピューターに学習方法を教えることに生涯を費やしてきました。今、彼は人工脳...

RustベースのZedエディタがオープンソース化され、OpenAIとGitHub Copilotのサポートが組み込まれました

ティム・アンダーソンノアが編集制作:51CTO テクノロジースタック(WeChat ID:blog)...

マイクロソフト中国CTO: AIを祭壇から外してください

[[257901]]まとめ明らかに、中国における人工知能に関する誇大宣伝は、当初の意図から逸脱してい...

クレイジーすぎる、GPTsがオンライン:ウルトラマンがマスクの大型模型の手こすりを披露、誰かがサードパーティのマーケットを作った

数日前の開発者会議で、OpenAIは、メンバーシップを購入すれば、GPT-4大規模モデルの新バージョ...

AI バイアス: 機械は絶対的に合理的か?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

機械学習によるディープラーニングが企業の今後の方向性となる理由

機械アルゴリズムのディープラーニングは、ビジネスの世界に多くの変化をもたらしました。定義上、これは人...

OpenAIの最強のライバルトレーニングAIがLLMブラックボックスを分解し、ビッグモデルの「魂」を予期せず垣間見る

大規模なモデルの「ブラックボックス」を解体するために、人類解釈可能性チームは、新しいモデルをトレーニ...

AI は無限であり、あなたの声によって動かされます。マイクロソフトは慈善団体や業界のパートナーと協力し、テクノロジーで愛を育むお手伝いをします。

12月2日、マイクロソフトと周迅のAI音声紅丹丹慈善プロジェクトの発起人である魯音源文化伝承社は、...

...

生成AIは高価すぎるため、マイクロソフトやグーグルのような大手テクノロジー企業でさえも導入できない

テクノロジー企業は、AI がビジネスメモを書いたり、コンピューターコードを作成したりできると宣伝して...

2021 年にアルゴリズム エンジニアに必要な必須スキルは何ですか?

[[413437]]アルゴリズムエンジニアにはどのような能力が必要ですか? 「ますます増加する量」...

インドネシアのゴミ分別:人工知能が役に立つ

上海市は7月に「史上最も厳しいゴミ分別措置」を実施し始めて以来、ゴミ分別は多くの人々の日常生活におけ...