AIを使って古い写真をカラー化するのは本当に正確なのでしょうか?技術界と歴史界は1,000のポストを主張した

AIを使って古い写真をカラー化するのは本当に正確なのでしょうか?技術界と歴史界は1,000のポストを主張した

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

最近、古い写真のAIカラー化が流行っていますが、色は本当に正確なのでしょうか?

これに関して、20 世紀初頭のロシアのカラー写真を脱色し、それを AI によるカラー化の結果と比較するという実験を行った人がいました。

このような比較結果に対して、このネットユーザーは直接指摘した。

AI は常にくすんだ色を選択する傾向があり、空は常に灰色、人々の服装は非常にシンプル、地面はほこりや汚れでいっぱいになります。

しかし、さらに彼女は別の点についても懸念している。それは、AI によって、過去は「退屈で活気がなかった」という人々の偏見が強まるのではないかということだ。

彼女は古い写真のカラー化は人間の専門家に任せるべきだと考えています。

AI、いいえ☝️。

この投稿が公開されるとすぐに、Reddit の機械学習コミュニティと歴史愛好家コミュニティで白熱した議論が巻き起こりました。

1日も経たないうちに1,000棟以上の建物が建設され、合計35,000件の「いいね!」が集まりました。

しかし、その後、議論が激しすぎたため、元の投稿はモデレーターによって削除されました...

さまざまなコミュニティのネットユーザーは何について議論しているのでしょうか?

テクノロジーの世界: あなたのアルゴリズムは信頼できますか?

機械学習部門の出場者が最初に次のような質問をしました。

あなたが使用しているアルゴリズムは最先端のものですか?一見すると、損失関数は周囲のピクセルの平均二乗誤差 (MSE) のようなものを計算するように単純に設計されており、AI が低彩度の色を選択するように促します。

誰かが改善のアイデアを出しました。色相、彩度、明度の違いを個別に重み付けし、外れ値を「罰する」ことで、アルゴリズムが低彩度色を選択する動機を減らすことが提案されています。

写真に詳しい参加者は、カラー写真から RGB チャンネルを削除しても、元の白黒カメラ写真と同じにはならないと指摘しました。 Sigma SD1 Merill や Leica M Monochrom などのプロ仕様のセンサーは、はるかに広いダイナミック レンジをキャプチャします。

便宜上、現在のデータセットはすべてカラー画像を脱色して作成されており、実際のモノクロカメラ画像をトレーニングに使用したデータセットは見たことがありません。

反対する人たちは、白黒写真は誤解を招くものだと言う。

このピーマンの列を見てください。色を取り除いた後、食感は同じになり、人間はどれが赤でどれが緑か区別できません。

AI を魔法や奇跡のように扱うことはできない、また営利企業は AI が生成したコンテンツを事実として販売することはできないと考える人もいます。これは AI 倫理の問題ではなく、ビジネス倫理の問題です。

職人:一番大切なのは文化

写真のカラー化愛好家が集まる場所では、古い写真を手作業でカラー化する上で最も価値のある部分は、実は情報収集であると考えられています。

写真に写っているものがどのような色に見えるかを理解しようとするときには、常に興味深い歴史的な事柄を学ぶことができます。

AIで色付けした写真をネットに投稿することで、人々は技術の進歩を祝うことに焦点を当てている、と指摘する人もいる。古い写真の背後にある人間的な価値は見過ごされがちです。

AIは照明や影の計算に優れていると考える人もいますが、色の選択には依然として人間の専門家の指導が必要です。

AI は、人間がすべての作業を AI に丸投げするのではなく、インターンのように人間のアシスタントになるべきです。

人間とAIのコラボレーション

実際、人間がどのようにして AI に写真を着色させるかについての研究が行われています。この研究はSIGGRAPH 2017カンファレンスで発表されました。

デモでは、グレースケール画像内の任意のピクセルに人間が色を指定すると、AIが適用範囲を自動計算してリアルタイムでプレビューを表示します。

このアルゴリズムは、畳み込みニューラル ネットワーク (CNN)、グレースケール画像、および人間が指定した色を入力として使用し、色の分布を自動的に計算します。

トレーニング セットには、多くの有名な写真を含む 130 万枚のカラー写真の彩度を下げたバージョンが含まれています。色を選択した各人間のユーザーは、各写真に平均 1 分を費やしました。

このモデルは Caffe を使用して開発され、後に PyTorch バージョンが追加され、Github でオープンソース化されました。

CPU と GPU の両方のコンピューティングがサポートされているので、次のダウンロードで試すことができます。

Githubアドレス:
https://github.com/junyanz/interactive-deep-colorization

論文の宛先:
https://arxiv.org/abs/1705.02999

SIGGRAPH 講演:
https://www.youtube.com/watch?v=rp5LUSbdsys

<<:  Java プログラミング スキル - データ構造とアルゴリズム「マージ ソート」

>>:  IoTとAIはビジネスの生産性を向上させる完璧なパートナーです

ブログ    
ブログ    
ブログ    

推薦する

モノのインターネットにおける機械学習の役割は何ですか?

ビッグデータや人工知能などのテクノロジーがもたらす機会と脅威、そしてその将来に対する懸念については、...

なぜ私たちは、AI による顔の変形が「偽物」だと今でも思っているのでしょうか?

『スター・ウォーズ』のスピンオフシリーズ『ボバ・フェットの書』には、ファンの間で刺激的な議論を巻き...

AIとIoTの統合が加速

近年、モノのインターネットは大きな注目を集めていますが、ほとんどのアプリケーションには 2 つの重要...

...

...

自動運転システムにおけるエッジコンピューティング技術

エッジ コンピューティングは、ネットワークのエッジでコンピューティングを実行する新しいコンピューティ...

パフォーマンスは 5000 個の H100 でトレーニングされた GPT-4 に近いです。 DeepMindが新世代の大規模モデルを共同開発

最近、InflectionAI は新しい AI モデルをリリースしました。さらに衝撃的なのは、Inf...

自動運転車インフラの新たなビジョン

自動運転車の台頭により、都市の建設方法や都市環境における交通手段に対する考え方が一変するでしょう。 ...

トラックに「透明マント」を装着し、自動運転車を衝突させる。これは誰がより早く攻撃できるかを競う競争だ

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

アルゴリズムの時間計算量分析: Big O 表記

[[354643]]開発の際、アルゴリズムの品質をどのように評価し、アルゴリズムの効率をどのように説...

ディープラーニングのためのテキスト前処理方法

[[432936]] [51CTO.com クイック翻訳]昨今、ディープラーニング、特に自然言語処理...

メタバースの開発にはどのような重要な技術が必要ですか?

メタバースは、信頼できる資産価値とアイデンティティ認証を備えた仮想アクティビティを実行するためのプラ...

マイクロソフトの自動運転戦略:自動車を製造するのではなく、企業に技術サポートとクラウドサービスを提供する

ゼネラル・モーターズ傘下の自動運転車開発会社クルーズは、マイクロソフト、ゼネラル・モーターズ、ホンダ...

ハーバード大学の科学者がシャコの「バネ仕掛けの拳」機構を模倣したマイクロロボットを開発

海外メディアの報道によると、シャコは世界で最も速い動物種の一つだが、シャコがどのようにしてこのような...

マイクロソフトは財務部門向けに特化されたAIツールをカスタマイズ

3月1日木曜日の米国時間のニュースで、マイクロソフトは企業顧客の財務部門向けの人工知能ツールを披露し...