Google が地図「タイムマシン」を公開: 100 年前のあなたの街はどんな様子だったでしょうか?

Google が地図「タイムマシン」を公開: 100 年前のあなたの街はどんな様子だったでしょうか?

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

あなたが育った通りは、10年前、あるいは100年前にはどんな様子だったでしょうか?

[[346939]]

△スピッツァー大谷

現在、Google は AI を使って古い画像データを復元するだけでなく、新しい「タイムトラベル」ソリューションもリリースしています。

このように、3D 視点を使用して、1890 年から 1970 年にかけてのマンハッタンのチェルシー地区の建築の変化を見てみましょう。

ちょっと歴史的な変化のような気がしませんか?

このような「タイムマシン」のエンジンは、Google がリリースしたブラウザベースのツールセットであり、主に次の 3 つの部分で構成されています。

  • クラウドソーシングプラットフォーム。ユーザーは、歴史的な都市地図をアップロードし、それを現実世界の座標と照合し、地理補正し、ベクトル化することができます。
  • 時空間マップサーバー。都市の地図が時間の経過とともにどのように変化するかを表示できます。
  • 3D 体験プラットフォーム。 rǝ マップ サーバー上で実行され、ディープラーニングを使用して、限られた歴史的画像とマップ データに基づいて 3D の建物を再構築し、3D エクスペリエンスを作成します。

クラウドソーシングを通じて構築

都市の過去を再構築する上で最も難しいのはデータにあります。利用できる画像はほとんどなく、画像から得られるメタデータは当然ながら現代の地図よりもはるかに少ないのです。

この課題を解決するために、Google のエンジニアは、Google Cloud と Kubernetes 上で実行されるオープンソース ツール rǝ を使用しました。

その機能は、クラウドソーシングを使用して、ユーザーが共同で時間軸を持つマップ サーバーを作成できるようにすることです。

具体的には、ユーザーはブラウザを通じてさまざまな時代の紙の地図のスキャンをアップロードし、地理補正を実行して歴史的な地図を現実世界の座標と一致させることができます。

次に、ランドマークや道路などの地理的特徴をトレースして、歴史的な地図を OSM ベクター形式に変換しました。

これらのベクター マップはタイル サーバーによってレンダリングされた後、Google マップでよく見られる、拡大やパンが可能なスリッピー マップになります。

3Dモデルの再構築

次のステップは、これらの画像と地図データを使用して、歴史上に登場した建物の 3D 構造を再構築することです。

ここで難しいのは、ほとんどの場合、建物の歴史的な画像が 1 つしかない可能性が高いことです。この目的のために、Google のエンジニアは、粗から細までの認識および再構築アルゴリズムを開発しました。

図に示すように、まず、クラウドソーシングによる注釈や自動検出アルゴリズムに基づいて、地図上のマークや歴史的画像内の建物のファサードを識別し、大まかな 3D 構造を生成します。

同時に、アルゴリズムは窓、入り口、階段など、建物のファサードにある個々のコンポーネントをすべて識別し、そのカテゴリに基づいて詳細な 3D 構造を再構築します。

これら 2 つを組み合わせると、最終的な 3D メッシュが得られます。結果は 3D ライブラリに保存され、次のレンダリングのために準備されます。

このアルゴリズムに関係する SOTA ディープラーニング モデルには次のものがあります。

  • 窓、入り口、階段などのファサード コンポーネントの注釈を使用してトレーニングされた RCNN を使用して、履歴画像内の境界ボックス レベルのインスタンスを特定します。
  • セマンティック セグメンテーション モデル DeepLab は、各セマンティック クラスにピクセル レベルのラベルを提供します。
  • ファサード上に生成されるウィンドウが等間隔で一貫した形状になるように特別に設計されたニューラル ネットワーク。同時に、階段や窓などの異なるセマンティック クラス間の一貫性も確保され、これらのコンポーネントが適切な位置に配置されるようになります。

世界の街と「Microsoft Flight Simulator」を復元

これに先立ち、マイクロソフトはAIスタートアップBlackshark.aiと提携し、機械学習の2Dから3Dへの変換モデルを通じて世界中の200万の町、15億の建物、3万7000の空港を再現した世界最大のシミュレーションゲーム「Microsoft Flight Simulator 2020」もリリースした。

ゲームが発売されるとすぐに、有名なゲームレビューメディアIGNは10点満点の評価を与えました。

さらに、ブラックシャークは、このような技術が将来的に自動運転にも使用される可能性があることも明らかにした。

さて、今回Googleが立ち上げたノスタルジアプロジェクトについて、どう思われますか?

興味がある方はぜひ参加してみてください。Googleは過去のデータセットとソースコードをオープンソース化すると言っていますよ〜

ポータル

公式ブログ:
https://ai.googleblog.com/2020/10/recreating-historical-streetscapes.html

Rǝ ツールセット:
https://re.city/#14.25/40.74094/-73.98798

<<:  人工知能の時代において、中国語と英語のどちらがAIの母国語になるのでしょうか?

>>:  あなたはまだ顔認識精度指標に騙されていませんか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

このAI職種の平均学歴は中学卒程度であり、最も絶望的な職業として認識されている

[[437446]] 2020年2月、「人工知能トレーナー」は正式に新しい職業となり、国家職業分類カ...

...

AI と機械学習はデータセンター運用にどのような変化をもたらすのでしょうか?

今日のデータセンターは、ほぼ克服不可能と思われる課題に直面しています。データ センターの運用はかつて...

...

ディープラーニングを活用してネットワークセキュリティを実現する方法

[[240276]]著者: ゲストブログ翻訳:張玲校正:丁南雅この論文では、ディープラーニングとそれ...

データ駆動型パーソナライゼーションの時代: AI と ML がデータの読み取りと理解の方法をどのように変えているのか

今日のビジネスはデータとデータに基づく理解によって支配されています。データをどのように理解し、それを...

モデルはわずか7M:軽量で高精度な顔認識方式DBFace

わずか 7M サイズのこの顔認識モデルは、世界最大の自撮り写真に写っているほぼすべての人物を認識しま...

...

AI + データサイエンス: スポーツ業界を変える6つの方法

[[329380]]テクノロジーの発展に伴い、人工知能とデータサイエンスはスポーツの分野でますます重...

テクノロジー市場: エッジデバイスで利用可能なエッジAIソリューション

エッジコンピューティングと人工知能の組み合わせにより、エッジ AI は現在のテクノロジー市場における...

不動産会社のデジタル変革は差し迫っています。これらの AI イノベーションは試してみる価値があるかもしれません。

不動産会社のデジタル変革は差し迫っています。試してみるべき革新的な方法をいくつかご紹介します。今日の...

業界の資金調達が活発化しています!自動運転技術は物流分野で初めて導入される可能性

2019年、自動運転分野は谷間に向かうかに見えましたが、わずか数か月で業界は徐々に再び熱を帯び始め、...

これら10機関からの24の調査データはAIのトレンドを理解するのに役立ちます

[[256519]] 2019年1月現在の人工知能の現状は?最近の調査では、AI の人気、測定可能な...

...