見たものを何でもコピーします。これは魔法ですか、それとも孫悟空の魔力ですか?どちらでもない。これが AR の魔法です。
オブジェクトの画像を Photoshop にインポートするにはどうすればよいですか?まず写真を撮り、インターネットまたはメモリ カード経由で写真をコンピューターに転送し、Photoshop インターフェイスにインポートする必要があります。では、これらのプロセスは 1 つのステップで完了できるのでしょうか? 今、AR はそれを可能にします。 AR Cut & Pasteと呼ばれるツールでは、ユーザーはこのツールを携帯電話に事前にインストールし、対象物の写真を撮り、その画像をコピーしてPhotoshopに貼り付けるだけで済みます。これは「テレキネシス」に少し似ています。 まずは効果を見てみましょう:
鉢植えの植物。
本。 上のアニメーション画像のように、鉢植えでも、洋服でも、本でも、見たらすぐにコピーして、ワンクリックでPhotoshopに取り込んで画像素材に変えることができます。グラフィックデザイナーにとってはありがたい存在です。 現在のツールの切断遅延は約 2.5 秒、貼り付け遅延は約 4 秒であると報告されており、プロセスはさらに加速できます。さらに、作者は来週、別の AI + UX プロトタイプをリリースすることも発表しました。 プロジェクト紹介AR カット&ペースト ツールは、周囲の環境から固定オブジェクトをコピーし、画像編集ソフトウェア (Photoshop) に貼り付けることができる AR+ML プロトタイプです。このツールは Adobe Photoshop ソフトウェアでのみ動作し、将来的には異なる出力の処理をサポートする可能性があることに注意してください。 プロジェクトアドレス: https://github.com/cyrildiagne/ar-cutpaste プロトタイプには、モバイル アプリ、ローカル サーバー、オブジェクト検出および背景除去サービスという 3 つの独立したモジュールがあります。 まず、ユーザーは携帯電話に AR Cut & Paste を事前にインストールする必要があります。
次に、モバイル アプリと Photoshop 間のインターフェイスとして、ユーザーは事前にローカル サーバーを構成する必要があります。
最後に、顕著なオブジェクトの検出と背景の除去は外部サービスによって実行されます (BASNet テクノロジを適用)。ユーザーは、次のコード内の 123456 を自分の Photoshop リモート接続パスワードに置き換える必要があります。
技術詳細このツールは、BASNet (Qin et al、CVPR 2019) を使用して、顕著なオブジェクトの検出と背景の除去を実行します。 次に、OpenCV SIFT を使用して、コンピューター画面上で携帯電話が向いている場所を調べます。正確な x、y 画面座標系を取得するには、携帯電話の写真とスクリーンショットだけが必要です。 目立つオブジェクトの検出と背景の除去 プロジェクト作成者は、BASNet を使用して顕著なオブジェクトの検出と背景の除去を実行しました。 BASNet は、境界の顕著性の検出に関する CVPR 2019 論文「BASNet: 境界を考慮した顕著なオブジェクトの検出」に基づいています。その主な革新は、クロスエントロピー、構造類似性損失、および IoU 損失の混合損失を使用する損失関数の設計にあります。これにより、ネットワークは、以前のように地域精度のみに焦点を当てるのではなく、境界品質にさらに注意を払うようになります。単一の GPU で 25 fps で実行でき、6 つのパブリック データセットで SOTA 結果を達成できます。 BASNet のアーキテクチャを下図に示します。 使いやすさを考慮して、プロジェクト作成者は BASNet HTTP サービス ラッパーを作成しました。 GitHub アドレス: https://github.com/cyrildiagne/basnet-http 位置 SIFT (スケール不変特徴変換) は、キーポイント検出に使用されるアルゴリズムです。SIFT アルゴリズムによって検出されたキーポイントは、通常、光や視野角などの変化に対して非常に堅牢であり、視線の遮蔽によっても大きな影響を受けません。 SIFT アルゴリズムのもう 1 つの利点は、計算速度が非常に速く、基本的にリアルタイム計算の要件を満たすことができることです。
SIFT アルゴリズムの例。画像ソース: Wikipedia URL: https://en.wikipedia.org/wiki/Scale-invariant_feature_transform このツールは、OpenCV SIFT を使用して、コンピューター画面上で携帯電話が向いている場所を検出します。
プロジェクト作成者はこれを小さな Python パッケージにパッケージ化しました。以下を参照してください。 GitHub アドレス: https://github.com/cyrildiagne/screenpoint 著者についてこのツールの発明者である Cyril Diagne 氏は、現在フランスのパリに住んでいます。彼はアーティストであり、デザイナーであり、プログラマーでもある、まさに中年の兼業労働者です。
シリル・ディアニュは2008年にパリのレ・ゴブラン・ビデオ学校を卒業した後、他の5人のクラスメートとともにアートエージェンシーLAB212を設立しました。 彼はまた、パリの Google Cultural Research Lab のアーティスト・イン・レジデンスであり、スイスのローザンヌ芸術デザイン大学のメディアおよびインタラクション デザインの責任者でもあります。 Cyril Diagne は 10 年以上にわたり、斬新なデジタル テクノロジーと芸術的なデザインを組み合わせて素晴らしいインタラクティブ体験を生み出すことに魅了されてきました。同時に、この組み合わせによってコンピューター技術がより人間的なものになるだろうと彼は信じている。 例えば、彼はかつて、Tensorflow.js、FaceMesh、Three.js を使って、Web ブラウザ上で AR を使って顔に落書きする顔落書きツールを開発しました。
Instagram のプロフィール画像に 3D 効果を追加できる Chrome 拡張機能もあります。この効果は Facebook の 3D 写真機能に似ており、2D の写真に複数の角度のビューを表示できます。
この種のアートやテクニカルデザインに興味がある方は、Cyril Diagne の GitHub ホームページでさらに興味深い作品を見つけることができます。 個人ホームページ: https://github.com/cyrildiagne |
[[412010]]ロボット、つまり自動化と AI の総称は、私たちの周りにはどこにでもあります。...
[[189866]]私たちは皆、検証コードに精通しています。reCAPTCHA は、人間と機械を区別...
[[425033]]私たちはしばらくの間、展開モデルの最適化に取り組んできました。ここ数日でようやく...
最近、ネットユーザーによってオンラインフォーラムで有名なブラウザにセキュリティ上の脆弱性があることが...
ビッグデータは人々にとって巨大な概念であるようです。しかし、多くの企業がすでに業務にビッグデータを活...
[[422501]]多層パーセプトロン(MLP)は非常に長い歴史を持っています。多層パーセプトロン(...
人工知能の重要な分野として、機械学習はますます利用されています。この技術をより早く習得するにはどうす...
ガートナーが今年発表した技術成熟度曲線には、上昇段階にある新興技術が 16 個あります。これらの新興...
アルゴリズムの時代が到来しました。 Google、Amazon、AppleなどのIT大手が開発した、...
最近、シリコンバレーの高精度地図サービスプロバイダーであるDeepMapは、Accelが主導し、エン...
[[402913]]オブジェクトの明るさが色やビューに大きく依存する多くの没入型 VR/AR アプリ...