AI によって自動化された、誰でも使えるオンライン写真編集！北京大学の卒業生がアルゴリズムを新たな高みへ

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

これで誰でも画像セグメンテーションを試して遊ぶことができます。

オンライン API では、画像の URL を入力するだけで、対象の背景を自動的に削除できます。

今朝チャンピオンズリーグで優勝したばかりのバイエルンに挑戦してみましょう。

そしてこうなりました。

しかし、この象のように、物事がうまくいかないこともあります。

割れた後...ねえ、もう片方の歯はどこに行ったの？

また、手と猫が同時にいる場合も。

結果は...ちょっと変です。

この新しいアプリケーションは ObjectCut と呼ばれています。Reddit でリリースされると、12 時間で700 回以上のアクセスがありました。

多くのネットユーザーは「すごい！」と言った。

誰でも試せる簡単な3つのステップ

上記の象を例にとると、使用手順は非常に簡単です。

まず、任意の画像を選択し、画像のアドレスをコピーします。

2 番目のステップでは、Web サイトの指定された場所にアドレスを貼り付けて、「エンドポイントのテスト」をクリックします。

数秒待ってから、その横に生成された URL をクリックすれば完了です。

そして、牙のない象になりました。

それはまだ北京大学の卒業生の研究です

この技術はあなたにとって馴染み深いものですか? ほんの数ステップの簡単な操作で画像の背景を削除できます。

これは、実際のオブジェクトをリモートでコンピューターに「コピーして貼り付ける」ことができる以前の AR アプリケーション AR Cut & Paste に似ています。

これら 2 つのアプリケーションの背後にある主なテクノロジーは、BASNet と呼ばれる顕著なオブジェクト検出方法です。

この研究はCVPR 2019の最終候補に選ばれました。論文の筆頭著者は中国人の秦雪斌氏で、今年2月にカナダのアルバータ大学で博士号を取得し、北京大学で修士号を取得しました。

BASNet のコアフレームワークは下の図に示されており、主に 2 つのモジュールで構成されています。

最初のモジュールは予測モジュールで、U-Net に似た高密度監視エンコーダー/デコーダーネットワークです。その主な機能は、入力画像から顕著性マップを予測することを学習することです。

2 番目のモジュールは、マルチスケール残差改良モジュール (RRM) です。その主な機能は、残差と実際の値との間の残差を学習することによって予測モジュールによって取得された顕著性マップを改良し、それによって予測モジュールの顕著性マップを改良することです。

BASNetに加えて、一部のネットユーザーは、同じ作者によるものでより良い結果が得られるU2-Netも推奨しています。

彼の研究は「U2-Net: 顕著な物体検出のためのネストされた U 構造の深化」です。

実験結果は次のとおりです。

同じテクノロジー、異なる遊び方。この方法にはどんな興味深い応用があると思いますか?

また、このオンライン画像分割アプリケーションを試してみたい場合は、以下のリンクをクリックしてください。

Webサイト：
https://rapidapi.com/objectcut.api/api/background-removal

<<: 人工知能が話題になって3年。雇用情勢は依然として明るいのか？

>>: AIアプリケーションのための実用的なフレームワークを構築するための5つのステップ

対照学習も次元の崩壊を引き起こすのでしょうか? LeCunとTian Yuandongのチームの新しい研究DirectCLRは、

ブログ

人工知能はパーキンソン病の初期段階を治療できるかもしれない

ブログ

AIは脳スキャンだけであなたの政治的思想を予測できる

ブログ

スマートコミュニティにおける人工知能応用の5つのシナリオ

ブログ

人工知能の雇用の方向性と展望

ブログ

世の中には、ほとんどコードを必要としない強力で古典的なアルゴリズムやプロジェクト事例にはどのようなものがありますか?

ブログ

GraphSAGEグラフニューラルネットワークアルゴリズムの詳細な説明

ブログ

タオバオの推奨シナリオのための強力なツール：複雑な目的を統合し、リアルタイムの規制をサポートする再注文モデル

ブログ

10億ピクセル画像のマルチスケール特性評価のためのスタンフォード大学の新しいニューラルシーン表現方法がSIGGRAPHに選出されました

ブログ

AI によって自動化された、誰でも使えるオンライン写真編集！北京大学の卒業生がアルゴリズムを新たな高みへ

誰でも試せる簡単な3つのステップ

それはまだ北京大学の卒業生の研究です

対照学習も次元の崩壊を引き起こすのでしょうか? LeCunとTian Yuandongのチームの新しい研究DirectCLRは、

人工知能はパーキンソン病の初期段階を治療できるかもしれない

AIは脳スキャンだけであなたの政治的思想を予測できる

スマートコミュニティにおける人工知能応用の5つのシナリオ

人工知能の雇用の方向性と展望

世の中には、ほとんどコードを必要としない強力で古典的なアルゴリズムやプロジェクト事例にはどのようなものがありますか?

GraphSAGEグラフニューラルネットワークアルゴリズムの詳細な説明

タオバオの推奨シナリオのための強力なツール：複雑な目的を統合し、リアルタイムの規制をサポートする再注文モデル

10億ピクセル画像のマルチスケール特性評価のためのスタンフォード大学の新しいニューラルシーン表現方法がSIGGRAPHに選出されました

推薦する

2021年の中国人工知能産業の市場状況と競争環境の分析

米宇宙軍、データセキュリティ上の懸念から生成AIツールを禁止

MITジェネシス核融合が世界記録を更新！高温超伝導磁石が恒星のエネルギーを解放、人工太陽が誕生するのか？

Google の AI 振付師は、音楽に合わせて 10 種類のフリースタイルを披露できます。ジャズやバレエを観たいですか?

こんなに高い給料がもらえる機械学習の職種の面接を受けるにはどうしたらいいのでしょうか?

NRS2019 インタビュー | テンセントの上級アルゴリズム研究者、唐宇堯氏: 新たな小売業のシナリオにおける人工知能の効率革命

人工知能やその他の科学研究には「越えてはならない一線」があり、5つの原則が倫理的な最低ラインを示している

人工知能とビッグデータの時代において、一般の人々はどうやってお金を稼ぐのでしょうか?

開発者に人気の機械学習 API 10 選

コレクションにおすすめ！素晴らしい AWS 機械学習ツールキットの概要

「人工知能＋ヘルスケア」が急成長

マスク氏はマイクロソフトの論文をOpenAIを訴える根拠として利用した。「あなたたちはすでにAGIを認めている」

素手でネジを動かす、ボストンダイナミクスのアトラスが再び進化：兄弟たち、工場に入る準備をしよう