このAIは、監視対象を素早く検索するのに役立ちます:テキスト配置キーフレーム、24時間のビデオ録画10分処理

このAIは、監視対象を素早く検索するのに役立ちます:テキスト配置キーフレーム、24時間のビデオ録画10分処理

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

今日では、ビデオ監視の存在により、過去には検証が困難だった多くの事実を記録することが可能になりました。

しかし、 24時間連続監視で1~2秒の「犯罪現場」を見つけようとするのは、依然として労力を要する作業だ。

欲しい写真をすぐに見つける良い方法はありますか?

実際、数人の外国人が、24 時間のビデオ録画を 10 分で処理し、テキストを使用して画面をフレームごとに正確に検索できるツール開発しました

何より、無料です!

使い方は?

この道具は「篩」と呼ばれ、中国語で「ふるい」を意味します。

まず、Sieve を使用する許可を得るために、API キーを申請する必要があります。

Sieveのウェブサイトのホームページに申し込みポータルがあります。メールアドレスや名前などの簡単な情報を入力するだけです。

次に、受け取ったキーを次の URL に入力します。

https://sievedata.com/app/query?api_key=キー

開くと、次のインターフェースが表示されます。

「ビデオをアップロード」をクリックし、URL を入力してビデオをアップロードします。

この URL には任意のクラウド ストレージ リポジトリ アドレスを指定できます。

もちろん、ローカルビデオをアップロードすることもできますが、コマンドラインを使用する必要があります——

まずリポジトリ アドレスをクローンし、依存関係をインストールします。

 CD 自動- ビデオ- 処理
conda 作成--name myenv python = 3.7
conda をアクティブ化しますmyenv
pip インストール-r 要件. txt


次に、スクリプトを実行し、次の 2 つのパラメータを使用してローカル ビデオをアップロードします。

 python run . py --sieve_api_key キー


プラットフォームが自動的に URL を生成します。

ビデオをアップロードした後、システムが自動的にデータをフレームに分割し、各フレームに対応するメタデータを生成するまで待ちます(これらのメタデータは、対応する画像を見つけるための後続のクエリを容易にするための「タグ」です)

著者らは、27万フレームの24時間のビデオを10分未満で処理できると述べている。

次に、最も期待される部分であるクエリを開始できます。

クエリでは固定パラメータを使用する必要があります。

たとえば、 person_count に「3」と入力すると数秒後に次の結果が表示されます。

まあ、とても満足しています。足だけを見せている人でも検出できます。

各写真はクリックすると拡大して閲覧することができ、右側にはフレームの元情報も表示されます。

ただし、フレームの位置のみが表示され、具体的な時点は表示されないようです。

その他のパラメータは次のとおりです。

person_present、誰かが登場する画面を照会します(値を True に設定するだけです) ;
motion_detected、動画像を照会します。
照明、さまざまな照明条件の画像を照会します
(たとえば、値が fair の場合は晴れた日を意味します)
loaction、特定の場所の画像を照会します
(中庭に値を割り当てるなど)
緑、緑の植物が写っている画像を検索します。

クエリを組み合わせることができます。たとえば、「緑の植物、明るい光、2 人の人物」を含む画像を検索するには、次の 3 つのパラメータを入力します。

必要な結果が見つかったら、画像データをローカル コンピューターにエクスポートすることもできます。

以上が動画検索ツールSieveの使い方と機能です。

本当にリバースモニタリングの効率化が図れるのでしょうか?

しかし、一部のネットユーザーが言うように、これは本当に強力そうだが、ビデオに映っている人物がいつ到着し、いつ出発したかがわかるタイムラインが得られ、複数のカメラ間で「容疑者」を追跡できれば、より実用的になるだろう。

著者は次のように答えました: より実用的なクエリパラメータを提供することを検討しています。

著者について

Sieve の創設者兼 CEO の 1 人は、まだ 20 歳でカリフォルニア大学バークレー校を卒業し、電気工学とコンピューター サイエンスの学士号を取得した Mokshith Voodarla 氏です。

彼は、Scale AI で ML、Ford Greenfield Labs でコンピューター ビジョン、NVIDIA でロボティクスに携わってきました。

ウェブサイトアドレス:
https://sievedata.com/#概要

GitHub ホームページ:
https://github.com/Sieve-Data/自動ビデオ処理

<<:  新たな勢力が市場に参入、コンパイラーの巨匠クリス・ラトナーが自らのビジネスを始める

>>:  剪定法を使用してより良い決定木を設計する方法

ブログ    
ブログ    

推薦する

デジタルヘルスと医療AIベンチャーキャピタル投資は2021年第1四半期に42億ドルに達した

CB Insightsのデータによると、遠隔医療は2021年第1四半期に139件の取引で過去最高の4...

AIが都市の発展にどのように役立つか

人工知能は、特に交通インフラに関して、都市開発の近代化という使命を変革することができます。現代社会に...

Java プログラミング スキル - データ構造とアルゴリズム「基数ソート」

[[394975]]基数ソート基数ソートは「分散ソート」に属し、「バケット ソート」または「ビン ...

2021年の世界トップ10の画期的テクノロジー:TikTokアルゴリズムと北斗ナビゲーションがリストに

[[384967]]最近、アメリカの「MITテクノロジーレビュー」は、2021年の世界のトップ10の...

人間かAIか?両方

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

機械学習ニューラルネットワークとPython実装

ニューラル ネットワークは、機械学習のあらゆる側面に及ぶ幅広い用途に使用されます。この記事では、主に...

普遍近似定理を理解しなければ、ニューラルネットワークを理解することはできない

ニューラルネットワークの威力を示す証拠文字通り、普遍近似定理はニューラル ネットワークがどのように機...

...

...

AIは脳の信号をリアルタイムで解釈し、画像の主要な視覚的特徴を7倍の速度で復元するとルカン氏は述べた。

AIが脳の信号をリアルタイムで解釈できるようになりました!これはセンセーショナルなことではありませ...

R言語におけるAprioriアルゴリズムの応用

[[193979]] I. コンセプト関連性分析は、大規模なデータセットに隠された意味のあるつながり...

OpenAI の新しいモデルは大きな飛躍を示しています。AGI のプロトタイプは人類を脅かす可能性があり、アルトマンを解雇する導火線にもなりました。

サム・アルマンが解雇され、最新の内幕が明らかに!ロイター通信によると、彼が解雇されるわずか4日前に、...

SQLデータベースに基づくアルゴリズムを学ぶ

データベースは、データを保存し、大規模な計算を実行する場所です。現実世界の問題を解決するために、デー...

AIモデルの「レッドチーム」からの迅速な修正を期待しないでください

ホワイトハウスの関係者らが人工知能チャットボットが引き起こす可能性のある社会的危害を懸念する中、シリ...

量子コンピューティングと人工知能の関係は何ですか?

量子コンピューティングは、学術誌だけでなく、一般の新聞や雑誌でも頻繁に議論される、非常に人気の高いト...