コーヒーショップの監視ビデオが流出し、何百万人もの人々が視聴していた。マスク氏は「ひどい！」と叫んだ。 AIはあなたがコーヒーをどれくらい飲んだかを正確に把握しています

私たちはプライバシーがますます少なくなる世界に住んでいます。

今日、ネット上で拡散されたこのビデオは多くの人を怖がらせました。

コーヒーショップでは、各顧客が店内に数分間滞在した時間と、各ウェイターが顧客に持ってきたコーヒーのカップ数がすべてビデオで明確に表示されました。

このビデオは12時間ほど前に公開されたが、すでに100万人以上の視聴者を集めている。

この動画を投稿したネットユーザーはこう述べた。「このコンセプトは、コーヒーショップがAIを使ってバリスタと顧客を分析する方法を示しています。」プライベートなカフェ空間を存分にお楽しみください。 😂

別のネットユーザーは、これは驚くべきことではないと述べた。消費者として、多くの店舗ではあなたが店に入った瞬間にあなたのことをすべて知っているということを知っておくべきです。

それに比べれば、ケンブリッジ・アナリティカ事件は見劣りする。

（2018年、フェイスブックは、英国のデータ分析会社が2016年にフェイスブックのユーザー5000万人の情報を違法に入手し、その情報を使って投票結果を予測し影響を与えるソフトウェアプログラムを構築し、トランプ大統領の勝利を助けたことを認めた。）

コメント欄にはマスク氏自身も現れ、感嘆符を2つ続けて付けた。

AIがカフェの従業員や顧客をスパイするという考えが十分に恐ろしいと思うなら、コストを考慮に入れなければ、空には何千ものドローンがいて、リアルタイムの追跡データを規制当局に送信し、すべてが追跡され、記録される可能性があるというのが現実です。

現在の物体検出および画像認識技術は非常に強力なので、専門部門さえ必要ありません。誰でもアマチュアのドローンで追跡を行うことができます。

数年前、個別のグラフィックカードで 1080p ストリーミングを実行する場合、最大容量は 6 オブジェクトのみであったことを知っておく必要があります。

どこにでも目がある

現実には、今日の世界はカメラで溢れています。

これらの企業の多くは、AIとビデオフィードの視覚認識を駆使して、消費者を追跡するための非常に秘密裏な戦略を展開しています。

たとえば、ウォルマートのスマートリテールラボでは、IRL センサーとカメラにより、スタッフが店舗内のすべての情報を把握できます。

ファーストフード店も従業員の監視にAI技術を導入している。ここでは従業員にマスクの着用が義務付けられており、誰かがマスクを外すと、管理者はすぐに気付きます。

さらに、当社のモバイル位置情報データも販売されています。

ほぼすべての携帯電話事業者は、小売店に匿名でデータを販売しており、これは事業者の主要事業の一部であると言えます。

「オペレーター名 + クラウドインサイト」を Google で検索するだけで、結果に驚かれることでしょう。

「特定の時間に特定の場所を何人の人が通過するかを知りたいですか？彼らの年齢や収入状況は？彼らのうち何人が潜在顧客になるか？」

もちろん、「Crowd Insights」サービスでは、データが匿名であり、データの収集方法によって個人のプライバシーが漏洩することはないということを強調します。

「私のデータが収集されたら、会社に支払いを求めることはできますか？」と言う人もいます。

企業で使用されているカメラに関して、コメント欄で次のような経験談をシェアした人がいました。

「私はスタジアムのバックエンドのセキュリティカメラシステムに携わっていますが、私たちが公開しているのは実際のデータの3分の1だけです。」

「まるで映画のように、顔を近づけるとシステムがあなたの居場所を知らせてくれます。」

これを実現するために必要なのは、任意のウェブカメラを用意し、300 ドルのソフトウェアをインストールし、ディスク容量がなくなるまで実行するだけです。

長所と短所は？

この点に関して、AIコンサルティングの専門家であるDiego San Esteban氏は次のように見解を述べています。

彼は、AI モニタリングには、従業員のパフォーマンスと生産性を継続的にモニタリングし、管理者がより適切な戦略を策定できるなど、多くの利点があると考えています。

さらに、AI は客観的なパフォーマンスデータを提供して、評価における人間の偏見を回避することもできます。

デメリットも数多くあります。最も批判されるのは、もちろん従業員のプライバシー権の侵害です。また、社内に不信感を生み、士気や仕事の満足度にも影響を及ぼします。

AI は、作業が行われている状況を完全に理解できず、人間的な共感力も欠いています。

さらに、トレーニングデータに内在するバイアスによって間違いが発生したり、影響を受けたりする可能性が高く、これは従業員にとって非常に不公平です。

物体検出アルゴリズム

実際、この物議を醸した事件の背後には、非常に一般的な AI 技術である物体検出があります。

たとえば、街路の写真が与えられた場合、オブジェクト検出モデルは、画像内のさまざまなオブジェクト（信号機、車両、道路標識、建物など）の注釈またはラベルのリストを返します。

これらのラベルには、「人物」などの各オブジェクトの適切なカテゴリと、オブジェクトを完全に囲む長方形の領域である「境界ボックス」が含まれます。

産業アプリケーション

物体検出は人間にとって非常に重要なタスクです。新しい部屋やシーンに入るとき、私たちの最初の反応は、そこにある物体や人を視覚的に評価し、理解することです。

人間と同様に、物体検出はコンピュータが視覚世界を理解して対話できるようにする上で重要な役割を果たしており、多くの業界で広く使用されています。

- サイトの安全性:

オブジェクト検出モデルは、職場の安全性とセキュリティの向上に役立ちます。たとえば、機密エリアにおける不審な人物や車両の存在を検出できます。さらに革新的なのは、作業員が手袋、ヘルメット、マスクなどの個人用保護具（PPE）を確実に使用できるようにすることだ。

- ソーシャルメディア:

オブジェクト検出モデルは、デジタルメディア内の特定のブランド、製品、ロゴ、または人物の存在を識別するのに役立ちます。広告主はこの情報を使用してデータを収集し、ユーザーにより関連性の高い広告を表示できます。また、不適切または禁止されているコンテンツを検出してフラグを付けるプロセスを自動化するのにも役立ちます。

- 品質管理:

オブジェクト検出モデルにより、視覚データの自動レビューが可能になります。コンピュータとカメラはデータをリアルタイムで分析し、視覚情報を自動的に検出して処理し、その重要性を理解することができるため、継続的な視覚的な確認を必要とするタスクにおける人間の介入を減らすことができます。これは製造生産の品質管理に特に役立ちます。効率が向上するだけでなく、人間の目では気付かない可能性のある生産上の異常も検出できるため、生産の中断や製品のリコールの可能性を防ぐことができます。

初めて66 APに到達し、最強のSOTAアルゴリズムがリストのトップに

現在、ターゲット検出アルゴリズムの性能に関しては、国内チームの「DETRs with Collaborative Hybrid Assignments Training」が最大66 APのスコアでCOCOリストのトップを占めています。この研究はICCV 2023に採択されました。

この論文では、著者らは、多様なラベル割り当て方法からより効率的で効果的な DETR ベースの検出器を学習できる、新しい共同ハイブリッド割り当てトレーニングスキームである Co-DETR を提案しました。

複数の並列補助ヘッド（ATSS や Faster RCNN などの 1 対多のラベル割り当てによって監視）をトレーニングすることにより、新しい Co-DETR はエンドツーエンド検出器のエンコーダーの学習能力を簡単に向上させることができます。

追加のカスタマイズされた正のクエリのためにこれらの補助ヘッドから正の座標を抽出することにより、Co-DETR はデコーダー内の正のサンプルのトレーニング効率も向上させることができます。

さらに、推論中にこれらの補助ヘッドは破棄されるため、この方法では元の検出器に追加のパラメーターや計算コストが導入されず、手動の非最大抑制 (NMS) も必要ありません。

論文アドレス: https://arxiv.org/abs/2211.12860v5

プロジェクトアドレス: https://github.com/Sense-X/Co-DETR

- エンコーダの最適化:

トレーニングスキームでは、1 対多のラベル割り当てによって監視される複数の並列補助ヘッドをトレーニングすることにより、エンドツーエンド検出器のエンコーダの学習能力を簡単に向上できます。

- デコーダーの最適化:

これらの補助ヘッドから正の座標を抽出することにより、追加のカスタマイズされた正のクエリが実行され、デコーダーの注意学習が改善されます。

- SOTAパフォーマンス:

ViT-L（304Mパラメータ）を搭載したCo-DETRは、COCOテスト開発で66.0%のAPを達成した最初のモデルです。

実験結果によると、Swin-L バックボーンネットワークに基づく Co-DETR メソッドにより、既存の SOTA モデル DINO-Deformable-DETR のパフォーマンスが 58.5% から 59.5% に向上します (COCO 検証セット)。

ViT-L バックボーンネットワークのサポートにより、Co-DETR は COCO テスト開発で 66.0% AP、LVIS 検証セットで 67.9% AP を達成しました。

さらに、Co-DETR は、従来の方法と比較して、より小さなモデルサイズでより優れたパフォーマンスを実現します。

<<: ボストン大学の「Platypus-70B」がHugging Face大型模型ランキングでトップに！効率的なデータセットと独自のLoRA微調整が鍵

>>: AIGC: 将来は誰が支払うのでしょうか?

コーヒーショップの監視ビデオが流出し、何百万人もの人々が視聴していた。マスク氏は「ひどい！」と叫んだ。 AIはあなたがコーヒーをどれくらい飲んだかを正確に把握しています

どこにでも目がある

長所と短所は？

物体検出アルゴリズム

産業アプリケーション

初めて66 APに到達し、最強のSOTAアルゴリズムがリストのトップに

2019年に「AI+教育」分野で大手企業は何をしたのでしょうか?

MITの中国人博士課程学生がChatGPTをJupyterに移行し、自然言語プログラミングをワンストップソリューションに

一流の科学者はどうやって AI を習得するのでしょうか? DeepSpeed4Science: 高度な AI システム最適化技術を使用して科学的発見を可能にする

Yan Shuicheng氏は、Transformerのパワーがそのアーキテクチャから生まれることを証明する「恥ずかしいほどシンプルな」モデルを公開した。

知能ロボットの主要技術：製造分野の知能化を推進

AI とブロックチェーンは 2020 年にモバイルアプリ業界にどのような革命を起こすのでしょうか?

大規模マルチビューガウスモデル（LGM）：5秒で高品質の3Dオブジェクトを生成、試用可能

リアルすぎて怖い！ Gen-2 の壮大なアップデート、手作りの 4K ハリウッド大作、Midjourney の夢の連携、CEO: クリエイティブソフトウェアの時代は終わった

ディープインテリジェンスとは: 2021 年のディープインテリジェンスのトレンドは何ですか?

推薦する

AIが世界に登場しようとしています。機械は人間の倫理を破壊するのでしょうか？

Google が AVA データベースを開始: 動画内の人間の行動を機械が認識できるようにする

AIによる教育革命：自己主導型およびガイド型適応型学習の包括的分析

改良された ResNet が Transformer を上回り、アーキテクチャの戦いが再燃します。著者は「革新はない」と述べた

知識が求められるポストディープラーニング時代において、知識グラフをいかに効率的かつ自動的に構築できるのでしょうか?

複数の機会が生まれており、虹彩認識技術の将来の発展は有望である

よく使われる 3 つの C# ソートアルゴリズム

TFserving によるディープラーニングモデルの導入

サプライチェーン管理における自動化の重要性

人工知能 + ブロックチェーンの開発動向と応用研究レポート（受賞リスト付き）

Java 上級: 負荷分散のための 5 つのアルゴリズムの詳細な理解

新しい研究では、AIを使用してトラウマ性解離を引き起こす脳領域を探索する

AIアプリケーションのスケールは実装が難しいが、将来的には有望である