YOLOの父は抗議を表明するためにCV業界を辞め、軍事やプライバシーのスヌーピングにAIアルゴリズムを使用することを拒否

YOLOの父は抗議を表明するためにCV業界を辞め、軍事やプライバシーのスヌーピングにAIアルゴリズムを使用することを拒否

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

AI学術界に大きな激震が走っています。

YOLOアルゴリズムの作者ジョセフ・レドモン氏は、自身のオープンソースアルゴリズムが軍事やプライバシーの問題で使用されていたため、すべての履歴書研究を停止すると個人のTwitterで発表した。これにより彼の道徳心が大いに試された。

YOLO は、コンピューター ビジョンの分野で最もよく知られているターゲット検出アルゴリズムの 1 つであり、オープン ソースであるため業界で広く採用されています。

著者の Joseph Redmon 氏は、このアルゴリズムで 2016 CVPR People's Choice Award と 2017 CVPR Best Paper Honorable Mention を受賞しました。

YOLOとその改良アルゴリズムは学界で広く引用されており、レドモン氏の筆頭著者である関連論文3本の引用総数は1万件を超えている。

このような影響力のある学者による突然の撤退発表は、必然的に学界に衝撃を与えた。

Fast.aiの創設者ジェレミー・ハワード氏は、「このようなことは今まで見たことがない」と感想を述べた。

フランスのテクノロジー企業の最高技術責任者(CTO)は、レドモン氏の信念を尊重すると述べた。

レドモン氏の過去の派手な性格が、今日の彼の決断のきっかけとなったのかもしれない。

YOLOの父について

ジェセフ・レドモンは、米国のミドルベリー大学を卒業し、コンピューターサイエンスを専攻し、数学を副専攻しました。 2013年にワシントン大学に入学し、コンピューターサイエンスの修士号を取得し、その後2019年まで博士号取得を目指しました。

この期間中、彼と彼の指導者である Ali Farhadi は共同で YOLO アルゴリズムを提案し、改良しました。

彼の主な研究分野は、物体検出、画像分類、モデル圧縮です。レドモンはCV研究からの撤退を発表したが、これは基本的に今後新たに始めることを意味する。

[[315879]]

彼の履歴書は次のようになります。

ジョセフ・レドモンの過去のインターンシップ経験も素晴らしいものでした。

彼は Google Brain でインターンとして働き、リアルタイムのロボットによる把持検出に取り組みました。その後、AI2(後のXNOR.ai)でインターンをし、モバイルデバイス上での画像分類に必要な計算量を削減できるバイナリ近似畳み込みニューラルネットワークXNOR-Netを提案しました。

レドモン氏は、現実世界のアプリケーション向けに、より優れた高速な CV ツールの開発に取り組んだ功績により、2018 年に「機械認識、音声技術、コンピューター ビジョン」部門で Google PhD フェローシップを受賞しました。

レドモン氏自身もTEDのステージに登場し、物体を素早く識別するCVアルゴリズムを紹介した。

高速YOLOアルゴリズム

YOLO の正式名称は「You Only Look Once」です。この名前は、このアルゴリズムの高速性の利点も示しています。そのため、YOLO アルゴリズムは多くのエッジ デバイスで広く使用されています。

他の有名なターゲット検出アルゴリズムである Fast R-CNN とは異なり、YOLO は「ワンステップ」戦略を採用して、ターゲット オブジェクトのカテゴリと位置を同時に生成します。

YOLO アルゴリズムには、Fast R-CNN に比べて 2 つの大きな利点があります。

1. 高速: 毎秒 45 フレームの検出速度で、リアルタイムのビデオ検出に使用でき、小型モデルでは最大 155 フレームまで検出できます。

2. 汎用性が高い: 実際の画像データでトレーニングされたネットワークは、架空の絵画にも使用できます。

ただし、YOLO にも一定の制限があります。精度は Fast R-CNN ほど高くなく、各正方形で 1 つのオブジェクトしか検出できず、エッジが不規則なオブジェクトの場合、周囲のオブジェクトの認識に影響します。

作者のレドモン氏はその後、オリジナルのYOLO技術をベースにYOLO9000やYOLOv3といったアルゴリズムを開発し、検出対象の種類を拡大し、モデルの精度を向上させました。

今後もYOLOを使用できますか?

レッドモン氏の突然の決断はYOLOの今後の利用に影響を与えるでしょうか?今のところこれについては心配しないでください。

著者は CV 研究からの撤退を発表しただけであり、彼の個人 GitHub ページにあるオープンソース プロジェクトはいずれも終了していません。たとえ作者が将来的にメンテナンスを行わなくなったとしても、YOLO の影響力の大きさを考えると、オープンソース コミュニティの他の開発者が今後もメンテナンスを継続することは間違いありません。

レッドモン氏自身がYOLOアルゴリズムの特許を申請する可能性は低い。なぜなら、レッドモン氏はこの態度をAI技術の適用範囲に対する不満を表明するために利用しているだけであるからだ。特許を申請しても、軍事的および非倫理的な商業的利用を防ぐことはできない。

AIが今日まで発展するにつれて、倫理的な問題がますます顕著になってきています。

サンフランシスコでは警察が法執行に顔認識技術を使用することを禁止する法律が可決され、メグビー氏は教室でAI監視技術を使用したことで非難されたが、これらはすべてAIが一線を越えないようにという警告である。

YOLOの生みの親の撤退は、AIの倫理的問題に関して学術界に新たな警鐘を鳴らすものとなった。

<<:  10回!マイクロソフトは、1000億のパラメータをトレーニングできる史上最大のNLGモデルをオープンソース化しました。

>>:  グリーンロボットが環境の持続可能性にどのように貢献できるか

推薦する

Scikit-learn をご存知ですか?これらの機能をご存知ですか?

[[229302]]ビッグデータ概要編纂者: 王暁奇、大潔瓊、アイリーンScikit-learn ...

DAMOアカデミーが大規模モデルテストベンチマークを発表: GPT-4はかろうじて合格、他のモデルはすべて不合格

ビッグモデルの発展、特に最近のさまざまなオープンソースのビッグモデルのリリースにより、さまざまなモデ...

...

イタリアの規制当局はChatGPTがEUのプライバシー法に違反していると主張

海外メディアの報道によると、1月31日、イタリアの規制当局は、OpenAIの人工知能チャットボット「...

...

今後の企業イノベーションを牽引する10の優れたテクノロジー

エンタープライズ テクノロジーの将来は、業界を変えるほどの大きな革新をもたらすでしょう。 5G から...

システムアーキテクト、アルゴリズムエンジニア、人工知能エンジニアはどの程度の数学を学ぶ必要がありますか?

オリンピック数学を勉強したことがない彼に、システム アーキテクトになれるかと誰かが尋ねました。他にも...

Alibaba Cloud 第2回インタビュー: Zookeeper 一貫性アルゴリズム

[[424686]]前回、私は後輩たちとSpringに関するいくつかの知識ポイントについて話しました...

...

パロアルトネットワークス:AIを使ってAIと戦うことは、ネットワークセキュリティ技術の発展における避けられないトレンドです

「 AI攻撃を阻止するために人力を使うことはできません。AIと戦うにはAIを使わなければなりません。...

...

AIがクリエイティブな動画を自動生成: ビッグモデルを活用する方法

著者 | 崔昊レビュー | Chonglouまとめこの記事では、大規模な言語モデルと AI ビデオ生...

AIがデータ統合の状況をどう変えるのか

生成 AI は統合の状況を変えています。 チームの経済性、速度、プロジェクト構造、配信モデルについて...

Microsoft Megvii の顔認識は 100% 動作不能! 写真の「見えないマント」で写真のプライバシー データを保護

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

1 つの記事で RNN (リカレント ニューラル ネットワーク) の基礎を理解する

[[211628]] 1. ニューラルネットワークの基礎ニューラル ネットワークは、あらゆる関数に適...