YOLOの父は抗議を表明するためにCV業界を辞め、軍事やプライバシーのスヌーピングにAIアルゴリズムを使用することを拒否

YOLOの父は抗議を表明するためにCV業界を辞め、軍事やプライバシーのスヌーピングにAIアルゴリズムを使用することを拒否

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

AI学術界に大きな激震が走っています。

YOLOアルゴリズムの作者ジョセフ・レドモン氏は、自身のオープンソースアルゴリズムが軍事やプライバシーの問題で使用されていたため、すべての履歴書研究を停止すると個人のTwitterで発表した。これにより彼の道徳心が大いに試された。

YOLO は、コンピューター ビジョンの分野で最もよく知られているターゲット検出アルゴリズムの 1 つであり、オープン ソースであるため業界で広く採用されています。

著者の Joseph Redmon 氏は、このアルゴリズムで 2016 CVPR People's Choice Award と 2017 CVPR Best Paper Honorable Mention を受賞しました。

YOLOとその改良アルゴリズムは学界で広く引用されており、レドモン氏の筆頭著者である関連論文3本の引用総数は1万件を超えている。

このような影響力のある学者による突然の撤退発表は、必然的に学界に衝撃を与えた。

Fast.aiの創設者ジェレミー・ハワード氏は、「このようなことは今まで見たことがない」と感想を述べた。

フランスのテクノロジー企業の最高技術責任者(CTO)は、レドモン氏の信念を尊重すると述べた。

レドモン氏の過去の派手な性格が、今日の彼の決断のきっかけとなったのかもしれない。

YOLOの父について

ジェセフ・レドモンは、米国のミドルベリー大学を卒業し、コンピューターサイエンスを専攻し、数学を副専攻しました。 2013年にワシントン大学に入学し、コンピューターサイエンスの修士号を取得し、その後2019年まで博士号取得を目指しました。

この期間中、彼と彼の指導者である Ali Farhadi は共同で YOLO アルゴリズムを提案し、改良しました。

彼の主な研究分野は、物体検出、画像分類、モデル圧縮です。レドモンはCV研究からの撤退を発表したが、これは基本的に今後新たに始めることを意味する。

[[315879]]

彼の履歴書は次のようになります。

ジョセフ・レドモンの過去のインターンシップ経験も素晴らしいものでした。

彼は Google Brain でインターンとして働き、リアルタイムのロボットによる把持検出に取り組みました。その後、AI2(後のXNOR.ai)でインターンをし、モバイルデバイス上での画像分類に必要な計算量を削減できるバイナリ近似畳み込みニューラルネットワークXNOR-Netを提案しました。

レドモン氏は、現実世界のアプリケーション向けに、より優れた高速な CV ツールの開発に取り組んだ功績により、2018 年に「機械認識、音声技術、コンピューター ビジョン」部門で Google PhD フェローシップを受賞しました。

レドモン氏自身もTEDのステージに登場し、物体を素早く識別するCVアルゴリズムを紹介した。

高速YOLOアルゴリズム

YOLO の正式名称は「You Only Look Once」です。この名前は、このアルゴリズムの高速性の利点も示しています。そのため、YOLO アルゴリズムは多くのエッジ デバイスで広く使用されています。

他の有名なターゲット検出アルゴリズムである Fast R-CNN とは異なり、YOLO は「ワンステップ」戦略を採用して、ターゲット オブジェクトのカテゴリと位置を同時に生成します。

YOLO アルゴリズムには、Fast R-CNN に比べて 2 つの大きな利点があります。

1. 高速: 毎秒 45 フレームの検出速度で、リアルタイムのビデオ検出に使用でき、小型モデルでは最大 155 フレームまで検出できます。

2. 汎用性が高い: 実際の画像データでトレーニングされたネットワークは、架空の絵画にも使用できます。

ただし、YOLO にも一定の制限があります。精度は Fast R-CNN ほど高くなく、各正方形で 1 つのオブジェクトしか検出できず、エッジが不規則なオブジェクトの場合、周囲のオブジェクトの認識に影響します。

作者のレドモン氏はその後、オリジナルのYOLO技術をベースにYOLO9000やYOLOv3といったアルゴリズムを開発し、検出対象の種類を拡大し、モデルの精度を向上させました。

今後もYOLOを使用できますか?

レッドモン氏の突然の決断はYOLOの今後の利用に影響を与えるでしょうか?今のところこれについては心配しないでください。

著者は CV 研究からの撤退を発表しただけであり、彼の個人 GitHub ページにあるオープンソース プロジェクトはいずれも終了していません。たとえ作者が将来的にメンテナンスを行わなくなったとしても、YOLO の影響力の大きさを考えると、オープンソース コミュニティの他の開発者が今後もメンテナンスを継続することは間違いありません。

レッドモン氏自身がYOLOアルゴリズムの特許を申請する可能性は低い。なぜなら、レッドモン氏はこの態度をAI技術の適用範囲に対する不満を表明するために利用しているだけであるからだ。特許を申請しても、軍事的および非倫理的な商業的利用を防ぐことはできない。

AIが今日まで発展するにつれて、倫理的な問題がますます顕著になってきています。

サンフランシスコでは警察が法執行に顔認識技術を使用することを禁止する法律が可決され、メグビー氏は教室でAI監視技術を使用したことで非難されたが、これらはすべてAIが一線を越えないようにという警告である。

YOLOの生みの親の撤退は、AIの倫理的問題に関して学術界に新たな警鐘を鳴らすものとなった。

<<:  10回!マイクロソフトは、1000億のパラメータをトレーニングできる史上最大のNLGモデルをオープンソース化しました。

>>:  グリーンロボットが環境の持続可能性にどのように貢献できるか

推薦する

...

...

...

すべての AI エンジニアが知っておくべき AI ツールとフレームワークのトップ 10

競争で優位に立つために、このブログでは、TensorFlow、PyTorch、sci-kit-lea...

Tantan Pan Ying: アルゴリズムベースの「額面」ソーシャル プラットフォームを作成する方法

編集者注: 「女性が風邪をひかずに舞台を降りられるのは素晴らしいことだ。そして、心が情熱で満たされる...

中国の科学者が色を変えることができる柔らかいロボットを開発

ああ、これはまだ私が知っているロボットですか? 「カモフラージュして色を変える」と「柔らかく変形する...

巨大企業間の今後の AI 戦争: マイクロソフトは左に進んで 2B、グーグルは右に進んで 2C

AI時代の到来非常にドラマチックなのは、Microsoft Build 開発者会議と Google...

SQL は ChatGPT を実行できますか?答えはYESです!

ChatGPTは世界中で人気を博しています。今日の質問は、SQL で ChatGPT を実行できる...

OpenAI COO: AIが一夜にしてビジネスに大きな変化をもたらすとは期待しない

12月5日、OpenAIは企業ユーザーの開拓に力を入れているものの、同社の幹部の一部は、この技術がす...

30 行の JavaScript コードで、わずか数分でニューラル ネットワークを作成する方法を学びます。

[[203712]]ニューラルネットワークを自分で構築するのは複雑すぎますか? [[203713]...

国際翻訳コンテストで優勝したモデルがByteDanceによってオープンソース化された。

Transformer などの主流のテキスト生成アルゴリズムの単語単位の生成は、並列計算に適した ...

データコレクターにおける TensorFlow を使用したリアルタイム機械学習

DataOps プラットフォームの真の価値は、ビジネス ユーザーとアプリケーションがさまざまなデータ...

MIT、Wikipedia の更新、間違いの修正、偽ニュースの特定を行う AI 編集システムを開始

[[334141]]誰でも編集できるオンライン百科事典である Wikipedia では、各エントリを...

現在世界で最も重要な古典的アルゴリズムトップ10

最近、誰かが StackExchange で、ネットユーザーに現在世界で最も古典的なアルゴリズムのト...

ショック! Google がショウジョウバエの脳全体を自動で再構築: 40 兆ピクセルの画像が初めて公開されました。

昨日、Google はハワード・ヒューズ医学研究所 (HHMI) およびケンブリッジ大学と共同で、シ...