OpenAIの画像検出ツールが公開され、CTO: AI生成画像の99%を認識可能

OpenAIの画像検出ツールが公開され、CTO: AI生成画像の99%を認識可能

OpenAI は AI 画像認識を開始しようとしています。

最新のニュースとしては、同社が検出ツールを開発中だという。

最高技術責任者のミラ・ムラト氏は次のように述べています。

このツールは非常に正確で、精度は最大 99% です。

現在、内部テスト段階にあり、近日中に一般公開される予定です。

この精度率は、それでもかなりすごいと言わざるを得ません。結局のところ、OpenAI のこれまでの AI テキスト検出の取り組みは、「精度率 26%」という悲惨な失敗に終わりました。

AIによるコンテンツ検出は簡単ではない

OpenAI はすでに AI コンテンツ検出の分野で準備を整えています。

今年1月、同社はAIと人間が生成したコンテンツを区別し、AIテキストの悪用を防ぐAIテキスト検出器をリリースした。

しかし、このツールは7月にひっそりと廃止され、何の告知もなく、ページは単に404に切り替わった。

その理由は、正解率が低すぎて「ほぼ当てずっぽうと同じ」だからです。

OpenAI自身が発表したデータによると:

AI が生成したテキストは 26% しか正しく識別できず、人間が書いたテキストは 9% 誤認しました。

OpenAIは、この性急な結論の後、ユーザーからのフィードバックを取り入れ、より効果的なテキスト導出技術を研究することで改善に取り組むと述べた。

同時に、画像や音声、動画がAIによって生成されたものかどうかを判断するツールも開発する必要があると発表しました。

現在、DALL-E 3 の登場と、Midjourney などの同様のツールの継続的な反復により、AI ペイント機能はますます強力になっています。

最も懸念されるのは、世界中で偽ニュース画像を偽造するために使用されていることだ。

たとえば、Reddit には「2001 年カスケーディア地震マグニチュード 9.1 の地震と津波」の AI 偽造「シーン」があり、1,200 人以上のネットユーザーから「いいね!」されています。

AIテキスト検出ツールと比較すると、AI描画検出ツールの開発は明らかにより緊急です(おそらく「スピーチが本人によって書かれたか秘書によって書かれたかは誰も気にしない」ためであり、「絵は真実を示す」という内容を信じないのは難しいでしょう)。

しかし、OpenAI の AI テキスト検出ツールがオフラインになったとき、一部のネットユーザーが指摘したように:

生成ツールと検出ツールの両方を同時に開発することは、本質的に矛盾しています。

一方がうまくいけば、もう一方はうまくいかないということになり、利益相反が生じる可能性もあります。

より直接的なアプローチは、第三者に引き渡すことです。

しかし、これまでサードパーティの AI テキストのパフォーマンスは良くありませんでした。

技術自体に関しては、AI がコンテンツを生成するときに透かしを非表示にすることも実現可能な方法です。

それが Google のやり方です。

数日前(今年8月末)、GoogleはOpenAIに先駆けてAI画像検出技術を発表しました。

シンセID。

現在、Google の画像モデル Imagen と連携して、モデルによって生成されたすべての画像に「AI によって生成されたメタデータ識別子」を埋め込んでいます。

画像が切り取られたり、フィルタリングされたり、色付けされたり、非可逆圧縮されたりしても、認識には影響しません。

社内テストでは、SynthIDは編集されたAI画像を多数正確に識別したが、具体的な精度率は明らかにされていない。

OpenAI の今後のツールがどのような技術を使用するのか、またそれが市場で最も正確なツールになるかどうかは不明です。

ウルトラマンが「チップ製造計画」に反応

上記のニュースは、今週ウォール・ストリート・ジャーナルが開催した Tech Live カンファレンスでの OpenAI CTO 兼 Altman 氏のスピーチから引用したものです。

会談では、2人はOpenAIに関するさらなるニュースも明らかにした。

たとえば、次世代の大型モデルが間もなく発売される可能性があります。

名前は明らかにされていないが、OpenAIは今年7月にGPT-5の商標を申請した。

「GPT-5」の精度を懸念し、エラーや誤ったコンテンツの発生を回避できるかどうかを疑問視する人もいます。

この点に関しては、CTO の態度はかなり慎重で、「多分」とだけ述べた。

彼女はこう説明した。

GPT-4 による幻覚の問題は大きく進歩しましたが、まだ必要なところまでには至っていません。

ウルトラマンが「チップ製造計画」について語った。

彼の元の言葉から判断すると、「確固たる証拠」はないが、無限の空想の余地も残されている。

デフォルトのパスに従う場合、確かにこれを行うことはありませんが、私はそれを排除するつもりはありません。

「チップ製造計画」に比べると、ウルトラマンは携帯電話を作るという噂に対しては実に素直に反応した。

今年9月、アップルの元最高デザイン責任者ジョニー・アイブ氏(アップルに27年間勤務)がOpenAIと接触していたことが暴露された。情報筋によると、アルトマン氏はAIとより自然で直感的にやり取りできるハードウェアデバイス、いわゆる「AI版iPhone」を開発したいと考えていたという。

さて、彼は皆にこう言いました。

私自身、まだ何をしたいのかはっきりしていませんが、漠然としたアイデアはいくつかあります。

同様に:

iPhone の人気を超える AI デバイスは今後出てこないだろうし、私はスマートフォンと競争することにも興味がない。

参考リンク:
[1] https://finance.yahoo.com/news/openai-claims-tool-detect-ai-051511179.html?guccounter=1.

[2] https://gizmodo.com/openais-sam-altman-says-he-has-no-interest-in-competing-1850937333.

<<:  10年後の市場規模は1.3兆ドル。「モデル電源時代」到来

>>:  4K 品質の 3D 合成ビデオはもはやスライドショーにならず、新しい方法でレンダリング速度が 30 倍以上向上

ブログ    
ブログ    

推薦する

人工知能は商業用不動産にどのような影響を与えるでしょうか?

AI は商業用不動産業界を変革し、あらゆるものをより効率的、アクセスしやすく、透明性の高いものにし...

...

人工知能が人間の神経を刺激し、2017年は世界的な技術革新が活発化

[[183471]]図1:2017年1月7日、知能ロボット「小宝」が上海市楊浦区のショッピングモール...

AWS クラウド機械学習を使用したサーバーレスニュースデータパイプラインの構築

[[436699]] [51CTO.com クイック翻訳]アナリストとして、私はニュースや業界の最新...

...

トランスフォーマーの簡易版がここにあります、ネットユーザー:今年の論文

Transformer アーキテクチャは、ディープラーニング分野における最近の多くの成功の原動力であ...

爆発的なソラの背後にある技術、拡散モデルの最新の開発をレビューする記事

機械が人間の想像力を持てるようにするために、深層生成モデルは大きな進歩を遂げました。これらのモデルは...

サイバーセキュリティにおける人工知能の役割と6つの製品オプション

現代の IT 環境では、サイバー脅威がますます顕著になっています。サイバーセキュリティとその製品にお...

画像内のテキストを心配する必要はありません。TextDiffuserは高品質のテキストレンダリングを提供します。

近年、テキストから画像への変換の分野は、特に AIGC (人工知能生成コンテンツ) の時代において大...

自然言語処理のためのニューラルネットワークモデルに関する予備的研究

ディープラーニング技術は、自然言語処理 (NLP) の分野に大きな影響を与えます。しかし、初心者の場...

...

DockerとFlaskをベースにしたディープラーニングモデルのデプロイメント!

モデルの展開は、ディープラーニング アルゴリズムの実装において常に重要な部分です。ディープラーニング...

ビデオ会議に最適な AI アプリケーション

[[439113]]人工知能により、非常に有用であることが証明された素晴らしいビデオ会議アプリケーシ...

人工知能業界では無視できない技術分野「ナレッジグラフ」

[[384932]] 2012 年に、Google は Metaweb から派生した Knowle...

アルゴリズムによる管理下にある労働者:労働の退化と集団不安

[[426039]]かつて人々は、技術の進歩が労働者に大きな解放をもたらし、人類が牧歌的な生活を送れ...