紙画像の不正使用? AI: この道は私が塞いでいる

紙画像の不正使用? AI: この道は私が塞いでいる

[[441681]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

今日のAIは紙の詐欺との戦いに参加し始めました!

このように、画像を回転、引き伸ばし、拡大縮小した後、人間の目では認識できないかもしれませんが、AI は何百もの同様の特徴を見ることができます。

△青い線は類似点を示す

高度な「画像処理方法」を使用して、完全な画像から部分的な画像を独自の画像に移動した場合でも、一目で次のことがわかります。

AI にとって、これは数秒で認識できるタスクかもしれません。複雑な画像を含む完全な論文でも、1 ~ 2 分しかかかりません。

しかし、人間の目にはそれほど単純ではありません。例えば、学術上の不正行為と戦うことで有名なエリザベス・ビク氏は、同じ写真を使って異なる実験結果を示すさまざまな論文の例を探すのに2年を費やしたことがあります。

出版社にとって、記事を出版して撤回することによる損失はさらに大きくなります...

そのため、近年では特に画像問題において、AI偽造者が論文審査に導入されることが増えています。

たとえば、世界最大かつ最古の癌研究専門団体である米国癌協会(AACR)は、今年1月から、学術論文における画像の偽装や重複を検査するためにAIソフトウェアを使い始めています。

公式サイトには、提出された原稿のすべての画像は AI ソフトウェアで審査される必要があるとも記載されています。

AACRだけでなく、世界第5位の出版社であるSAGE、古典的な医学雑誌であるJCI、JCI Insightもこの手法を採用しています。

自動画像補正

ジャーナルと出版社は、イスラエルの会社Proofigが開発した同名のソフトウェアを使用しています。

Proofig ソフトウェアは、AI 技術と画像処理技術をベースとしており、あらゆる種類の顕微鏡写真 (光学、電気、共焦点)、スライド、タンパク質免疫ブロット (ウエスタンブロット)、生体内および生体外画像、植物画像など、さまざまな科学論文の画像を対象としています。

ソフトウェアは論文から画像を識別し、比較のために共通の特徴を抽出します。

これらの「共通の特徴」には、画像全体の拡大縮小や回転、部分的な繰り返しや重なり、方向の違いなどが含まれます。

このソフトウェアは、高解像度の元のデータを小さなファイルに圧縮したときに発生する可能性のある圧縮アーティファクトなどの追加の問題も検出できます。

平均的な論文は通常 2 分未満、長くても 10 分以内にチェックできます。

多くの出版社にとって、出版された科学論文に画像の盗用などの学術上の不正行為が含まれていた場合、調査、撤回、その後の訴訟費用などにより、論文 1 件あたりの平均損失は数百万ドルになる可能性があります。

そのため、多くの出版社は、手動レビューチームと連携してコスト効率の高い AI を導入したいと考えています。

AACRのジャーナル運営ディレクターは次のように語った。

多くの著者は、出版前に「不注意による」画像コピーエラーを検出できることを高く評価しています。

私たちにとって、厳密なデータは私たちのジャーナルの特徴であるため、時間とお金を投資する価値は間違いなくあります。

出版社が団結

実際、科学論文における画像の複製や盗用という現象は珍しいことではありません。

2016年にネイチャー誌に掲載された記事では、約2万件の生物医学論文を手動で分析し、そのうち4%に上記の問題が含まれている可能性があることが判明しました。

通常、毎年修正される原稿は 1% のみなので、撤回される原稿はさらに少なくなります。

そこで昨年5月、オランダの出版大手エルゼビア、ワイリー、シュプリンガー・ネイチャー、テイラー・アンド・フランシスを含む出版社のグループが集まり、論文内の画像の問題に対処するためのタスクフォースを結成した。

エルゼビアは、同グループの最終目標は「画像の変化を自動的に識別できる環境を作ること」だと述べた。

多くの出版社は、自動チェックシステムAIRAの一部として独自の紙画像チェックソフトウェアを開発したスイスの出版社Frontiersのように、自らこの問題の解決に取り組んでいます。

フロンティアーズの広報担当者は、このソフトは2020年8月から使用されており、採点した論文の大半に問題はなく、手作業によるレビューチームによるフォローアップが必要な論文はわずか10%程度であると述べた。

AI をまだ導入していない出版社の中には、このアプローチに懐疑的な見方を示す者もいる。

信頼性の面では、AI検査はまだ大規模に導入されていません。たとえば、エルゼビアのソフトウェアはまだ「テスト中」であり、一部のジャーナルでのみ利用可能です。

コストの面では、AI ソフトウェアによる偶発的な「偶発的な殺人」には依然として人間の介入が必要であり、別の紛争を引き起こす可能性さえあります。

しかし、別の観点から疑問を提起した人がいました。

すべての論文がオープンアクセスであれば、画像の誤用や重複の問題の確認が容易になり、AI のトレーニングもより効率的になります。

<<:  縮小版のOpenAIの新しいテキスト生成画像モデルGLIDEは、DALL-Eに匹敵する35億のパラメータを持つ。

>>:  ブロックチェーンを使用して AI スマートエコノミーを構築するにはどうすればよいでしょうか?

ブログ    

推薦する

人工知能はどれくらい普及しているのでしょうか?国内初となる人工知能講座が小中学校で実施されました!

5月5日、教育部が主催する第3回全国基礎教育情報化応用展示会・交流活動において、北京市朝陽区で人工...

人工知能とモノのインターネット – 5つの新たなユースケース

AI(人工知能)とIoT(モノのインターネット)の融合により、世界中の企業に大きな可能性がもたらされ...

覚えておいてください!私たちの未来に影響を与えるのはビッグデータや人工知能ではなくブロックチェーンです!

[[216863]]私たちの未来に影響を与えるそれは「ビッグデータ」でも「モノのインターネット」で...

...

AI開発者のための7つの倫理ガイドライン

人工知能はここ数年で大きな進歩を遂げました。 AIテクノロジーで生み出されるソリューションは想像を絶...

報告書:人工知能は5年以内に人間の雇用を著しく脅かすだろう

ある報告書によると、自動化と人工知能は最大5年以内に人間の雇用を脅かすことになるという。このような状...

Python データマイニングと機械学習入門

データマイニングとは何ですか?機械学習とは何ですか?Python データの前処理を実行するにはどうす...

人工知能のコスト問題をどう解決するか?顔認識によって情報セキュリティはどのように確保されるのでしょうか?

[[422539]] 9月7日午後、第19回「海南省科学技術会議」に新たに追加されたホットトピック...

...

レポート: Meta の Llama 2 と OpenAI の ChatGPT の「オープンソース」は透明性に欠ける

オランダのラドバウド大学は8月2日、MetaやOpenAIなどの企業が「オープンソース」という用語を...

OpenAIがロボットチームを解散、創設者は「これまでで最高の決断」と語る

OpenAIの共同創設者であるヴォイチェフ・ザレンバ氏はポッドキャストで、OpenAIがロボット工学...

この記事では、人工知能がクラウドコンピューティングをどのように変え、私たちの生活にどのような影響を与えるかを説明します。

AIがクラウドコンピューティングをどう変えるかクラウド コンピューティングは、オンライン アクティ...

Googleは、生成AI製品のユーザーを著作権侵害の申し立てから保護することを約束

Googleは10月13日、現地時間公開のブログ投稿で、自社の生成AI製品のユーザーは当局によって保...

AI 初心者必読 | パラメーターとハイパーパラメーターの違いがまだよくわかりませんか?

[[244078]]コンピュータサイエンスには多くの用語があり、それらの多くは一貫して使用されてい...