紙画像の不正使用? AI: この道は私が塞いでいる

紙画像の不正使用? AI: この道は私が塞いでいる

[[441681]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

今日のAIは紙の詐欺との戦いに参加し始めました!

このように、画像を回転、引き伸ばし、拡大縮小した後、人間の目では認識できないかもしれませんが、AI は何百もの同様の特徴を見ることができます。

△青い線は類似点を示す

高度な「画像処理方法」を使用して、完全な画像から部分的な画像を独自の画像に移動した場合でも、一目で次のことがわかります。

AI にとって、これは数秒で認識できるタスクかもしれません。複雑な画像を含む完全な論文でも、1 ~ 2 分しかかかりません。

しかし、人間の目にはそれほど単純ではありません。例えば、学術上の不正行為と戦うことで有名なエリザベス・ビク氏は、同じ写真を使って異なる実験結果を示すさまざまな論文の例を探すのに2年を費やしたことがあります。

出版社にとって、記事を出版して撤回することによる損失はさらに大きくなります...

そのため、近年では特に画像問題において、AI偽造者が論文審査に導入されることが増えています。

たとえば、世界最大かつ最古の癌研究専門団体である米国癌協会(AACR)は、今年1月から、学術論文における画像の偽装や重複を検査するためにAIソフトウェアを使い始めています。

公式サイトには、提出された原稿のすべての画像は AI ソフトウェアで審査される必要があるとも記載されています。

AACRだけでなく、世界第5位の出版社であるSAGE、古典的な医学雑誌であるJCI、JCI Insightもこの手法を採用しています。

自動画像補正

ジャーナルと出版社は、イスラエルの会社Proofigが開発した同名のソフトウェアを使用しています。

Proofig ソフトウェアは、AI 技術と画像処理技術をベースとしており、あらゆる種類の顕微鏡写真 (光学、電気、共焦点)、スライド、タンパク質免疫ブロット (ウエスタンブロット)、生体内および生体外画像、植物画像など、さまざまな科学論文の画像を対象としています。

ソフトウェアは論文から画像を識別し、比較のために共通の特徴を抽出します。

これらの「共通の特徴」には、画像全体の拡大縮小や回転、部分的な繰り返しや重なり、方向の違いなどが含まれます。

このソフトウェアは、高解像度の元のデータを小さなファイルに圧縮したときに発生する可能性のある圧縮アーティファクトなどの追加の問題も検出できます。

平均的な論文は通常 2 分未満、長くても 10 分以内にチェックできます。

多くの出版社にとって、出版された科学論文に画像の盗用などの学術上の不正行為が含まれていた場合、調査、撤回、その後の訴訟費用などにより、論文 1 件あたりの平均損失は数百万ドルになる可能性があります。

そのため、多くの出版社は、手動レビューチームと連携してコスト効率の高い AI を導入したいと考えています。

AACRのジャーナル運営ディレクターは次のように語った。

多くの著者は、出版前に「不注意による」画像コピーエラーを検出できることを高く評価しています。

私たちにとって、厳密なデータは私たちのジャーナルの特徴であるため、時間とお金を投資する価値は間違いなくあります。

出版社が団結

実際、科学論文における画像の複製や盗用という現象は珍しいことではありません。

2016年にネイチャー誌に掲載された記事では、約2万件の生物医学論文を手動で分析し、そのうち4%に上記の問題が含まれている可能性があることが判明しました。

通常、毎年修正される原稿は 1% のみなので、撤回される原稿はさらに少なくなります。

そこで昨年5月、オランダの出版大手エルゼビア、ワイリー、シュプリンガー・ネイチャー、テイラー・アンド・フランシスを含む出版社のグループが集まり、論文内の画像の問題に対処するためのタスクフォースを結成した。

エルゼビアは、同グループの最終目標は「画像の変化を自動的に識別できる環境を作ること」だと述べた。

多くの出版社は、自動チェックシステムAIRAの一部として独自の紙画像チェックソフトウェアを開発したスイスの出版社Frontiersのように、自らこの問題の解決に取り組んでいます。

フロンティアーズの広報担当者は、このソフトは2020年8月から使用されており、採点した論文の大半に問題はなく、手作業によるレビューチームによるフォローアップが必要な論文はわずか10%程度であると述べた。

AI をまだ導入していない出版社の中には、このアプローチに懐疑的な見方を示す者もいる。

信頼性の面では、AI検査はまだ大規模に導入されていません。たとえば、エルゼビアのソフトウェアはまだ「テスト中」であり、一部のジャーナルでのみ利用可能です。

コストの面では、AI ソフトウェアによる偶発的な「偶発的な殺人」には依然として人間の介入が必要であり、別の紛争を引き起こす可能性さえあります。

しかし、別の観点から疑問を提起した人がいました。

すべての論文がオープンアクセスであれば、画像の誤用や重複の問題の確認が容易になり、AI のトレーニングもより効率的になります。

<<:  縮小版のOpenAIの新しいテキスト生成画像モデルGLIDEは、DALL-Eに匹敵する35億のパラメータを持つ。

>>:  ブロックチェーンを使用して AI スマートエコノミーを構築するにはどうすればよいでしょうか?

ブログ    
ブログ    
ブログ    

推薦する

研究により、ディープラーニングAIは乳がんリスクの予測に優れていることが判明

放射線学誌に掲載された新しい研究によると、ディープラーニングと呼ばれる高度な人工知能は、一般的に使用...

科学者らは脳の信号を読み取り「操作」できる新たな神経電子システムを開発

海外メディアの報道によると、コロンビア大学の研究チームは、脳の信号を「操作」し、病的な結合を阻害でき...

フェイフェイ・リーがツイッターの取締役に就任:AI技術を活用して変革を推進し続ける

[[325837]] Twitterは北京時間5月12日、スタンフォード大学のコンピューターサイエン...

データとAIの成熟度に到達することがビジネス価値を引き出す鍵

[[419580]]データから実用的なリアルタイムの洞察を生成するには、企業は人工知能や機械学習の導...

AIがトランプ氏をダンサーに変身させ、蔡旭坤とともに「チキン、ユー・アー・ソー・ビューティフル」を踊った

[[357996]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...

AIと機械学習モデルをトレーニング、テスト、維持する方法

AI および機械学習モデルの作成に必要なスキルセットをより深く理解するには、機械学習ソフトウェアによ...

回帰問題に最適な機械学習アルゴリズムを選択する

あらゆる種類の機械学習 (ML) の問題に取り組む場合、選択できるさまざまなアルゴリズムがあります。...

ヘルスケアにおける自然言語処理 (NLP) の 8 つの例

翻訳者 | 夏東偉校正 | 梁哲、孫淑娟医療においては、データは患者の健康記録、医師の指示、処方箋か...

...

マイクロソフトはBing Chatを今後も無料のままにすると約束

近年、OpenAI、Microsoft、Google など多くの企業やスタートアップチームが独自のチ...

...

エッジにおける AI について知っておくべきことすべて

近年、人工知能の応用は世界中で大きな進歩を遂げています。職場でのビジネス活動の拡大に伴い、クラウド ...

中国科学院、2019年の世界人工知能の発展を総合的に総括:8つの主要技術が登場し、AIはより多くの分野に浸透

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

中国の教授が犯罪認識率97%の人工知能「検察官」を開発、現在テスト中

[[442697]]最近、「中国の教授らが人工知能検察官を開発中」というニュースが多くの海外ネットユ...

...