紙画像の不正使用? AI: この道は私が塞いでいる

紙画像の不正使用? AI: この道は私が塞いでいる

[[441681]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

今日のAIは紙の詐欺との戦いに参加し始めました!

このように、画像を回転、引き伸ばし、拡大縮小した後、人間の目では認識できないかもしれませんが、AI は何百もの同様の特徴を見ることができます。

△青い線は類似点を示す

高度な「画像処理方法」を使用して、完全な画像から部分的な画像を独自の画像に移動した場合でも、一目で次のことがわかります。

AI にとって、これは数秒で認識できるタスクかもしれません。複雑な画像を含む完全な論文でも、1 ~ 2 分しかかかりません。

しかし、人間の目にはそれほど単純ではありません。例えば、学術上の不正行為と戦うことで有名なエリザベス・ビク氏は、同じ写真を使って異なる実験結果を示すさまざまな論文の例を探すのに2年を費やしたことがあります。

出版社にとって、記事を出版して撤回することによる損失はさらに大きくなります...

そのため、近年では特に画像問題において、AI偽造者が論文審査に導入されることが増えています。

たとえば、世界最大かつ最古の癌研究専門団体である米国癌協会(AACR)は、今年1月から、学術論文における画像の偽装や重複を検査するためにAIソフトウェアを使い始めています。

公式サイトには、提出された原稿のすべての画像は AI ソフトウェアで審査される必要があるとも記載されています。

AACRだけでなく、世界第5位の出版社であるSAGE、古典的な医学雑誌であるJCI、JCI Insightもこの手法を採用しています。

自動画像補正

ジャーナルと出版社は、イスラエルの会社Proofigが開発した同名のソフトウェアを使用しています。

Proofig ソフトウェアは、AI 技術と画像処理技術をベースとしており、あらゆる種類の顕微鏡写真 (光学、電気、共焦点)、スライド、タンパク質免疫ブロット (ウエスタンブロット)、生体内および生体外画像、植物画像など、さまざまな科学論文の画像を対象としています。

ソフトウェアは論文から画像を識別し、比較のために共通の特徴を抽出します。

これらの「共通の特徴」には、画像全体の拡大縮小や回転、部分的な繰り返しや重なり、方向の違いなどが含まれます。

このソフトウェアは、高解像度の元のデータを小さなファイルに圧縮したときに発生する可能性のある圧縮アーティファクトなどの追加の問題も検出できます。

平均的な論文は通常 2 分未満、長くても 10 分以内にチェックできます。

多くの出版社にとって、出版された科学論文に画像の盗用などの学術上の不正行為が含まれていた場合、調査、撤回、その後の訴訟費用などにより、論文 1 件あたりの平均損失は数百万ドルになる可能性があります。

そのため、多くの出版社は、手動レビューチームと連携してコスト効率の高い AI を導入したいと考えています。

AACRのジャーナル運営ディレクターは次のように語った。

多くの著者は、出版前に「不注意による」画像コピーエラーを検出できることを高く評価しています。

私たちにとって、厳密なデータは私たちのジャーナルの特徴であるため、時間とお金を投資する価値は間違いなくあります。

出版社が団結

実際、科学論文における画像の複製や盗用という現象は珍しいことではありません。

2016年にネイチャー誌に掲載された記事では、約2万件の生物医学論文を手動で分析し、そのうち4%に上記の問題が含まれている可能性があることが判明しました。

通常、毎年修正される原稿は 1% のみなので、撤回される原稿はさらに少なくなります。

そこで昨年5月、オランダの出版大手エルゼビア、ワイリー、シュプリンガー・ネイチャー、テイラー・アンド・フランシスを含む出版社のグループが集まり、論文内の画像の問題に対処するためのタスクフォースを結成した。

エルゼビアは、同グループの最終目標は「画像の変化を自動的に識別できる環境を作ること」だと述べた。

多くの出版社は、自動チェックシステムAIRAの一部として独自の紙画像チェックソフトウェアを開発したスイスの出版社Frontiersのように、自らこの問題の解決に取り組んでいます。

フロンティアーズの広報担当者は、このソフトは2020年8月から使用されており、採点した論文の大半に問題はなく、手作業によるレビューチームによるフォローアップが必要な論文はわずか10%程度であると述べた。

AI をまだ導入していない出版社の中には、このアプローチに懐疑的な見方を示す者もいる。

信頼性の面では、AI検査はまだ大規模に導入されていません。たとえば、エルゼビアのソフトウェアはまだ「テスト中」であり、一部のジャーナルでのみ利用可能です。

コストの面では、AI ソフトウェアによる偶発的な「偶発的な殺人」には依然として人間の介入が必要であり、別の紛争を引き起こす可能性さえあります。

しかし、別の観点から疑問を提起した人がいました。

すべての論文がオープンアクセスであれば、画像の誤用や重複の問題の確認が容易になり、AI のトレーニングもより効率的になります。

<<:  縮小版のOpenAIの新しいテキスト生成画像モデルGLIDEは、DALL-Eに匹敵する35億のパラメータを持つ。

>>:  ブロックチェーンを使用して AI スマートエコノミーを構築するにはどうすればよいでしょうか?

ブログ    
ブログ    

推薦する

...

エッジコンピューティングと人工知能について知っておくべき7つのこと

エッジ コンピューティングと AI はどのように連携するのでしょうか? エッジ コンピューティングが...

AIは「メイおばさん」を見つけられるのか?

[[283120]]インターネット全体が「メイおばさん」を探しているが、彼女が誰なのかは謎のままだ...

浙江大学の呉飛氏とアリババの賈洋青氏が口論。AIの進化と年収100万ドルのどちらが本当なのか?

人工知能が再び人気を集めていることは間違いありません。第14次5カ年計画では、国家発展の戦略的支えと...

SafetyNet: 自動運転における機械学習戦略のための安全な計画アプローチ

[[427712]] 2021年9月28日にarXivにアップロードされた論文「SafetyNet:...

イノベーションに関する対話 - 51CTO 初の開発者コンテストが始まりました!

/* 世界を変えるために生きるここでは、あらゆる作品が市場に参入するための種となる可能性があります...

...

Google Gemini は Baidu を「騙し取っている」が、その背後にいる本当の犯人は誰なのか?

ノア著制作:51CTO テクノロジースタック(WeChat ID:blog)かつて AI の王者だっ...

Hadoop、Spark、Hive とはいったい何でしょうか? アルゴリズムを開発するには、これらを学ぶ必要がありますか?

[[422888]]みなさんこんにちは。私は梁唐です。最近、多くの新人がアルゴリズム エンジニアに...

...

マッキンゼーの「2020年人工知能の現状」レポート:AIは企業の収益成長に大きく貢献した

[[354345]]マッキンゼーの最新の AI 調査レポート「2020 年の AI の現状」によると...

AI 株神: 機械学習を使って株価を予測するには?

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

JD Cityが新しいブランドアイデンティティを発表、スマートシティがJDグループの主要戦略に

3月21日、北京でiCityスマートシティカンファレンスが開催され、JD CityがJDグループの第...