紙画像の不正使用? AI: この道は私が塞いでいる

紙画像の不正使用? AI: この道は私が塞いでいる

[[441681]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

今日のAIは紙の詐欺との戦いに参加し始めました!

このように、画像を回転、引き伸ばし、拡大縮小した後、人間の目では認識できないかもしれませんが、AI は何百もの同様の特徴を見ることができます。

△青い線は類似点を示す

高度な「画像処理方法」を使用して、完全な画像から部分的な画像を独自の画像に移動した場合でも、一目で次のことがわかります。

AI にとって、これは数秒で認識できるタスクかもしれません。複雑な画像を含む完全な論文でも、1 ~ 2 分しかかかりません。

しかし、人間の目にはそれほど単純ではありません。例えば、学術上の不正行為と戦うことで有名なエリザベス・ビク氏は、同じ写真を使って異なる実験結果を示すさまざまな論文の例を探すのに2年を費やしたことがあります。

出版社にとって、記事を出版して撤回することによる損失はさらに大きくなります...

そのため、近年では特に画像問題において、AI偽造者が論文審査に導入されることが増えています。

たとえば、世界最大かつ最古の癌研究専門団体である米国癌協会(AACR)は、今年1月から、学術論文における画像の偽装や重複を検査するためにAIソフトウェアを使い始めています。

公式サイトには、提出された原稿のすべての画像は AI ソフトウェアで審査される必要があるとも記載されています。

AACRだけでなく、世界第5位の出版社であるSAGE、古典的な医学雑誌であるJCI、JCI Insightもこの手法を採用しています。

自動画像補正

ジャーナルと出版社は、イスラエルの会社Proofigが開発した同名のソフトウェアを使用しています。

Proofig ソフトウェアは、AI 技術と画像処理技術をベースとしており、あらゆる種類の顕微鏡写真 (光学、電気、共焦点)、スライド、タンパク質免疫ブロット (ウエスタンブロット)、生体内および生体外画像、植物画像など、さまざまな科学論文の画像を対象としています。

ソフトウェアは論文から画像を識別し、比較のために共通の特徴を抽出します。

これらの「共通の特徴」には、画像全体の拡大縮小や回転、部分的な繰り返しや重なり、方向の違いなどが含まれます。

このソフトウェアは、高解像度の元のデータを小さなファイルに圧縮したときに発生する可能性のある圧縮アーティファクトなどの追加の問題も検出できます。

平均的な論文は通常 2 分未満、長くても 10 分以内にチェックできます。

多くの出版社にとって、出版された科学論文に画像の盗用などの学術上の不正行為が含まれていた場合、調査、撤回、その後の訴訟費用などにより、論文 1 件あたりの平均損失は数百万ドルになる可能性があります。

そのため、多くの出版社は、手動レビューチームと連携してコスト効率の高い AI を導入したいと考えています。

AACRのジャーナル運営ディレクターは次のように語った。

多くの著者は、出版前に「不注意による」画像コピーエラーを検出できることを高く評価しています。

私たちにとって、厳密なデータは私たちのジャーナルの特徴であるため、時間とお金を投資する価値は間違いなくあります。

出版社が団結

実際、科学論文における画像の複製や盗用という現象は珍しいことではありません。

2016年にネイチャー誌に掲載された記事では、約2万件の生物医学論文を手動で分析し、そのうち4%に上記の問題が含まれている可能性があることが判明しました。

通常、毎年修正される原稿は 1% のみなので、撤回される原稿はさらに少なくなります。

そこで昨年5月、オランダの出版大手エルゼビア、ワイリー、シュプリンガー・ネイチャー、テイラー・アンド・フランシスを含む出版社のグループが集まり、論文内の画像の問題に対処するためのタスクフォースを結成した。

エルゼビアは、同グループの最終目標は「画像の変化を自動的に識別できる環境を作ること」だと述べた。

多くの出版社は、自動チェックシステムAIRAの一部として独自の紙画像チェックソフトウェアを開発したスイスの出版社Frontiersのように、自らこの問題の解決に取り組んでいます。

フロンティアーズの広報担当者は、このソフトは2020年8月から使用されており、採点した論文の大半に問題はなく、手作業によるレビューチームによるフォローアップが必要な論文はわずか10%程度であると述べた。

AI をまだ導入していない出版社の中には、このアプローチに懐疑的な見方を示す者もいる。

信頼性の面では、AI検査はまだ大規模に導入されていません。たとえば、エルゼビアのソフトウェアはまだ「テスト中」であり、一部のジャーナルでのみ利用可能です。

コストの面では、AI ソフトウェアによる偶発的な「偶発的な殺人」には依然として人間の介入が必要であり、別の紛争を引き起こす可能性さえあります。

しかし、別の観点から疑問を提起した人がいました。

すべての論文がオープンアクセスであれば、画像の誤用や重複の問題の確認が容易になり、AI のトレーニングもより効率的になります。

<<:  縮小版のOpenAIの新しいテキスト生成画像モデルGLIDEは、DALL-Eに匹敵する35億のパラメータを持つ。

>>:  ブロックチェーンを使用して AI スマートエコノミーを構築するにはどうすればよいでしょうか?

推薦する

2018年に人工知能はどのように発展するでしょうか?専門家の意見

ブロックバスター社の映画には毎年人工知能が満載されており、昨年も例外ではありませんでした。 『ブレー...

マシンビジョンについて知っておくべきこと

マシンビジョンは急速に発展している人工知能の分野です。簡単に言えば、マシンビジョンとは、測定と判断の...

...

IT の現状レポート: IT リーダーの 90% が、生成型 AI がまもなく主流になると考えています

7月25日、海外メディアの報道によると、セールスフォース・ドットコムが発表したIT現状報告によると、...

科学者は、掴んだまま物体を回転させることができるユニークなロボットハンドを開発

今日の多くのロボットハンドは物体をつかむことができるが、つかんだ物体を放さずにその向きを変えることは...

...

2017年にディープラーニングを学ばなければならない理由

[[200338]]私もディープラーニングの初心者です。この記事はあくまでも私の個人的な意見です。私...

「大学受験5年間・シミュレーション3年間」の大型模型版が登場! 6141 の数学の問題、マルチモーダルの問題

「大学入試5年間・シミュレーション3年間」の数学の問題集が大幅パワーアップして登場! Microso...

NLP事前トレーニングパラダイムが統合され、下流のタスクタイプに絡まらなくなり、Googleの新しいフレームワークは50のSOTAを更新します

この論文では、Google の研究者がさまざまな事前トレーニング パラダイムを統合する事前トレーニン...

人工知能と機械学習技術がビジネス開発を推進

IT リーダーはすでに人工知能と機械学習テクノロジーの恩恵を受けています。最近の調査によると、経済が...

顔認識技術の応用における認知的誤解

[[286435]]カメラはどこにでもあり、顔認識は生活のほぼあらゆる場面で使用されています。どのよ...

機械読解とは何ですか?これは自然言語処理とどのような関係があるのでしょうか?

[[324510]] 01 機械読解タスク2002 年に発表された論文で、学者の C. スノーは読...

自動駐車を徹底研究!業界標準の動向、評価指標、システム紹介まであらゆる角度から収集!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

ルーティングアルゴリズムの概念

この記事では主にルーティング アルゴリズムの概念を説明し、ルーティング アルゴリズムの基本的な概念を...