紙画像の不正使用? AI: この道は私が塞いでいる

紙画像の不正使用? AI: この道は私が塞いでいる

[[441681]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

今日のAIは紙の詐欺との戦いに参加し始めました!

このように、画像を回転、引き伸ばし、拡大縮小した後、人間の目では認識できないかもしれませんが、AI は何百もの同様の特徴を見ることができます。

△青い線は類似点を示す

高度な「画像処理方法」を使用して、完全な画像から部分的な画像を独自の画像に移動した場合でも、一目で次のことがわかります。

AI にとって、これは数秒で認識できるタスクかもしれません。複雑な画像を含む完全な論文でも、1 ~ 2 分しかかかりません。

しかし、人間の目にはそれほど単純ではありません。例えば、学術上の不正行為と戦うことで有名なエリザベス・ビク氏は、同じ写真を使って異なる実験結果を示すさまざまな論文の例を探すのに2年を費やしたことがあります。

出版社にとって、記事を出版して撤回することによる損失はさらに大きくなります...

そのため、近年では特に画像問題において、AI偽造者が論文審査に導入されることが増えています。

たとえば、世界最大かつ最古の癌研究専門団体である米国癌協会(AACR)は、今年1月から、学術論文における画像の偽装や重複を検査するためにAIソフトウェアを使い始めています。

公式サイトには、提出された原稿のすべての画像は AI ソフトウェアで審査される必要があるとも記載されています。

AACRだけでなく、世界第5位の出版社であるSAGE、古典的な医学雑誌であるJCI、JCI Insightもこの手法を採用しています。

自動画像補正

ジャーナルと出版社は、イスラエルの会社Proofigが開発した同名のソフトウェアを使用しています。

Proofig ソフトウェアは、AI 技術と画像処理技術をベースとしており、あらゆる種類の顕微鏡写真 (光学、電気、共焦点)、スライド、タンパク質免疫ブロット (ウエスタンブロット)、生体内および生体外画像、植物画像など、さまざまな科学論文の画像を対象としています。

ソフトウェアは論文から画像を識別し、比較のために共通の特徴を抽出します。

これらの「共通の特徴」には、画像全体の拡大縮小や回転、部分的な繰り返しや重なり、方向の違いなどが含まれます。

このソフトウェアは、高解像度の元のデータを小さなファイルに圧縮したときに発生する可能性のある圧縮アーティファクトなどの追加の問題も検出できます。

平均的な論文は通常 2 分未満、長くても 10 分以内にチェックできます。

多くの出版社にとって、出版された科学論文に画像の盗用などの学術上の不正行為が含まれていた場合、調査、撤回、その後の訴訟費用などにより、論文 1 件あたりの平均損失は数百万ドルになる可能性があります。

そのため、多くの出版社は、手動レビューチームと連携してコスト効率の高い AI を導入したいと考えています。

AACRのジャーナル運営ディレクターは次のように語った。

多くの著者は、出版前に「不注意による」画像コピーエラーを検出できることを高く評価しています。

私たちにとって、厳密なデータは私たちのジャーナルの特徴であるため、時間とお金を投資する価値は間違いなくあります。

出版社が団結

実際、科学論文における画像の複製や盗用という現象は珍しいことではありません。

2016年にネイチャー誌に掲載された記事では、約2万件の生物医学論文を手動で分析し、そのうち4%に上記の問題が含まれている可能性があることが判明しました。

通常、毎年修正される原稿は 1% のみなので、撤回される原稿はさらに少なくなります。

そこで昨年5月、オランダの出版大手エルゼビア、ワイリー、シュプリンガー・ネイチャー、テイラー・アンド・フランシスを含む出版社のグループが集まり、論文内の画像の問題に対処するためのタスクフォースを結成した。

エルゼビアは、同グループの最終目標は「画像の変化を自動的に識別できる環境を作ること」だと述べた。

多くの出版社は、自動チェックシステムAIRAの一部として独自の紙画像チェックソフトウェアを開発したスイスの出版社Frontiersのように、自らこの問題の解決に取り組んでいます。

フロンティアーズの広報担当者は、このソフトは2020年8月から使用されており、採点した論文の大半に問題はなく、手作業によるレビューチームによるフォローアップが必要な論文はわずか10%程度であると述べた。

AI をまだ導入していない出版社の中には、このアプローチに懐疑的な見方を示す者もいる。

信頼性の面では、AI検査はまだ大規模に導入されていません。たとえば、エルゼビアのソフトウェアはまだ「テスト中」であり、一部のジャーナルでのみ利用可能です。

コストの面では、AI ソフトウェアによる偶発的な「偶発的な殺人」には依然として人間の介入が必要であり、別の紛争を引き起こす可能性さえあります。

しかし、別の観点から疑問を提起した人がいました。

すべての論文がオープンアクセスであれば、画像の誤用や重複の問題の確認が容易になり、AI のトレーニングもより効率的になります。

<<:  縮小版のOpenAIの新しいテキスト生成画像モデルGLIDEは、DALL-Eに匹敵する35億のパラメータを持つ。

>>:  ブロックチェーンを使用して AI スマートエコノミーを構築するにはどうすればよいでしょうか?

ブログ    
ブログ    

推薦する

ディープラーニングによる物体検出モデルの包括的なレビュー: 高速 R-CNN、R-FCN、SSD

[[204169]] Faster R-CNN、R-FCN、SSD は、最も人気があり、広く使用さ...

GPT-4.5 と同等のコードインタープリター! GPT-5をトレーニングせずに、OpenAIは依然としてAGIに向けて競争している

先週、シリコンバレーのスタートアップオタクや研究者が更新するポッドキャスト「Latent Space...

北本重型トラック、易欧、松山湖材料研究所が「易本デュアルカーボン研究所」設立に向けた戦略協力協定を締結

8月4日、中国北方工業集団公司、北奔重型トラック集団有限公司、渤海、松山湖材料研究所は調印式を開催し...

機械学習、ディープラーニング、強化学習の関係と違いは何ですか?

これには、機械学習のサブフィールドの分類が含まれます。すべての分類において、最初に尋ねるべき質問は、...

調査によると、2024年は「AIメガネ」市場元年となる

AppleのVision Proヘッドセットは2024年第1四半期に発売される予定だが、業界の専門家...

ジャック・マー:私は人工知能を恐れていない。今後30年間で私がやることは1つだけだ

[[223784]]ジャック・マー氏は以前、世界経済フォーラムでこう語った。「将来、多くの仕事が人工...

...

人工知能をゼロから学ぶのは難しくない

「人工知能」という用語は、1956年にダートマス協会で初めて提案されました。それ以来、研究者は多くの...

自動運転事故の安全問題をどう解決するか?

[[418475]]かつては空想の技術だった自動運転が、今や徐々に現実のものとなりつつある。 Go...

Nvidia、Hugging Face、ServiceNow がコード生成用の新しい StarCoder2 LLM をリリース

現在 3 つの異なるサイズで提供されているこれらのモデルは、リソースの少ない言語を含む 600 以上...

ゲームオーバー?強いAIと弱いAIの戦い

数週間前、Googleの人工知能(AI)子会社DeepMindが、Gato(同じトレーニング済みモデ...

4つの業界は人工知能がもたらす混乱に注意を払う必要がある

2020 年には、AI と機械学習のテクノロジーが新興産業に継続的な影響を与え、企業だけでなく消費者...

中国科学院深圳先端技術研究所:新しい知識強化グラフニューラルネットワークが説明可能な推奨を実現

近年、ビッグデータとディープラーニングに基づく人工知能は、驚くべきコンピューティング能力と学習能力を...

Googleがこれまでで最も強力なAIモデル「Gemini」を発表

グーグルは水曜日、AIを収益化する方法に対する回答を求める圧力が高まる中、同社がこれまでで最も強力だ...

上海で一人っ子を亡くした母親が、AIを使って14歳の娘を「蘇らせた」...

大切な人が亡くなったら、その人の記憶をAIに引き渡しますか?「The Debaters」のこの討論テ...