研究によると、ChatGPT は科学的仮説の偽のデータセットを生成し、学術的誠実性に脅威を与える可能性がある。

ネイチャー誌は11月24日、現地時間水曜日に、今月初めに米国医師会眼科学会誌に掲載された論文で、著者らがチャットボットGPT-4と高度なデータ分析ツールADAを使用して、「未確認」の科学的主張を裏付けるための偽の臨床試験データセットを作成したと報じた。

IT ホーム注: ADA は、統計分析を実行し、視覚的なデータを作成するために使用できる、Python と組み合わせたモデルです。

報道によると、論文の著者らは、GPT-4とADAに角膜炎患者のデータセットを生成し、「視力と眼の画像検査の点では、深部前角膜移植術（DALK）の方が全層角膜移植術（PK）よりも優れている」という結論を裏付けるよう依頼したという。

AIが生成したデータには、男性参加者160人と女性参加者140人の実験結果が含まれており、上記の結論を裏付けましたが、この結果は実際の臨床試験で示された結果とは一致しませんでした。

専門家らは偽造データセットを詳細に調査し、明らかな捏造の兆候を発見した。「少なくとも表面的にはもっともらしく見えるデータセットを作成するのは簡単だ。そして、訓練を受けていない目には、それが本物のデータセットに『違いない』と映る」と、英国マンチェスター大学の生物統計学者ジャック・ウィルキンソン氏は言う。

研究の著者らは、データセットを「綿密に調べた結果」には欠陥があったことを認めたが、データセットをざっと見ただけでは、データ内の人間以外の情報源を「特定するのは困難」になるだろうと述べた。

AIによって捏造された「信頼できるデータ」により、研究者やジャーナル編集者の間で学術研究の誠実性に対する懸念が高まっている。ジャーナル「EMBO Reports」の編集長ベルント・プルベラー氏は、「現実世界の査読では、データの包括的な再分析が行われないことが多く、そのため、AIを使用して慎重に設計された整合性の抜け穴を検出する可能性は低い」と述べた。同氏は、ジャーナルはAIによって生成された合成データを識別するために品質チェックを更新する必要があると付け加えた。

<<: チャットボット開発の三銃士: LLAMA、LangChain、Python

>>:

ブログ

研究によると、ChatGPT は科学的仮説の偽のデータセットを生成し、学術的誠実性に脅威を与える可能性がある。

より安全な街路のためのリアルタイムのインテリジェントビデオ分析

2年後には「ロボット」が人間の活動の80％以上をこなすようになるのでしょうか？ AIに関する専門家の見解を聞く

セマンティックウェブからナレッジグラフへ

【アルゴリズム】アルゴリズムを理解する（I）—アルゴリズムの時間計算量と空間計算量

北京大学の具現化知能チームは、人間のニーズに合わせてロボットをより効率的にするための需要主導型ナビゲーションを提案した。

ミストラルAIの新モデルはGPT-4をベンチマークしており、オープンソースではなくマイクロソフトと協力、ネットユーザー：当初の意図を忘れた

推薦する

想像を超える: 5つの興味深い実用的なChatGPTのヒントとコツ

シングルテナント AI ファクトリーは最新のデータセンタートレンドでしょうか?

以前保存した Keras モデルをロードすると結果が異なる理由: 経験と教訓

人工知能は破壊をもたらすのか？「人工知能破壊論」への疑問と考察

今後5年間の人工知能における5つのブレークスルー

中国AIGC広告・マーケティング業界パノラマレポート：5つの大きな変化と4つの大きな影響、生成AIにより「1人」のための広告作成が可能に

清華大学系のスタートアップが、実際のシーンからアニメーションへのワンクリック変換、パーソナライズされたキャラクターも生成できる世界初の4Dスケルトンアニメーションフレームワークを発表

データ構造とアルゴリズム: 同型文字列

記事では、Alibaba のリアルタイムコンピューティング Blink の中核技術を明らかにしています。妥協せずに速度を実現するにはどうすればよいでしょうか。

今週の土曜日は上海へ行こう！ Baidu Wenxin (ERNIE) がエンタープライズレベルの NLP モデルを迅速にカスタマイズする方法の分析

モジュラー大型モデルが登場！ IBMがWatsonXコアアーキテクチャの技術的詳細を公開