マイクロソフトは言語モデルをより調和のとれたものにするために複数のツールとデータセットをオープンソース化

マイクロソフトは言語モデルをより調和のとれたものにするために複数のツールとデータセットをオープンソース化

Microsoft は最近、AI 駆動型コンテンツ モデレーション システムを監査し、AI モデルの潜在的なエラーを指摘するテストを自動的に作成するように設計されたいくつかのツールとデータセットのオープン ソースを発表しました。 Microsoft によれば、AdaTest および (De)ToxiGen プロジェクトにより、人間レベルの複雑さを持つテキストを分析および生成するための、より信頼性の高い大規模言語モデル (LLM)、または OpenAI の GPT-3 に類似したモデルが作成できる可能性があるという。

現在、LLM には多くのリスクが伴います。これらのモデルはインターネット(ソーシャル メディアを含む)からの大量のデータを使用してトレーニングされるため、トレーニング中に有害なテキストに遭遇する可能性があります。モデルの再トレーニングにかかる​​コストと、存在するエラーの数が多いため、これらのモデルの欠陥を見つけて修正することは依然として困難です。

有害性の問題に対処するため、Microsoft Research チームは、有害な言語にフラグを立てるために使用できるコンテンツ モデレーション ツールをトレーニングするためのデータセットである ToxiGen を開発しました。 Microsoft によれば、ToxiGen には「中立的」および「有害」な発言の例が 274,000 件含まれており、公開されているヘイトスピーチのデータセットとしては最大規模のものの 1 つとなっている。

Ece Kamar ToxiGen、Microsoft Research のパートナー リサーチ エリア マネージャー、AdaTest および (De)ToxiGen のプロジェクト リーダー

いかなるコンテンツ モデレーション システムにも欠陥があり、これらのモデルは継続的に改善する必要があることを私たちは認識しています。 (De)ToxiGen の目標は、AI システムの開発者が既存のコンテンツ モデレーション テクノロジーのリスクや問題をより効果的に特定できるようにすることです。

私たちの実験では、このツールは多くの既存のシステムをテストするために使用できることが示されており、このツールの恩恵を受ける新しい環境についてコミュニティから学ぶことを楽しみにしています。

サンプルを生成するために、Microsoft Research チームは、黒人、身体および認知障害を持つ人々、イスラム教徒、アジア人、ラテン系アメリカ人、LGBTQ+、ネイティブ アメリカンを含む 13 の少数派グループを対象とした「中立的な」発言とヘイトスピーチの LLM サンプルを提供しました。これらの記述は、既存のデータセットのほか、ニュース記事、意見記事、ポッドキャストのトランスクリプト、その他の同様の公開テキスト ソースから抽出されています。

Microsoft チームは、ToxiGen ステートメントを作成するために使用されるプロセスは (De)ToxiGen と呼ばれ、LLM 生成ツールが誤って識別される可能性のあるステートメントを生成するように誘導することで、特定の監査ツールの弱点を明らかにするように設計されていると説明しました。チームは、手動でキュレーションされた 3 つの毒性データセットの研究を通じて、1 つのツールから始めて ToxiGen を使用して微調整すると、ツールのパフォーマンスが「大幅に」向上することを発見しました。

Microsoft チームは、ToxiGen の作成に使用された戦略を他の領域に拡張して、より「微妙な」かつ「豊富な」中立的およびヘイトスピーチの例を作成できると考えています。しかし専門家は、これは万能薬ではないと警告している。

<<:  Natureサブジャーナル:ニューロモルフィックコンピューティングがさらに進歩し、科学者はニューロンとシナプスの人工シミュレーションを実現した

>>:  アート業界におけるメタバースの探究

推薦する

ディープラーニングの発展とそれが引き起こした気候変動問題

人間の脳は極めて効率的な知能の源ですが、現在の AI はこのレベルに到達できません。 [[33099...

AI: いつも HD ビデオが欲しいなら、ここにあります

Magnific の画像超解像度および強化ツールはまだテスト中ですが、その強力な画像アップスケーリン...

...

AIはスマートシティの人材採用に役割を果たすのでしょうか?

AI ツールとテクノロジーはスマート シティと IoT 主導の業界にとってゲームチェンジャーとなっ...

2018年: 人工知能の世界における8つのトレンド

​​ [[206934]]​​人工知能(AI)が私たちの仕事や生活に徐々に浸透してきていることは否定...

Google は、ロボットにゴミを捨てることを教えることができる視覚言語アクション モデル RT-2 をリリースしました。

グーグルは7月28日、ゴミ捨てなどのタスクを理解できるようロボットを訓練するのに役立つ新しい人工知能...

人工知能とモノのインターネット:スマートシティの交通管理

今日のスマート シティは、都市部を再形成する高度なテクノロジーによって推進されています。人工知能とモ...

DeepMindのAIが核融合炉の制御を学習、Nature誌に発表

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AIは生体認証のなりすまし攻撃を簡単に見分けることができる

研究論文によると、写真が実際に生きている人物を写したものか、それとも攻撃のデモンストレーションなのか...

ロボットは意識を獲得できるのか?もしそうなら、どうやって知るのでしょうか?

一部の専門家は、人間は簡単に知能ロボットを作成し、それが知能を持っていることを知ることができると考え...

量子コンピューティングと人工知能の関係は何ですか?

量子コンピューティングは、学術誌だけでなく、一般の新聞や雑誌でも頻繁に議論される、非常に人気の高いト...

...

マイクロソフト、中小企業向けにCopilot AIアシスタントを導入、個人向けにプレミアムサービスを開始

マイクロソフトは火曜日、中小企業が同社の生産性向上アプリ内で仮想アシスタント「Copilot」を利用...

データサイエンスと機械学習のためのトップ 16 プラットフォーム

調査会社ガートナーは、データ サイエンスおよび機械学習プラットフォームを「さまざまなデータ サイエン...

Zhiyuan が世界最大の中国語と英語のベクトルモデルトレーニングデータセットをリリースしました。最大3億のテキストペアまで拡張可能

9月15日、北京人工知能産業サミットおよび中関村科学城科学技術イノベーションコンテスト授賞式において...