手動でラベルを付ける必要はありません。シドニー大学の中国チームは、「GPT自己教師付きラベリング」パラダイムを提案しました。これは、ラベリングのコスト、バイアス、評価の問題を完全に解決します。

手動でラベルを付ける必要はありません。シドニー大学の中国チームは、「GPT自己教師付きラベリング」パラダイムを提案しました。これは、ラベリングのコスト、バイアス、評価の問題を完全に解決します。

データ注釈は、ディープラーニングプロセスにおいて常に基本的かつ重要な役割を果たしてきました。

高品質なデータ注釈はモデルの学習効果に直接影響を及ぼし、効率的なディープラーニングを実現するための最も独創的で重要なステップであることは間違いありません。

同時に、ラベル付けされたデータは、グラウンドトゥルースとして、その後のトレーニング、検証、テストにも直接影響します。

しかし、産業界や学界は、データのラベリング作業にかかるコストの高さ、偏り、評価の難しさ、ラベリングの難しさなどの問題に直面しています。

最近、シドニー大学の研究チームは、大規模な言語モデルを通じて注釈の生成を自己監督するためのフレームワークを提案しました。上記の問題は、生成削減サイクル注釈に基づく GPT 自己教師あり法を使用することで初めて解決されました。

論文リンク: https://arxiv.org/pdf/2306.04349.pdf

基本的な考え方は、大規模な言語モデルをブラックボックス オプティマイザーとして使用してループを構築することです。

テンプレートの品質が高いほど、生成されるデータと注釈のペアの品質が高くなります。生成されるデータと注釈のペアの品質が高いほど、前のラウンドのテンプレートは、より高品質の現在のデータ ペアに置き換えられます。この反復的なプロセスにより、注釈の品質が向上します。


データのラベル付けは難しい

1. コストが高い:

国や企業を問わず、データのラベル付けは多くの人的資源と時間の投資を必要とするコストのかかる作業です。

米国では、データアノテーターの平均年収は約39,000ドルで、最高49,803ドルに達することもあります[2]。インドでも、データアノテーターの平均年収は約20万ルピー、つまり約2,670ドルです[3]。

第二に、データ注釈のコストも評価の難しさに影響します。

例えば、コストの違いにより、多くの企業はデータアノテーション作業を人件費の低い国に外注することを選択します[4]。

ただし、この異文化注釈により、微妙な意味の違いが無視され、モデルの学習効果に影響する可能性があります。

2. 偏見:

データ注釈は、機械学習や人工知能の応用において重要な役割を果たします。

しかし、研究によると[5]、人間は注釈付けのプロセス中にバイアスを導入する可能性があり、それが機械学習モデルのトレーニングとパフォーマンスに影響を与える可能性があることが示されています。

研究では、注釈者はデータセット作成者が書いた指示のパターンに従う可能性があることが判明しました。これは「指示バイアス」と呼ばれる現象です。

これらの指示により、特定の注釈がデータ内で過剰に表現され、AI システムがそれらの注釈に対して偏向する可能性があります。

3. 評価が難しい:

研究によると[6]、大規模な言語モデルはプロンプトを設計することでデータを直接注釈付けできることがわかっています。

しかし、生成されたデータの品質をどのように判断するかは主観的な問題であるため、データ注釈に対するこれらのモデルの品質と有効性を評価することは困難です。

たとえば、生物医学分野では、ディープラーニング モデルは DNA 配列から制御効果を予測する上で大きな可能性を示しています。

しかし、人間自身がモデル出力の内容を完全に理解しているわけではないため、モデル注釈の品質を人間が判断することは困難です。

4. 採点の難しさ:

専門的な実践者にとっても、一部の構造化データの注釈付けは依然として難しすぎます。

たとえば、ニューラル ネットワークの計算グラフ データでは、ノードが演算子を表し、有向エッジが演算子を表します。

ネットワーク構造を表すグラフ リストには、最大数千のノード ペアを含めることができます。ノードとネストされたブロック シーケンスを手動でカウントすると、多くの時間と労力がかかります。

新しい注釈方法

チームが提案した注釈付け方法には、ワンショット段階と生成段階が含まれます。

その中で、ワンショットステージの目標は、テンプレートとして最適な {data-label} データペアを反復的に見つけることです。

反復プロセス:

単純なデータ ペアを初期テンプレートとして初期化し、GPT を使用して注釈を生成し、生成された注釈と元のデータから新しいデータ ペアが形成されます。

次に、注釈から復元されたデータと元のデータを比較して、この新しいデータ ペアのテンプレートとしての可能性を評価します。

復元されたデータと元のデータ間の類似度スコアが改善された場合、現在の新しいデータ ペアは、一連のデータ生成の新しいテンプレートとして直接使用されます。

したがって、この自己調整メカニズムは、ワンショット テンプレートを繰り返し調整して、次の生成ラウンドに備えます。ワンショットステージで検索された最適なテンプレートは、データセットに注釈を付けるために使用されます。

著者らは、さまざまな事前トレーニング済み報酬モデルを調整することで注釈の品質を評価し、さまざまな評価指標を導入して要約の復元能力を間接的に評価します。

私たちは 3 つの困難なデータセットに対して広範な実験を実施し、さまざまな観点から詳細なアブレーション研究を提供します。

結果は、この自己教師ありパラダイムが、報酬モデルの評価とデータの復元能力のスコアにおいて一貫して高いパフォーマンスを達成することを示しています。

さらに、著者らはこのフレームワークを適用して、異なる計算演算子に基づくニューラル ネットワーク アーキテクチャを記述する 2 つの新しいデータセットを生成しました。

著者はOpenAIのAPIを呼び出して、さまざまな種類のGPTモデルのベンチマークテストを実施しました。

表 1 は、さまざまな評価基準に基づく davinci、text-curie-001、text-davinci-003、gpt-3.5-turbo のラベル付きデータ品質のスコアを示しています。

著者らは論文の中で、次のようなアブレーション実験についても論じています。

Q1. 反復されるワンショット テンプレートは、プロセス全体でどのような役割を果たしますか?ゼロショットアプローチ(設計された命令の命令調整のみを通じて要約を生成する)で同じ効果を達成できますか?

A1. 同じ指示で条件付けされたゼロサンプル生成と比較して、サンプルテンプレートの導入によりアノテーションの品質が向上します。実験の詳細は図に示されています。

さらに、著者は記事の中で以下の問題についても論じています。

復元されたデータと元のデータ間の類似性を測定する標準的な方法は、注釈にどのような影響を与えますか?テンプレートの初期化は、自己教師付き注釈反復の結果にどのように影響しますか? GPT モデル自体のハイパーパラメータは、検索された注釈テンプレートに影響しますか?

<<:  AIoT はセキュリティ業界にどのような影響を与えますか?

>>:  Metaはオープンソースのビッグモデルを緩和し、開発者が商用利用で利益を得られるよう検討していると報じられている。

ブログ    
ブログ    

推薦する

...

人工知能の時代は私たちの生活にどのような影響を与えるのでしょうか?

これは視覚障害者向けに設計された特別な人工知能メガネです。このメガネを通して、視覚障害者は再びこの色...

大型モデルの中に泥棒はいますか?上海交通大学は、パラメータを保護するために、大規模モデル用の「人間が読める指紋」を作成します

大規模モデルの事前トレーニングには膨大な量のコンピューティング リソースとデータが必要となるため、事...

テクノロジー企業史上初:MetaがGPT3パラメータサイズのAIモデルをオープンソース化

テキスト段落の生成、人間の会話のシミュレーション、数学の問題の解決において驚くほど優れたパフォーマン...

GPT-4 はハイブリッド大規模モデルを使用しますか?研究により、MoE+命令チューニングにより大規模モデルのパフォーマンスが向上することが証明された

GPT-4 の登場以来、優れた言語理解、生成、論理的推論など、その強力な創発能力に人々は驚嘆してきま...

お伝えする 5 つの理由: セキュリティ監視はなぜ人工知能なしでは実現できないのか?

人工知能は、特にセキュリティ分野において業界に大きな影響を与え始めています。成熟したセキュリティ サ...

携帯電話の通話は安全ではない、GSM暗号化アルゴリズムが破られた

今では、ほとんどの人が携帯電話を持つことに慣れています。しかし、携帯電話の盗聴を扱った映画のように、...

人工知能の主要技術:強化学習(RL)

人工知能技術はますます急速に進歩しており、それぞれのサブテクノロジーが生み出す価値もますます顕著にな...

クラウド AIGC をめぐる戦い: 最後に笑うのは Microsoft か Amazon か?

ChatGPTが11月下旬にリリースされて以来、テクノロジー業界の多くの人々は、OpenAIの資金...

清華大学とアリババDAMOアカデミーが開発した業界初の少数サンプルNERデータセット

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

人工知能の発展は私たちの生活にどのような影響を与えるのでしょうか?

防疫期間中の電子温度測定ドアから、宅配業界で使用されているドローンやロボットによる仕分け、私たちがよ...

...

人体の中で自由に動くロボット:柔軟でしなやか、毛細血管まで

[[408943]] 7月1日のニュースによると、最近、ヨーロッパの大学の中国の科学者は、シート状の...

今後10年の予測レポート:高齢化が進み、幼児市場が縮小、AIが様々な製品に浸透

IDCはこのほど、2019年および今後10年間の中国の情報通信分野と技術応用に関するトップ10予測を...