誰でも大きなモデルを使用できます。よく構成されたプロンプトにより、簡単に始めることができます。

誰でも大きなモデルを使用できます。よく構成されたプロンプトにより、簡単に始めることができます。

プロンプトは、中国語ではプロンプトワードと翻訳でき、大規模なモデルが特定のコンテンツを生成するようにガイドするために使用されるテキスト入力です。 Prompt の役割は、大きなモデルに何を実行してほしいかを伝え、必要な情報と制約を与えることです。 Prompt の品質は、大規模モデルの出力品質と効率に直接影響します。

プロンプトライティングは科学であると同時に芸術でもあります。芸術とは、簡潔で正確かつ興味深い言語を使用して大規模モデルの創造性を刺激する方法であり、科学とは、構造化され、反復的で最適化された方法を使用して大規模モデルの精度、効率、堅牢性を向上させる方法にあります。この記事では、これら 2 つの側面からプロンプト作成スキルをいくつか紹介し、大規模モデルの強力な機能をより有効に活用できるようにお手伝いします。

汎用プロンプトフレームワーク

プロンプトライティングはランダムなものではなく、特定のルールと論理に従う必要があります。プロンプトをより明確かつ秩序立てて理解しやすくするために、共通のプロンプト フレームワークを採用して、プロンプト コンテンツを整理して提示することができます。このフレームワークには次の部分が含まれます。

  • 役割: このモジュールは、教師、翻訳者、ライターなど、大規模モデルの役割を指定するために使用されます。役割を指定することで、大規模なモデルが対応する領域とタスクに集中できるようになり、出力の関連性と専門性が向上します。
  • プロファイル: このモジュールは、Prompt の作成者、バージョン、説明などの情報を記録するために使用されます。これにより、Prompt のソースと変更を追跡および管理できます。
  • 目標: このモジュールは、プロンプトの目標、つまり、このプロンプトを通じて大きなモデルが達成できると期待される機能や効果を記述するために使用されます。このモジュールは 1 つの文で要約できるため、大きなモデルでも Prompt の主なアイデアと方向性を把握できます。
  • 制約: このモジュールは、Prompt の制約、つまり、大規模なモデルで実行したくないことや出力に含めたくないことを記述するために使用されます。これらの制約は、形式、長さ、言語、スタイル、コンテンツなどの要件であり、大規模なモデルを削減し、不要または不適切な出力ブランチの計算を減らすのに役立ちます。
  • スキル: このモジュールは、Prompt に必要なスキル、つまり、出力時に大きなモデルにどのような機能や知識を発揮させたいかを記述するために使用されます。これらのスキルは、専門分野、言語、ロジック、創造性などであり、対応する分野のビッグモデルの情報量と出力品質を強化します。
  • ワークフロー: このモジュールは、Prompt のワークフロー、つまり、大規模なモデルが入力と出力と対話するために実行する手順と順序を記述するために使用されます。このモジュールは Prompt の中核部分です。いくつかの簡単なステートメントを使用して、ユーザーの歓迎、ユーザー入力の取得、ユーザー入力の処理、結果の出力、会話の終了など、大規模なモデルのワークフローを記述できます。

これらのモジュールに加えて、プロンプトの最後に初期化セクションを追加して、大規模モデルを初めて起動したときの会話の内容を定義し、ユーザーとの接続と信頼を確立し、いくつかの注意事項と重要なポイントを強調することもできます。

写真

よくわからない場合は、公式アカウントのバックグラウンドで「TSC」と返信すると、何百もの洗練されたプロンプトが表示されます。

上記は一般的なプロンプト フレームワークであり、基本的なプロンプトをすばやく構築し、さまざまなシナリオやニーズに応じてカスタマイズおよび最適化するのに役立ちます。次に、シナリオ指向のプロンプトのカスタマイズ手法と、例を挙げてプロンプトの効果を高める方法を紹介します。

シナリオ指向のプロンプトカスタマイズ技術

前のセクションでは、GPT が目標、制限、スキル、プロセスを理解できるように、基本的なプロンプトをすばやく構築するのに役立つ一般的なプロンプト フレームワークを紹介しました。ただし、このフレームワークは静的ではありません。さまざまなシナリオやニーズに応じてカスタマイズおよび最適化し、プロンプトをより効率的かつ正確にすることもできます。このセクションでは、シナリオ指向のプロンプトのカスタマイズのヒントをいくつか紹介し、インスピレーションと参考資料を提供したいと思います。

ChatGPTに提案を依頼する

時には、良いプロンプトの書き方がわからなかったり、新しいインスピレーションや創造性を見つけたいと思ったりすることもあります。現時点では、ChatGPT の強力な自然言語生成機能を使用して、いくつかの提案やフィードバックを得ることができます。具体的な方法は、Prompt フレームワークを使用して、構造ブロックにいくつかの質問やリクエストを記述し、ChatGPT が回答したり満足したりできるようにすることです。例えば:

写真

このようにして、ChatGPT は私たちの質問やリクエストに基づいていくつかの役立つ提案や例を生成し、プロンプトの改善と完成に役立ちます。もちろん、これらの提案や例は必ずしも正しい、あるいは適切であるとは限りません。本質を抽出し、不要なものを捨てるためには、私たち自身で判断し、ふるいにかける必要があります。


修正されたテストケース

プロンプトを記述した後、その出力が期待どおりであるかどうかを確認するためにテストする必要があります。テストと比較を容易にするために、3 ~ 5 個の固定テスト入力ケースを選択し、各反復後にそれらを使用してプロンプトの有効性をテストすることをお勧めします。このようにして、異なるバージョン間でのプロンプトの変更と最適化をより明確に確認し、入力のランダム性による誤判断や混乱を避けることができます。 Prompt フレームワークでは、構造ブロック ## Test Cases: を追加し、この構造ブロックで選択したテスト入力ケースをリストできます。たとえば、次のテストを実行します。

 ## Test Cases: - 输入1: 中国人口最多的省份是? - 输入2: 中国有哪些滨海的城市?

このようにして、これらの入力を使用してプロンプトをテストし、その出力が目標、制約、スキル、プロセスを満たしているかどうかを観察できます。満たされていない場合は、出力結果に基づいてプロンプトを適宜変更および最適化できます。

余剰分を取り除いて不足分を補う

プロンプトをテストして反復するときは、プロンプトの出力を注意深く観察し、その長所と短所を分析し、問題点と改善の余地を見つける必要があります。最適化プロセスを導くために、過剰を減らし、不足を増やすという単純な原則を使用できます。つまり、プロンプト出力結果内の冗長または不要な情報を削減または削除し、プロンプト出力結果内の欠落または不十分な情報を増やすか補足する必要があります。具体的な方法は、Prompt フレームワークに構造ブロック ## Feedback: を追加し、この構造ブロックに Prompt 出力結果に対する評価とフィードバックを記述し、その長所と短所、改善が必要な領域を指摘することです。例えば:

 ## Feedback: - 优点: 输出结果格式清晰,翻译准确,提供了日语假名- 缺点: 输出结果没有标点符号,没有换行,没有区分英文和日文的输出- 改进: 在constrains 环节,增加标点符号和换行的要求,在output 环节,增加英文和日文的标签

このようにして、フィードバックに基づいてプロンプトを適宜変更および最適化できるため、プロンプトの出力結果はより完全になり、ニーズを満たすようになります。このプロセス中は、変更の効果をより明確に確認し、一度に多くの変更を加えることで生じる混乱やエラーを回避するために、一度に 1 か所または数か所のみを変更することをお勧めします。

例を挙げてプロンプトを強化する

Prompt を書くときに、例を使用するのは非常に実用的な手法です。少数 (1 ~ 3) の入力 -> 出力例を提供することで、GPT はサンプルの共通性を学習し、次の出力結果の品質を向上させることができます。この手法は Few-Shots と呼ばれ、機械学習モデルをトレーニングするときに、ラベル付けされたサンプルをごく少数だけ使用することを意味します。その目標は、ラベル付けされたサンプルが少数であっても機械学習モデルが優れたパフォーマンスを達成できるようにすることです。

一般的な Prompt フレームワークに基づいて構造ブロックを追加できます: ## 例:、この構造ブロックに 1 ~ 3 個の例を指定して、Prompt によってもたらされる出力結果をさらに改善できます。たとえば、GPT が中国語の文字を英語と日本語に翻訳し、日本語の仮名を提供できるプロンプトを作成したいとします。次のプロンプトを参照できます。

写真

2 つの例を提供することで、GPT が目標と形式をよりよく理解できるようになり、翻訳の正確性と一貫性が向上します。もちろん、例の量と質も GPT の出力に影響するため、代表的で多様な例を選択し、過度に単純または複雑な例を避ける必要があります。最良の結果を得るために、GPT の出力に基づいて例を調整することもできます。

<<:  黄仁訓:AIは5年以内に人間を超える、OpenAIの最初のAIスーパーコンピュータはマスクによって購入された

>>:  インテリジェントな意思決定の新時代: AutoGen による財務データの分析

ブログ    

推薦する

機械学習の卒業生は就職に不安を感じ始めています!卒業生と企業のどちらがより厳しいでしょうか?

機械学習を専攻する学生も就職について不安を感じ始めているのでしょうか?昨日、あるネットユーザーがRe...

PyTorch と TensorFlow のベンチマーク: どちらのプラットフォームが NLP モデル推論をより速く実行しますか?

PyTorch と TensorFlow のどちらが優れているかという議論は、決して終わることはあ...

大型模型シリーズ - RAGの解釈

RAG は、2023 年に最も人気のある LLM ベースのアプリケーション システム アーキテクチャ...

ソフトマックスボトルネックを超えて: 高ランク RNN 言語モデル

因数分解に基づいて、リカレントニューラルネットワーク (RNN) に基づく言語モデルは、複数のベンチ...

...

何開明のMAEが人気になってから、ビジュアルトランスフォーマーを整理したいですか?この記事は100以上の

[[436989]]コンピュータービジョン界は最近非常に活発です。まず、He Kaiming 氏らは...

プログラマーは30歳で転職すべきでしょうか?曲がるならどちらの方向がいいでしょうか?

最近、皆さんは次のような H5 に悩まされていると思います。広告ポスター500枚の予算は2,000元...

色を選ぶと、このAIシステムがロゴをデザインします

LoGANがデザインしたいくつかのロゴ画像提供: マーストリヒト大学[51CTO.com クイック翻...

非反復乱数列生成アルゴリズム

この記事では、ハッシュテーブルを使用して重複を排除する通常の方法よりもはるかに高速な、繰り返しのない...

AIはセルオートマトンを通じてMinecraftで家を建てることを学ぶ

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ビッグニュース!アリババの音声認識モデルのコア技術により、未来を「聞く」ことができる

[[255840]] Ali Sister の紹介: 音声認識技術は人工知能技術の重要な部分として、...

Diffie-Hellman 鍵交換は、一般的な暗号化アルゴリズムです。

公開されたばかりの Logjam 脆弱性 (FREAK 脆弱性のバリエーション) に関する情報はブラ...

...

乱雑なファイルキャビネットとはお別れしましょう! AI ドキュメント管理システムの 7 つのメリット

[[341868]]従来のファイリングキャビネットは、契約書、ベンダー契約書、入社書類、その他の書類...

人工知能が爆発的に進化しています。この「鉄の飯碗」を手に入れるための新しいガイドをぜひ保存してください!

近年の人工知能の発展スピードは驚異的で、あらゆる分野で専門的なAIが登場しています。上海では以前、無...