LLM の微調整は、複雑な問題から、継続的な技術改善を通じてアクセス可能な問題へと変化しました。 さて、無料で高速な LLM 微調整が可能になりました。 4月末、スタンフォード大学の開発者グループがLaminiをリリースし、GPT-3からChatGPTにもたらされたスーパーパワーをすべての開発者に提供すると主張しました。 最近、Lamini は新しい Alpha パブリック ベータ バージョンをリリースし、「ワイルド・スピード」を実行するための微調整が可能になりました。今では、微調整はわずか 10 分と 3 ~ 5 行のコードで実行でき、さらに重要なことに、コストはかかりません。 現在、4 億パラメータ以内の LLM 微調整は完全に無料です。これはほんの始まりに過ぎません。 写真 プロジェクトアドレス: https://github.com/lamini-ai/lamini ラミニの利点まずはLaminiのメリットを見てみましょう。 写真
そして、ラミニのプロジェクトアドレスには
ラミニチュートリアル使用例 ラミニって本当にすごいんですか?参考までに例を挙げます。 まず、微調整が必要な LLM があります。この例は、Lamini の内部エンジニアリング ドキュメントに関する質疑応答形式の LLM です。 写真 このモデルは、410M パラメータの Pythia モデルをベースとするチャット インターフェイスを提供します。 この 410M パラメータ LLM のパフォーマンスは満足できるものではないようです。 「Lamini にデータを追加するにはどうすればいいですか?」と質問すると、返される答えは信頼できません。 写真 データを入力することもできます。この例では、Lamini に関する 1400 件の質問と回答のデータセットがあります。小さく見えますが、現在の最大プロンプト サイズ (約 120K) よりもはるかに大きいです。 データを準備するためのプロのヒントをいくつか紹介します。品質は非常に重要です。たった 100 個の高品質な例で、正しい方向に進むことができます。では、高品質とは何でしょうか?
次に、このデータをモデルにロードしてトレーニングするように指示するだけです。 写真 わずか 10 ~ 15 分でこの LLM を実行できます。
もう一度同じ質問をしてみましょう。「Lamini にデータを追加するにはどうすればよいですか?」次の内容です。 今回は正解でした、微調整が大きな役割を果たしたようです。 Laminiを使用してLLMをトレーニングする方法 1. Lamini Types を使用して LLM インターフェイスを定義します。チャットボットにしたいですか?インターフェースは質問と回答です。コード副操縦士になりたいですか?インターフェースはプログラム入力とさらにプログラム出力です。タイプを使用して汎用 LLM (基本モデルまたは基礎モデル) を実行します。 2. 関連データを検索し、ラミニ タイプを作成します。タスクを実行する人間の専門家にとって役立つデータは何でしょうか?そのデータを取得し、そのパターンに一致する (追加の) Lamini タイプを作成します。コード チャットボットのドキュメント内の関数や、ボットに尋ねる質問の例などのサポート ドキュメントにすることができます。 3. Lamini を使用してデータをタイプにロードし、タイプを LLM にロードします。これにより、データが Types 形式に変換され、LLM がデータから最適に学習できるようになります。 4. LLM インターフェイスに一致するデータを取得します。そうでなかったらどうしますか?問題ない。これは、LLM パイプラインが活用されるデータ生成の目的です。まず、Lamini LLM エンジンを使用してデータ生成を実行し、Lamini タイプ (あらゆる種類) のより正確なデータを取得します。次に、Lamini フィルターまたは独自のスクリプトを使用してデータをフィルターし、高品質のデータを取得します。 5. 最適化トレーニングを通じて一般的なLLMを専門化します。 Lamini ライブラリを使用して、すべてのデータに対して独自の LLM をトレーニングします。
|
>>: スクリーンショットからiPhoneアプリを生成し、コードに変換し、ウェブサイトを作成できます。アップグレード後、Google Bardは本当に
[[334279]]この記事の主な内容:マイクログリッド、発電機、太陽光パネルなどのスマートグリッド...
著者: ユン・チャオ[51CTO.com からのオリジナル記事]コンピュータ プログラミングを使用し...
人工知能 (AI) は単なるテクノロジーの流行語ではありません。私たちの生活や仕事のやり方を急速に変...
IT Homeは11月8日、sciencedirectに掲載された最新の論文によると、科学者は20...
はじめに: この記事で紹介するリポジトリには、Python で実装された一般的な機械学習アルゴリズム...
インテリジェントシステムは独自の初期目標を決定することはできませんが、経験に基づいて独自の派生目標を...
Isolation Forest または「iForest」は、わずかなパラメータのみで外れ値を検出で...
多くの人が人工知能技術の導入に非常に興味を持っていることは間違いありません。しかし、世界的な調査によ...
朝起きると、自分が遅く起きたことに気づきます。時間通りに会社に着いて出勤記録を残さないようにし、勤怠...
[[410183]] 7月8日のニュース 2021年世界人工知能大会の開幕式で、工業情報化部の肖亜青...
この記事では、ニューラルネットワークの描画をより美しくする 12 個のツールを紹介します。 1. 描...
フォーチュン 500 にランクされる世界的なテクノロジー サービス企業 DXC Technology...
AIエリートが100万以上稼ぐ!マスク氏が設立したOpenAIが誤って給与情報を公開4月23日のニ...
持続可能なワークスペースとは、環境への悪影響を最小限に抑え、廃棄物を削減するワークスペースです。もち...
AI は、従来のプロセスや従来のテクノロジーにまき散らされた魔法の精霊ではなく、ビジネスのやり方を根...