任意のデータセットに基づいて LLM (大規模言語モデル) ロボットを作成する

任意のデータセットに基づいて LLM (大規模言語モデル) ロボットを作成する

今日、偶然Embedchainというウェアハウスを見つけ、とても便利だと思ったので、皆さんとシェアします。倉庫の住所は以下の通りです。

埋め込みチェーン

OpenAI をベースにしていますが、独自のデータセットを追加して会話型ロボットを生成することもできます。使い方は簡単で、簡単に始めることができます。

Embedchainの紹介

Embedchain は、あらゆるデータセットに基づいて LLM (大規模言語モデル) ボットを簡単に作成できるフレームワークです。データセットの読み込み、チャンク化、埋め込みベクトルの作成、ベクトル データベースへの保存というプロセス全体を抽象化します。 .add 関数と .add_local 関数を使用して 1 つまたは複数のデータセットを追加し、.query 関数を使用して追加したデータセットから回答を見つけることができます。

あなたが偉大な人物、Naval Ravikant を尊敬していて、彼の知識を会話型ロボットに変えたいと考えているとします。彼の YouTube 動画、PDF 書籍、ブログ投稿、およびあなたが提供する質問と回答のペアを Embedchain に追加すると、Embedchain がロボットを作成します。次に例を示します。

 from embedchain import App naval_chat_bot = App() # 嵌入在线资源naval_chat_bot.add("youtube_video", "https://www.youtube.com/watch?v=3qHkcs3kG44") naval_chat_bot.add("pdf_file", "https://navalmanack.s3.amazonaws.com/Eric-Jorgenson_The-Almanack-of-Naval-Ravikant_Final.pdf") naval_chat_bot.add("web_page", "https://nav.al/feedback") naval_chat_bot.add("web_page", "https://nav.al/agi") # 嵌入本地资源naval_chat_bot.add_local("qna_pair", ("Who is Naval Ravikant?", "Naval Ravikant is an Indian-American entrepreneur and investor.")) naval_chat_bot.query("What unique capacity does Naval argue humans possess when it comes to understanding explanations or concepts?") # 答案:Naval 认为,人类在理解解释或概念方面拥有独特的能力,这是在这个物理现实中可能的最大程度。

Embedchainの使用

Embedchain の使用を開始するには、まずパッケージがインストールされていることを確認してください。まだインストールされていない場合は、pip を使用してインストールできます。

 pip install embedchain

Embedchain は OpenAI の埋め込みモデルを使用してブロックの埋め込みを作成し、ChatGPT API を LLM として使用して、関連ドキュメントへの回答を提供します。 OpenAI アカウントと API キーがあることを確認してください。 APIキーをお持ちでない場合は、このリンク[1]にアクセスして作成できます。

APIキーを取得したら、OPENAI_API_KEYという環境変数に設定します。

 import os os.environ["OPENAI_API_KEY"] = "sk-xxxx"

次に、embedchain から App クラスをインポートし、.add 関数を使用してデータセットを追加します。

 from embedchain import App naval_chat_bot = App() # 嵌入在线资源naval_chat_bot.add("youtube_video", "https://www.youtube.com/watch?v=3qHkcs3kG44") naval_chat_bot.add("pdf_file", "https://navalmanack.s3.amazonaws.com/Eric-Jorgenson_The-Almanack-of-Naval-Ravikant_Final.pdf") naval_chat_bot.add("web_page", "https://nav.al/feedback") naval_chat_bot.add("web_page", "https://nav.al/agi") # 嵌入本地资源naval_chat_bot.add_local("qna_pair", ("Who is Naval Ravikant?", "Naval Ravikant is an Indian-American entrepreneur and investor."))

スクリプトまたはアプリにアプリの他のインスタンスがある場合は、次のようにインポートを変更できます。

 from embedchain import App as EmbedChainApp # 或者from embedchain import App as ECApp

これでアプリケーションが作成されました。 .query 関数を使用すると、任意のクエリに対する回答を取得できます。

 print(naval_chat_bot.query("What unique capacity does Naval argue humans possess when it comes to understanding explanations or concepts?")) # answer: Naval argues that humans possess the unique capacity to understand explanations or concepts to the maximum extent possible in this physical reality.

サポートされている形式

以下の形式がサポートされています:

Youtubeビデオ

アプリケーションに Youtube ビデオを追加するには、データ型 (.add の最初のパラメーター) として youtube_video を使用します。例えば:

 app.add('youtube_video', 'a_valid_youtube_url_here')

PDFファイル

PDF ファイルを追加するには、データ型 pdf_file を使用します。例えば:

 app.add('pdf_file', 'a_valid_url_where_pdf_file_can_be_accessed')

パスワードで保護された PDF はサポートされていないことに注意してください。

ウェブページ

任意の Web ページを追加するには、データ型 web_page を使用します。例えば:

 app.add('web_page', 'a_valid_web_page_url')

文章

独自のテキストを指定するには、データ型テキストを使用して文字列を入力します。テキストは処理されず、非常に多様になる可能性があります。例えば:

 app.add_local('text', 'Seek wealth, not money or status. Wealth is having assets that earn while you sleep. Money is how we transfer time and wealth. Status is your place in the social hierarchy.')

注: ほとんどの場合、段落全体またはファイル全体を提供するため、例ではこれは使用されません。

<<:  Dubbo 負荷分散戦略コンシステントハッシュ

>>:  貧困が私を訓練した

ブログ    
ブログ    
ブログ    

推薦する

「アルゴリズムとデータ構造」トライ木の美しさ

[[349418]]序文今回紹介するトライ辞書ツリーは、データ構造トピックの分岐です。トライのツリー...

...

オープンソース: ディープラーニングモデルと姿勢推定コードのオープンソースコードの推奨、人工知能チュートリアル

オープンソース: ディープラーニング モデルとポーズ推定コードのオープンソース コードの推奨、人工知...

Microsoft の GitHub AI コードアシスタント Copilot Chat が個人利用向けに利用可能に

9月21日、Microsoft GitHubは今年7月にエンタープライズユーザー向けにAIコードアシ...

メタバース軍団を結成しよう! 「Google Lab」が生まれ変わる、700人超の謎のチームのメンバーは?

Microsoft と Meta が独自の「Metaverse」を大々的に立ち上げたとき。これが ...

ビッグデータの機械理解の秘密:クラスタリングアルゴリズムの詳細な説明

クラスタリングは、ビッグデータを理解する上で非常に一般的かつ基本的な方法です。最近、データ サイエン...

企業に利益をもたらす 5 つの AI トレンド

市場の状況がますます複雑化する今日の不安定なビジネス環境では、組織が分析に基づく意思決定を行うために...

ディープラーニングの父ヒントン氏が、人工知能を一新するカプセルネットワークの最新動向を発表

[[210898]]なぜ人々が人工知能にこれほど魅了されるのか分からないなら、69歳のGoogle研...

自動運転における説明可能なAIのレビューと今後の研究の方向性

2021 年 12 月 21 日に arXiv にアップロードされた自動運転のための説明可能な AI...

数学的能力はChatGPTを超え、700億のオープンソース大規模モデルが人気:AIを使用してAIを微調整、Microsoftの中国人チームが制作

AI生成の指示を使用してAlpacaモデルを微調整すると、数学的能力はChatGPTを超える—— M...

ハルビン工業大学は、象の鼻と同じくらい柔軟な人工筋肉を備えた柔軟なロボットを開発しました。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

速報です!画像AI企業「Huiyi Huiying」がハッキングされ、COVID-19研究成果が公開された

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

雲智盛 梁 嘉恩: インテリジェントインタラクション技術とモノのインターネットアプリケーション

[51CTO.comより引用] 2017年7月21日から22日まで、51CTO主催の人工知能をテーマ...

ウェアラブル AI が IoT に与える影響

ウェアラブル人工知能がモノのインターネット (IoT) の発展に与える影響を探ります。デジタル時代の...