実装のアイデアと手順軽量 LLM モデル推論フレームワーク InferLLM を OpenHarmony 標準システムに移植し、OpenHarmony で実行できるバイナリ製品をコンパイルします。 (InferLLM は、量子化されたモデルを LLM にローカルに展開できるシンプルで効率的な LLM CPU 推論フレームワークです) OpenHarmony NDK を使用して、OpenHarmony 上で InferLLM 実行可能ファイルをコンパイルします (具体的には、OpenHarmony lycium クロスコンパイル フレームワークを使用し、いくつかのスクリプトを記述します。次に、それらを tpc_c_cplusplusSIG リポジトリに保存します)。 DAYU200に大規模な言語モデルをローカルにデプロイするInferLLM 3 パーティ ライブラリ コンパイル製品をコンパイルして取得するOpenHarmony SDK をダウンロードするには、ダウンロード アドレス:http://ci.openharmony.cn/workbench/cicd/dailybuild/dailyList このリポジトリをダウンロードする
InferLLM の 3 者ライブラリ ヘッダー ファイルと生成されたライブラリを取得します。InferLLM-405d866e4c11b884a8072b4b30659c63555be41d ディレクトリは、コンパイルされた 32 ビットおよび 64 ビットのサードパーティ ライブラリを含む tpc_c_cplusplus/thirdparty/InferLLM/ ディレクトリに生成されます。 (関連するコンパイル結果は、lycium ディレクトリの下の usr ディレクトリにパッケージ化されません)。 コンパイルされた製品ファイルとモデルファイルを開発ボードにプッシュして実行します。
InferLLM 三部ライブラリを移植して、OpenHarmmony デバイス rk3568 に大規模な言語モデルを展開し、人間とコンピューターの対話を実現します。最終的な実行効果は少し遅く、人間とコンピューターのダイアログボックスが少しゆっくりとポップアップするので、しばらくお待ちください。 |
<<: GPT-4/Llama2のパフォーマンスを大幅に向上させるためにRLHFは必要ない、北京大学のチームはAlignerの新しいアライメントパラダイムを提案
今日は、ビッグデータ、人工知能、認知問題の解決の関係ロジックについて話す記事を書こうと思います。した...
3年間「奇妙な病気」の治療を求めても効果がなかったのですが、ついにChatGPTによって診断に成功し...
[51CTO.com クイック翻訳] 人工知能は決して新しいものではありませんが、科学の分野では古く...
無人運転車による配達に続き、ドローンによる食品配達も現実化に向かって加速している。先日終了した202...
「統計」と「機械学習」の違いは何ですか?これは数え切れないほど議論されてきた質問です。この問題につ...
7月18日のニュース、Businessinsiderによると、米国の若い労働者はキャリア危機に直面し...
シスコが実施した調査によると、データプライバシーの面で生成AIに欠点があることを理解しているにもかか...
検索アルゴリズム - 指定された開始点から指定された終了点までのパスを計算するグラフ検索アルゴリズム...
米国のエレクトロニクス業界向け戦略コンサルティング会社、インターナショナル・ビジネス・ストラテジーズ...
[51CTO.com クイック翻訳]テクノロジーの進歩と発展により、バーチャル試着室が人々の生活に入...
RPA ツールの使用はここ数年で急増しています。今年のパンデミックにより、組織は、特に RPA が最...
[51CTO.com クイック翻訳] 画像処理と比較すると、ビデオから洞察を抽出したり、AI 技術を...