最近、Claude 2 が発表され、Google Bard が中国語をサポートし、Open AI がコードインタープリターをリリースしました... 大型モデルが次々と発売されていますが、多種多様であり、1つのモデルですべての問題を解決できるわけではありません。 では、さまざまなタスクにどちらを使用すればよいのでしょうか? 写真 心配しないでください。ペンシルバニア大学ウォートン校のイーサン・モリック教授が選択ガイドをまとめています。 意思決定の困難に悩む人々に今、助けがあります! このガイドでは、今夏時点の最新状況を網羅するだけでなく、さまざまなタスクにおけるさまざまな大規模モデルのパフォーマンス比較も含まれています。 6 つの使用シナリオで大規模なモデルを選択するためのステップバイステップ ガイドと、最適な無料および有料のオプションについて説明します。 これを見たネットユーザーはこう言った。
写真 この選択ガイドに何が含まれているか見てみましょう。 さまざまなビッグモデルを使用して、これら6つのことを実行します1. ライティング最高の無料オプション: Bing、Claude 2 有料オプション: ChatGPT 4.0、ChatGPT+プラグイン AI ライティングに関しては、Ethan Mollick 教授は GPT-4 が依然として最も信頼できるツールであると考えています。 家族は無料の Bing (クリエイティブ モード) を使用することもできますが、Claude も良い選択です。 具体的には、ビッグモデルを使用すると、下書きの作成、コンテンツの執筆の最適化、タスクの完了の支援、自分自身のロック解除(AI は困難を克服する方法を提供します)などが可能になります。 さらに、これらのツールは、Microsoft Office + GPT や Google Docs + Bard などの一部のオフィス アプリケーションに統合されています。 写真 上記の大規模モデルはすべて、テキストの書き込みでは優れたパフォーマンスを発揮しますが、「幻覚」や意味不明な結果も生成する可能性があります。特に、インターネットに接続されていない大規模なモデルでは、インターネット上で参考文献や引用情報を提供する必要があります。
イーサン・モリック教授は、以前の使用法にも問題を発見しました。
写真
2. 画像を作成する最も透明なオプション: Adobe Firefly オープンソースオプション: 安定した普及 最高の無料オプション: Bing、Bing Image Creator (DALL-E を使用)、Playground (複数のモデルを使用可能) 最高画質の画像: Midjourney 現在、主な画像生成ツールには以下のものがあります。
それぞれの大規模モデルのパフォーマンスは次のとおりです(各画像は同じプロンプトで異なるモデルによって生成された最初の画像です) 。 写真 △テーマ:「ゴッホにインスパイアされたスニーカーのファッション撮影」これらのモデルは、トレーニング データの影響により、必然的に何らかのバイアスを持つことに注意してください。 第二に、トレーニングデータのほとんどはインターネットから取得されるため、透明性が欠けており、画像の著作権の問題も十分に明確ではありません。 さらに、現在のところ、画像生成では実際にテキストを作成することはできず、テキストのように見える一連のものを生成することしかできません。しかし、Midjourney は手の描写をうまく行っています。 3. 創造的思考最高の無料オプション: Bing 有料オプション: ChatGPT 4.0 (ただし、Bing ネットワークによりパフォーマンスが向上する可能性があります) 良いアイデアを得るには通常、たくさんのアイデアが必要ですが、AI はたくさんのアイデアを生み出すのが得意です。 アイデア モードでは、Bing を使用して、ブライアン イーノのオブリーク戦略やマーシャル マクルーハンのテトラッドなど、お気に入りの型破りなアイデア生成テクニックを検索して適用したり、モデルに奇妙なアイデアを考え出させたりすることができます。 写真 4. ビデオを作る最高のアニメーション ツール: D-iD (ビデオ内の顔をアニメーション化)、Runway v2 (テキストからビデオを作成する) 最高のサウンドクローン: ElevenLabs AI 生成ビデオをワンストップサービスで提供できるようになりました。 キャラクター生成から脚本作成、吹き替えまですべてAIで行えます。 AI ツールを使用して生成されたビデオは、非常にリアルに見える場合があります。イーサン・モリック教授は自身の写真を使って「偽のビデオ」を作成した。 写真 しかし、これらのツールは倫理的に使用する必要があることに注意することが重要です。 5. ファイルとデータの取り扱いデータ(およびコードを使用した奇妙なアイデア): コードインタープリター ドキュメント: Claude 2 (大きなドキュメント、または複数のドキュメントを同時に操作する場合)、Bing (小さなドキュメントや Web ページ用のサイドバー) コードインタープリターは、アップロードされたファイルに対してコードを記述して実行することができ、生成された結果をダウンロードすることもできます。プログラムを実行したり、データ分析を行ったり、さまざまなドキュメント、Web ページ、さらにはゲームを作成したりするために使用できます。 Ethan Mollick 教授は、コード インタープリターを使用してデータの視覚化を処理する方法も確立しました(記事の最後にあるリンクを参照) 。 写真 PDF ドキュメントの処理に関しては、Claude 2 が依然として最適です。 イーサン・モリック教授は、Claudeに本全体を貼り付け、複雑な学術論文を多数与えて結果を要約するように指示したところ、Claudeは優れたパフォーマンスを発揮したと語った。 写真 それだけでなく、「この方法の証拠は何ですか?」などの質問を続けて、データをさらに調査することもできます。著者の結論は… しかし、モデルが「幻覚」を生成することもあるため、この点には依然として注意を払う必要があります。 6. 情報を入手し知識を学ぶ最高の無料オプション: Bing 有料オプション:子供向けにはKhanmigo(AI家庭教師)が利用可能 イーサン・モリック教授は、「幻覚」の危険性が高いため、これらの大規模なモデルを検索エンジンとして使用しない方がよいと考えています。 彼は、Bing はインターネットに接続されているため、「幻覚」が比較的少なくなるため、Bing の使用を推奨しました。しかし、慎重に使用すれば、特に検索エンジンがあまり良い結果を出さない状況では、AI は検索よりも有用な回答を提供できる場合が多くあります。 さらに、学習を支援するためにこれらの AI ツールを使用するのは良い選択です。イーサン・モリック教授も、良い「自動家庭教師」のヒントだと思ったことを教えてくれました。 写真 ポータル: 参考リンク: |
<<: スタンフォード大学の博士によるソロ作品!大規模モデルのトレーニング速度が再び2倍になり、彼はスタースタートアップの主任科学者として参加することを正式に発表した。
人工知能は多くの業界のワークフローを変革しました。デジタル顧客サービスアシスタント、自動運転車、無人...
少し前に、「テイラー・スウィフトが中国語を披露」する動画がさまざまなソーシャルメディアプラットフォー...
数週間前、Googleの人工知能(AI)子会社DeepMindが、Gato(同じトレーニング済みモデ...
2018年は新しい小売業が爆発的に増加した年でした。誰もがそれを実感したと思います。以前よりもコン...
[[353013]]みなさんこんにちは。今日は職場でのアルゴリズム エンジニアの日常生活、つまりモ...
[[266832]]人工知能は今日のデジタル変革に欠かせない要素となり、デジタル変革の定義を完全に置...
9月に、TIOBE Indexは改良されたアルゴリズムを使用してプログラミング言語の人気度を計算しま...
[[286906]]人工知能 (AI) は、通常は人間の思考を必要とするタスクを実行できるインテリ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
Deepmind は、直感的な物理学を学習できるモデルを構築し、モデルがなぜこの能力を実現するのか...
最近では、HBase ベースの製品の読み取り速度と書き込み速度に対する要件がますます高まっています。...
ハイパースケーラーはすでに業務改善のために AI を活用していますが、他のほとんどのデータセンターで...