ゲスト: 陳斌、黄文馨 ホスト | ユン・チャオ ノア著 制作:51CTO テクノロジースタック(WeChat ID:blog) 生成型 AI は過去 1 年間で世界を席巻しました。人工知能、ビッグモデル、AIGC などの一連の概念は、もはやテクノロジー界隈内の「自己娯楽」に限定されず、ChatGPT の人気とともに早くからその圏外に飛び出し、世間の注目を集めるようになりました。 最近、SORA の突然の出現により、人々は「AI が現実の物理世界を理解し、シミュレートする」という大きな機会がすぐそこまで来ていると信じるようになりました。この技術の波が情報技術の基盤となるアーキテクチャを覆し、インターネットの歴史を新たな時代へと導く可能性が非常に高いことに、ますます多くの人々が気づき始めています。 ガートナーの最新の「2024年のトップ10戦略的テクノロジートレンドレポート」を見ると、唯一のキーワードは人工知能です。 今後、ガートナーは、2023 年の初めには 5% 未満であった企業が、2026 年までに 80% を超える企業が生成 AI API またはモデルを使用するか、生成 AI 対応アプリケーションを本番環境に導入すると予測しています。 生成 AI の応用により、産業エコロジカル モデルが革新されることが予測されます。 2023年現在、生成AIの開発は急速に進んでいますが、データセキュリティ、倫理的課題、コンプライアンスなどの問題が徐々に顕在化してきました。 革新的なアプリケーション シナリオや製品形態がますます登場し続ける中、生成 AI は世界にどのような新しいパラダイムの変化をもたらすのでしょうか。生成 AI を中心としたビジネスを始める上での難しさは何ですか?生成AIは、本当に全国的な流行を巻き起こす「スーパーアプリ」を生み出すのでしょうか? 51CTOの「T最前線」コラムでは、NETSTARS最高技術責任者の陳斌氏とTencent CSIG技術ディレクターの黄文鑫氏という2人の重要なゲストを特別に招待し、上記のトピックについて一緒に議論しました。 以下は生放送の書き起こしです。原文の意味を変えずに整理してあります。 1. 生成 AI によってもたらされるパラダイムシフトには、どの程度の想像の余地があるでしょうか?T 最前線: 生成 AI テクノロジーは AI 開発に新たなパラダイムをもたらします。個人の生産性を解放する場合でも、産業形態を再構築する場合でも、その応用の見通しは非常に広範囲です。例えば、情報の入手方法という点では、従来の検索エンジンと比べて、生成型 AI にはどのような想像の余地があるのでしょうか。 Chen Bin: 従来の検索では、ユーザーが検索している質問のキーワードに基づいて、読み取ることが不可能な大量の検索結果が提供されることがよくあります。対照的に、GPT は質問の正確さに直接基づいて、よりターゲットを絞った、より絞り込んだ回答を提供します。 さらに、検索は一度限りのものです。一度質問してから、別の方法で再度質問すると、結果は異なります。しかし、GPT は継続的なやり取りを通じて徐々に問題の核心に迫ることができます。そのため、GPT はより構造化された知識を提供し、検索エンジンはさらに分析を必要とする情報を提供します。 想像の余地があるのは、GPT が完了させたいタスクを駆動できるからです。従来の検索は通常、検索結果で終わりますが、GPT では特定の結果を取得できるだけでなく、知識の背景、ルール、データに基づいて特定のシナリオで決定を下し、より多くのシナリオを直接駆動してインテリジェントな作業を実行することもできます。この意思決定能力は検索エンジンのそれとは質的に異なります。 Huang Wenxin: 最近では、人々は検索に GPT を使用することに慣れていますが、実際には検索は GPT の機能のごく一部にすぎません。私は以前、「教育目標分類法」という概念に出会ったことがあります。AI 実装研究を行っている多くの専門家が、思考を助けるためにこの方法を使用しています。私は今、プロンプトを考えるためのインスピレーションを得るためにこの方法をよく使っています。 この概念は、私たちができることを、記憶、解析、応用、分析、接続、評価、作成の 7 つの領域に分類します。領域ごとに、対応するプロンプト動詞があります。たとえば、検索で「これはどのように見えるか説明してください」「このオブジェクトを特定してください」などと尋ねると、記憶と分析のレベルに重点が置かれます。多くの場合、人々は、記憶と分析以外には他のレベルでのアイデアがないため、生成 AI を仕事や生活に真に統合することができません。 以前、私たちは AI アプリケーションを開発し、それを社内の欠陥管理プラットフォームとリンクさせたいと考えていました。では、欠陥管理に使用できるプロンプトはどのように作成すればよいのでしょうか? 想像力を最大限に広げて AI をより便利にするにはどうすればよいでしょうか?私は同僚たちに、教育目標分類法にプロンプト動詞を適用してみることを提案しました。たとえば、欠陥の品質を評価するためのプロンプトを記述したり、欠陥管理システム全体のデータを分析するためのプロンプトを記述したりします。動詞の組み合わせによって用途が異なり、これらに基づいてさまざまなアイデアが生まれます。この範囲内で、将来的に GPT が拡張できるアプリケーションは数多くあるかもしれません。 2. 大規模モデルアプリケーションの開発ハードルは本当に低いのでしょうか?T Frontline: 人間とコンピュータのインタラクションが簡単なプロンプトで実現できるため、AI アプリケーション開発のハードルはどんどん低くなってきているようです。最近、OpenAI は、コードを必要とせずに自然言語の対話を通じてカスタマイズされた GPT を作成できる GPT をリリースしました。しかし、企業の観点から見ると、実際にAIアプリケーション製品を発売するのはそれほど簡単ではありません。 GPT を呼び出すには、コンピューティング能力、データ、人材、持続可能なビジネス モデルが必要です。先生方はこのことについてどう思いますか? Huang Wenxin: まず、現時点で最も優れているのは間違いなく ChatGPT ですが、OpenAI のこのシステムの使用コストは決して安くはありません。実際に GPT4 を使用する場合、結果を出力するプロンプトを 1 つだけ使用すると、プロンプトの消費量は依然として制御可能な範囲内になります。ただし、ツリー構造のロジック チェーンを使用してより良い出力結果を追求する場合、無駄になるトークンの量は 10 倍、さらには 20 倍になる可能性があります。 さらに、データの問題も重要です。非常に優れた AI をトレーニングするには、継続的に高品質のデータを生成するプロセスまたは製品が必要であると私は常に信じています。これは、コア競争力の問題をある程度説明することもできます。しかし、実際のところ、私はまだ良い標準化された方法を見つけていません。私の現在のアプローチは、既存のリソースを使用して、可能な限り比較的高品質のデータを生成することです。ラベル付けも私のチームに任せたいと思っています。私は今でも、人間の介入なしには人工知能は実現できないと信じています。依然として人材が必要であり、それが企業の中核的な競争力を決定する可能性があり、これは確かに非常に重要な部分です。 Chen Bin: 私の意見では、GPT の鍵となるのは計算能力ではありません。システムの実行を維持するのが GPU であろうと他のリソースであろうと、代替手段が見つかる可能性があります。たとえば、GPU はすぐに量子コンピューティングに置き換えられる可能性があります。さらに大きな問題は、OpenAI 自身を含むシリコンバレーの多くの企業が現在、GPT をどのように規制するかを検討していることです。 GPT は諸刃の剣であり、適切に使用するかどうかによって大きな違いが生じる可能性があります。特に賢い人が正しい道を進むか間違った道を進むかによって、人類に与える影響も異なるでしょう。したがって、GPT がもたらす利便性や利点よりも、これが将来人々の関心を引くものになるかもしれません。なぜなら、GPT を制御できず、GPT が独自に発達し、特に意識を発達させてしまうと、全人類にとって大きな脅威となるからです。 T Frontline:大規模モデルを中心にAIアプリケーション製品を開発する場合、初期段階ではコンピューティングパワーのコストやデータ品質などに重点を置く場合があります。黄教授が述べたように、高品質のデータを継続的に生成できない場合、作成したアプリケーションはコア競争力に欠け、簡単に他社に殺されてしまいます。もう一つ注意すべき点は、アプリケーション以外のことです。陳さんがおっしゃったように、製品がコンプライアンスを遵守し、安全であるかどうかが、アプリケーションが実際に使用されるか、あるいは普及するかの鍵となるかもしれません。 3. AI アプリケーションは大規模なモデル アプリケーション ベンダーに取って代わられるでしょうか?Tフロントライン:国内外のテクノロジー大手を見ると、クラウドインフラや大規模モデルにまたがっている企業が多く、モデル層とアプリケーション層の境界が比較的曖昧になっています。このような観点から、AIアプリケーション層に注力するスタートアップや独立系ソフトウェア開発会社(ISV)の競争力はどこにあるのか。今後、大手機種メーカーに「飲み込まれる」リスクに直面することになるのだろうか。 陳斌:いいえ。汎用人工知能に加えて、特定のシナリオで特定のタスクを解決できる知能である特殊用途人工知能もあります。 GPT が大学卒業生のようなものだとすると、かなりの知識の蓄積と一定の作業能力を備えています。しかし、実際に人員を配置して業務を遂行しようとすると、会社の業務プロセス、データの仕様、人事制度、業界の専門知識など、すべてについてさらに理解を深める必要があるため、まだ少しギャップがあります。 言い換えれば、汎用的な人工知能を、本当に物事を実行し、特定の企業や職種に役立つ専用ロボットに変えるには、学習とトレーニングが必要です。これは通常、アプリケーション実装のラストマイルの解決と呼んでいるもので、大規模な GPT 企業が対応できるものではありません。金融業界を例にとると、各金融機関には独自のプラットフォームがあり、各プラットフォームには独自のデータがあります。非常に有能な金融機関の中には、業界をリードする FinBot になるところもあるかもしれませんが、最後のトレーニングも不可欠です。 Huang Wenxin: パブリック クラウドと同様に、クラウド ベンダーも業界のラスト マイルに到達するために多くの ISV を必要とします。さらに、一部の顧客はプライベート展開を必要とするため、このシナリオでは存続できる余地が必要です。 この話題をもう少し広げると、各業界の国内大手企業の方が競争力が強いと考えられるのはなぜでしょうか?前述したように、重要なポイントは、継続的に高品質のデータを生成できる能力です。当初、AI 製品にはデータ フライホイールが必要だと考えていましたが、実際にはこれは簡単に越えられる限界ではありません。スタートアップにとって、高品質なデータを生成するためのプロセスがきちんと整っているかどうか、そして組織体制や支援体制によって、継続的に、積極的に、そしてより高品質なデータが生成されていくかどうかは、実は非常に重要な判断基準の一つだと思います。 T Frontline:例えば、AI画像生成の分野では、Midjourneyは小規模なスタートアップチームのベンチマークとなっており、好評を博しています。一方、デザイン業界の老舗大手Adobeが立ち上げたFireflyも好成績を収めている。この場合、この 2 つの企業のうちどちらが市場でより人気が出ると思いますか? Huang Wenxin:デザイナーは頭の中に独自のアイデアを持っているので、制御性は非常に重要です。制御の面では、Adobe は明らかに業界の要求をよりよく理解しています。 Midjourney の継続的なアップデートと反復は、実際には制御の問題を解決することを目的としています。 現状、本当にデザインに使うのであれば、この2つを組み合わせた方が良いのではないかと思います。ユーザーにとっても、Midjourney には強みがあります。生成されるものは、詳細の点で優れています。デザインの観点から見ると、デザイナーは Midjourney を使用してスケッチ、背景画像、要素画像を生成し、その後 Adobe を使用して修正や処理を行うことを望むかもしれません。一般的に言えば、企業が業界で経験を積めば積むほど、またユーザーが何を求めているかをより深く理解すればするほど、その企業の活力は強くなります。 4. 人気のある AI ネイティブ アプリケーションの作成者はどのような人でしょうか?陳斌:従来の研究開発は、一般的に 2 つの段階に分かれています。1 つ目は、ニーズに基づいてシステム全体を設計し、システムがどのようなアーキテクチャを採用すべきかを検討することです。2 つ目は、前者の設計に基づいて、このロジックをコードで実装する方法を検討することです。 GPT の技術支援により、第 2 フェーズの作業の大部分を GPT で生成することができ、実質的にコード作成の作業負荷の多くを解決します。 この前提の下で、今私がさらに必要としているのは、ビジネスロジックを理解し、アーキテクチャを理解し、システム設計を行うことができる人です。コード作成者にとって、要求されるものはそれほど高くありません。GPT によって提供されるコードが信頼できるものであり、使用できるかどうかを判断する判断力があれば、問題ありません。 実際、プロセスの説明から、GPT アプリケーションで優れた仕事をできる人が誰であるかもわかります。このタイプの人は、ユーザーの真のニーズを非常によく理解できるだけでなく、これらのニーズを GPT で生成できるアプリケーションとしてうまく表現することもできます。彼らは、プロダクト マネージャーとアーキテクトの組み合わせに似ています。 理想的な状況は、要件を簡単に理解でき、業界をよく把握し、GPT とうまく会話できる非常に優れたアーキテクトです。適切な制約を追加し、大きな問題を小さな問題に変換し、小さな問題を非常に明確なロジックに分解して、GPT がコードを生成できるようにします。ほとんどの問題は、このようなアーキテクトと 2 ~ 3 人の R&D 担当者によって解決できます。 黄文鑫:どんな製品でも成功するにはユーザーの悩みを理解することが必要であり、これは AI 時代でも例外ではありません。市場に出回っている多くの AI アプリケーションを見ると、見た目はかっこいいのですが、実際にはユーザーはそれを使用することに不安を感じており、使いやすいものではありません。したがって、AI アプリケーションを開発する際には、ユーザーの悩みを理解するだけでなく、その悩みを真に解決する必要があります。 私たちは現在 AI アプリケーションを開発していますが、製品マネージャーたちに、説教できる能力が必要なのではないかとよく言っています。なぜなら、今日多くの人にとって、AI はまだ検索機能に限定されており、この境界を突破できていないからです。実際、その能力はこれをはるかに超えており、説教を通じて人々が認識を突破するのを助けます。 もう一つ、考えるべき点があります。つまり、AIが人間に取って代わるのではないかというある種の偏見があるかもしれないので、この抵抗や反抗的な心理を打ち破るためには、温かみのあるAI製品を作る必要があるのです。プログラマーの考え方にとらわれすぎてはいけません。人間の性質、国のコンプライアンス要件、そして人々の関係性を理解する必要があります。必要なのは、冷たい製品を作ることではなく、AIを仕事や生活に正しく取り入れ、誰もがAIをより受け入れやすくすることです。これは、AIアプリケーションに取り組む人々が考慮すべきことでもあると思います。 5. 人気の AI 製品が WeChat に登場してくるのはいつでしょうか?T Frontline: 過去 1 年間で、驚くべき AI アプリケーションが数多く登場しましたが、ビッグ モデルの時代におけるスーパー アプリケーションと言えるものは 1 つもありません。このようなスーパーアプリはどのくらい遠いのでしょうか? ChatGPT が AI に iPhone の瞬間をもたらすなら、AI スーパー アプリに「WeChat」の瞬間をもたらす力は何でしょうか? Huang Wenxin: 実のところ、私にとって ChatGPT はすでに素晴らしいアプリケーションです。ユーザーベース、使用シナリオ、または現在開始されている GPT のいずれにおいても、これらは実際にはスーパー アプリケーション、いわゆる SuperApp の初期形式を備えています。実際、全体的な増加は非常に誇張されており、恐ろしいことがわかります。現在、プロンプトにはセキュリティ上の問題がいくつかありますが、それがプロンプトに対する皆の熱意を妨げるものではありません。 Midjourney のような製品は、一時的な目新しさと興奮をもたらすだけです。娯楽ツールとして捉えても、一日中没頭することはできないし、しばらくすると飽きてしまいます。結局、仕事や生活に戻るには、ChatGPT のようなツールを使用する必要があるかもしれません。 Chen Bin: スーパーアプリをどう定義するかによります。中国のWeChatや米国のFacebookのようなアプリを人々が毎日頻繁に使用する場合、GPTは登場するとすぐにGoogleのような検索エンジンに取って代わる傾向があります。 AI時代には、WeChat、Facebook、WhatsAppのようなスーパーアプリケーションは存在しないと思います。代わりに、それらは多くのインテリジェントエンティティまたはインテリジェントロボットに統合され、空を飛び、地面を走り、生産ラインで走り、家事を手伝い、コードを書くのを手伝います...最終的には、GPTがどこにでもあると感じるでしょう。純粋なインターネット製品の観点から言えば、ChatGPT 自体がスーパー アプリケーションであり、これより速くユーザーを引き付けるアプリケーションは他にないという Huang 氏の意見にも私も同意します。 黄文鑫:陳教授がおっしゃったように、AI はさまざまな分野でより有効な役割を果たします。実際、現在実行できるシナリオの多くは、ユーザーの問題点に対処するためにすでに実行されています。生成AIの開発後、AIを使用してプロセスを再形成および再構築し、効率を向上できるかどうかを検討しています。厳密に言えば、これは実際には元のアプリケーションを新しいアプリケーションに置き換える方法です。 AI により、自分自身の問題や他人の問題を解決するために考案、設計したアプリケーションをより迅速に作成できるようになります。 たとえば、人事担当者は毎日レポートを処理するのに苦労しています。以前は、コードを書けなかったため、ステップ 1 で使用する関数、ステップ 2 で使用する関数、ステップ 3 で使用する関数をテキストでしか伝えることができませんでした。現在、彼は ChatGPT を使用して、JS または VBScript を通じて同様の機能を持つスクリプトを自動的に生成し、そのスクリプトを他のユーザーと共有することもできます。この観点から、このHRは独自のアプリケーションを開発する能力も持っています。しかし、ヒットすると思いますか?それ自体は高頻度ヒットであるGPTを使用しますが、よりきめ細かくパーソナライズされたペインポイントを解決し、個人によって解決されます。これは実は AI 時代においてはもっとエキサイティングなことですが、あまり商業的なアイデアではありません。 6. 結びの言葉1年以上にわたる急速な進歩を経て、2024年を迎えた現在でも、私たちは生成型AIに対して大きな期待と好奇心を抱いています。 しばらくの間、従来の意味での「スーパーアプリケーション」を見るのは難しいかもしれませんが、人工知能は必然的にさまざまな産業や生産リンクにさらに広く統合されるでしょう。この傾向により、AI は単なるツールではなく、デジタルおよびクリエイティブ分野における私たちの存在の仕方を変革する力にもなります。 同時に、セキュリティ、コンプライアンス、著作権、倫理の観点から見た生成 AI の複雑さがさらに明らかになり、そのバランスをどう取るかが、その発展の道のりにおける長期的な課題となるでしょう。 この記事が刺激的だと思ったり、生成 AI の実用化に関する独自の見解をお持ちの場合は、ぜひコメント セクションで共有してください。 |
[[252330]]人工知能の急速な発展は、新しい小売業者に力を与え、小売業界の「人、商品、場所」...
以下の記事では、主にハッカーがGSMアルゴリズムをクラックし、携帯電話ユーザーが盗聴の危険にさらされ...
高齢者介護サービスも人工知能を積極的に取り入れる必要がある。両者を統合し、相互に補強し、高齢者の多様...
一般的な自然言語処理システムでは、単語のエンコードは任意であるため、個々の記号間の可能な関係に関する...
たった今、百度が公式発表しました。自動運転車は2018年に量産される予定です。 Subversion...
今日、ビジネスリーダーは急速に進化するデジタル世界における多数のデータセキュリティの脅威に対処してい...
AI トレンドがあらゆるところで広がる 2021 年を迎える準備はできていますか? ここでは、202...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
2022年11月30日のChatGPTのリリース以来、OpenAIが新しい機能をリリースするたびに...
2024年にAI業界はどのように進化するのでしょうか? OpenAIのグレッグ・ブロックマン会長は...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...