生成 AI に新しい設計アプローチが必要なのはなぜですか?

生成 AI に新しい設計アプローチが必要なのはなぜですか?

生成AIについて議論するインタビューでは、懸念から驚きまでさまざまな反応がありました。そしてベンチャーキャピタリスト、特に私のように会社設立当初から創業者と仕事をしている人たちは、私たちがテクノロジーのライフサイクルの「始まり」にいることを常に強調します。しかし、昨年 11 月の ChatGPT のリリースからマルチモーダル モデルのデビューまで、過去 1 年間の AI 技術の急速な発展により、この初期段階は過ぎ去りつつあるようです。特に不確実性と達成されていない目標に直面している場合、その可能性は刺激的であると同時に漠然とした不安感も抱かせます。

現在、最も人気のある生成 AI アプリケーションのほとんどは、オープンエンドのダイアログ ボックスに依存していますが、このようなおしゃべりなやり取りでは、基盤となるシステムの限界や可能性についてほとんど何もわかりません。ユーザーは意図を表現し、関連するすべてのコンテキストを記憶し、AI によって提供された回答を評価する必要があります。しかし、有名なドイツの工業デザイナー、ディーター・ラムスの言葉を借りれば、指が手袋の中に簡単に滑り込むように、優れたデザインは製品の正しい目的を明らかにするものでなければならない、ということです。人間中心のアプローチを採用することで、デザイナーは直感的なインターフェースを概説し、使いやすさを向上させ、信頼を育み、ユーザーが現在のように目的もなくさまようのではなく、モデルの広大な内部の仕組みを意識的にナビゲートできるようにすることができます。

生成型 AI により、コンピューターは言語、コード、画像、音声の理解と生成、知識の学習と表現、さらには論理的推論の実行など、これまでにない一連の機能を獲得しました。これらの機能を組み合わせることで、時間の経過とともにすべてがより効率的になることを約束する一連のイノベーションの構成要素が形成されます。しかし、AI を私たちの生活や職業上の追求に取り入れるとなると、これらはまだ単なる構成要素であり、完成品ではありません。思慮深いデザインと製品思考をテーブルに持ち込むことは、AI の力を活用し、それが私たちの価値観や目標と一致するようにするための鍵となります。

スティーブ・ジョブズはかつて、コンピューターを「心のための自転車」、つまり人間の知能を増強し拡張できるツールに例えた。生成 AI が自転車を超音速ジェット機に変える。最新の AI モデルの波は、かつては人間に特有であると考えられていた複雑な創造力を模倣する能力を加速させ、私たち自身とコンピューターとの根本的な関係を再考させています。言い換えれば、今や重要な問題は「AI は会話を完結させるのに役立つか?」ではなく、「この新興知能と協力し、AI が私の考えを書いたり、読んだり、聞いたり、話したり、理解したりできるようにするためにはどうすればよいか?」です。

この疑問に答えるために、Designer Fund はサンフランシスコで 2 回の炉辺談話会を開催し、AI とデザインの分野の 50 人以上の創業者と発明家を集めました。 1 つ目は、Figma のプロダクト デザイン担当副社長 Noah Levin 氏と Designer Fund の共同設立者 Enrique Allen 氏との会話です。2 つ目は、私と Databricks のプロダクト マネジメント担当副社長 Nadim Hossain 氏とのディスカッションです。このイベントでは 4 つの主要トピックに焦点を当てており、以下で 1 つずつ紹介します。

1. 天井を上げながら敷居を下げる

Midjourney、DALL-E 3、GPT-4 などのさまざまな生成 AI ツールは、多くのデザイナーに「このテクノロジーは私のキャリアにとって何を意味するのか」を考えるよう促してきました。議論を文脈に沿って理解するために、Noah は興味深い比喩を提示しています。一方で、AI は参入障壁を下げ、専門家以外の人でも簡単に設計に参加できるようにします。簡単なプロンプトを使用すると、誰でも自分のアイデアをチームで再利用できる視覚的なプロトタイプに変換できます。完璧からは程遠いものの、これらの AI モデルは最も困難な初期タスクを解決し、一般の人々が創造プロセスで直面する最大の障害をうまく克服します。

同時に、AIは創造の天井、つまり上限も引き上げ、専門家が実現できる範囲を拡大しました。ボックスの移動、角の半径の調整、背景の削除などの日常的で反復的なタスクを自動化することで、専門家はビジョンと戦略の設定、システムとフレームワークの構想、より優れたエンドツーエンドのエクスペリエンスの構築など、より高度な課題に集中できるようになります。 AI は、デザイナーの焦点を狭い範囲での実行からよりマクロな概念構築へと移行させることで、実務者が作業を人間中心のデザイン ソリューションのレベルに引き上げるのに役立ちます。そして、これこそがデザイン創造の真の核心であり、そもそも多くの人がこの業界に惹かれる理由なのです。

2. 要素からパターンへ

デザイナーは、ボタン、テキスト フィールド、ドロップダウン メニューなどの独立した要素に重点を置くことがよくあります。これは、これらの要素が作業で実際に操作できる要素だからです。対照的に、モデルはユーザーが製品やサービスを通じて辿る完全な旅であり、各ステップ間のつながりや遷移を考慮に入れます。ナビゲーション システム、検索インタラクション、オンボーディング チュートリアルはすべて良い例です。各システムでは、これらの個別の要素を直感的なパターンに構成し、ユーザーの意図、ニーズ、目標に合わせるように努める必要があります。

AI は、包括的でユーザー中心の設計アプローチへの移行をスムーズにするのに役立ちます。既存のデザイン システムによってトレーニングされた AI モデルがあれば、デザイナーは自分のアイデアを概念レベルとパターン レベルで記述でき、要素を組み合わせるなどの面倒で具体的な作業をモデルが処理してくれると想像してみてください。これは、AIがいかにして真にデザインを普及させ、レベルを向上させることができるかを示す典型的な例であり、デザイナーの機能的位置づけやデザイン業務の実施プロセスに変化をもたらすことが期待されます。

3. テキストボックスを超えて

チャット インターフェースは、AI とのやり取りのための実用的なエントリ ポイントを提供します。日常会話の容易さと即時性を実現しながら、モデル内の一般的なエラーを迅速に解決します。大規模言語モデル (LLM) 上に会話型ユーザー インターフェイスを構築することも簡単です。モデルの組み込みテキスト補完インターフェイスを拡張するだけです。

しかし、チャットでは迅速かつ自由なやり取りが可能ですが、空白のテキスト ボックスを直接提供すると、多くのユーザーが困惑してしまいます。まず、効果的な人間とコンピュータのインタラクション オプションが提供されていないため、ユーザーは自分の意図をどのように表現すればよいかを理解し、望ましい出力を生成するためにモデルをより適切に誘導する方法を決定することが難しいことがよくあります。さらに重要なのは、手がかりとなる単語は間接的かつ不透明な方法でしかモデルに影響を与えることができないということです。これは、多数のバイナリ「スイッチ」を備えた複雑な SF マシンを操作するのと似ており、全体的な体験は試行錯誤と変わりません。対照的に、モデルの応答に実際に影響を与える主要な要素 (重み、アクティベーション、温度など) は、ユーザーから完全に隠されています。

初期のソフトウェア インターフェイスは、新しいコンピューティング機能を最も直接的な方法で提示する傾向がありました。しかし、時間が経つにつれて、インターフェース デザインは、人間の心とナビゲーション空間とのより良い共鳴を重視して、機能性を自らに取り込むようになりました。たとえば、最初のパーソナル コンピュータでは、マイクロサーバーとメモリの基礎設計がコマンド ライン インターフェイスを通じてユーザーの目の前に直接表示されましたが、その後の開発では、Windows と MacOS は、デスクトップ、フォルダー、ゴミ箱の機能を活用して、よりユーザー フレンドリな抽象要素を導入し、マシンが真に人間の習慣に役立つようにしました。

テキスト ボックスはオリジナルのパンチ カードに比べて大幅に改善されていますが、コマンド ラインと同様に、現代のグラフィカル ユーザーからは依然として原始的なものと見なされています。コマンドラインは技術愛好家や早期導入者には最適ですが、一般の人には適していません。 AI 技術の発展、特にマルチモーダル化への発展に伴い、より直感的で多次元的なインターフェース設計が必要になることは間違いありません。それに応じて、大規模モデルと直接通信する現在の方法は単純に見えますが、実際には負担が大きくなります。

将来の AI インターフェースは、私たちがまだ想像できない方法で人間と連携するようになります。チャットボックスも情報を得るためのポータルではありますが、考える手助けにはなりません。モデルの潜在空間を通じてユーザーをガイドし、さまざまな概念間の特定の暗黙的なつながりを強調し、単にコマンドを実行するのではなく、積極的にアイデア創出に取り組むインターフェースを想像することができます。さらに、スライダー、ダッシュボード、フィルターなどのツールがインターフェースに提供され、追加のニュアンスが追加され、ユーザーはモデル出力に影響するパラメータにアクセスして操作できるようになります。

AI機能がますますスムーズになるにつれ、将来的には一般ユーザーにとってより実用的で楽しい体験がもたらされると信じています。理想的な製品体験では、AI が全面的にシームレスに統合され、AI を使用しているという感覚が完全になくなるでしょう。

4. AIの「ラストマイル」問題を解決する

生成 AI モデルの機能は素晴らしいものですが、その信頼性はほとんどの現実世界のアプリケーションにとってまだ十分とは言えません。このギャップは、メーカーがデモ版をリリースしたときの驚くべきパフォーマンスと、実際の展開時の「ラストマイル」問題に反映されることが多いです。自動運転車が混雑した道路でミスを犯すことが多いのと同様に、AI モデルも不一致、偏り、出力の幻覚などの傾向に直面します。クリエイティブな環境では、これらの機能は無害であるか、歓迎される場合もあります。しかし、ビジネス、金融、医療、その他の重要なユースケースでは、実際の精度が 99.9% を下回ると、モデルは役に立たなくなります。

人間と AI の連携システムの革新的な設計は、この最後の段階でのリスク管理に役立つ可能性があります。テクノロジーが成熟するにつれて、迅速な単語確認(つまり、生成されたコンテンツが正確かどうかをユーザーに確認させること)と不確実性評価(特定の出力においてモデルによって与えられる信頼度レベル)が共同で人間による監督のサポートをもたらすことになります。さらに、説明可能性機能により、AI の「ブラック ボックス」の可視性がさらに高まります。たとえば、ヒート マップの視覚化を使用して、外部ソースへの参照を含むモデルの出力に最も大きな影響を与える入力を特定し、モデルが考えた代替の回答を表示します。これにより、ユーザーはインターフェイスでプロンプトワードとパラメータを調整し、その効果をリアルタイムで観察して、モデルワークフローの透明性をさらに向上させることができます。

このような設計要素は連携して「信頼サイクル」を最適化します。信頼サイクルとは、ユーザーが AI システムを完全に信頼し、重要な複雑なタスクを完了するために AI システムに頼る時間の累積期間です。

行動しながら改善する

平面印刷から 3D 印刷まで、デザインは常にテクノロジーと歩調を合わせてきました。これまでの画期的な進歩と同様に、AI はデザイナーに取って代わるものではありません。むしろ、デザイン コンテンツを大幅に拡張して再形成するだけでなく、誰がデザインをするのか、どのようにデザインをするのかという根本的なロジックにも影響を与えます。この美しい未来を実現するためには、人間と AI のシステムにおいて、これまでにない革新的な探求をさらに進めなければなりません。

大企業やスタートアップ企業が現在の AI の波から利益を得ることができるかどうかについては、業界で多くの議論が行われています。大企業の最大の強みは、長年にわたって蓄積されたデータ、事業の分散、強力な財務準備にあり、一方、スタートアップ企業はスピード、集中力、レガシーの技術的負債の軽減により、破壊的な AI ネイティブ製品を生み出すことができます。

マイナス要因はさておき、AI スタートアップを目指す人への私のアドバイスはシンプルです。とにかくやってみること。事前にどれだけ考え、計画を立てても、真のプロトタイピングのように問題を明らかにし、インスピレーションを得ることはできません。実用的なソリューションをより速く提供し、反復できる者が、新しい時代の競争に勝つでしょう。私がよく言うように、正しいアプローチは「実行して改善する」ことです。まず正しい質問をし、それから最も難しい質問に最初に答えます。未来は常に、いわゆる「絶対確実な」計算によってではなく、行動する人々によって作られるのです。

<<: 

>>:  海洋工学における生成AI:独自のデータセットが不十分なため、実用化が制限されている

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

あらゆる場所でのAI実現へ: 人工知能分野におけるインテルの躍進

[51CTO.comからのオリジナル記事]クラウドコンピューティング、ビッグデータ、5G、モノのイン...

...

...

AI後の生活

人工知能は人類史上最も革命的な技術の一つとなるでしょう。 AI テクノロジーが発展するにつれて、どの...

【ディープラーニング連載】畳み込みニューラルネットワークの徹底解説(第2回)~畳み込みニューラルネットワークを手書きで書いてみる~

前回の記事では、畳み込みニューラルネットワークの基本原理について、いくつかの基本層の定義、動作ルール...

人工知能の時代において、従来のメディアはどのようにしてニュースの取り組みを守ることができるのでしょうか?

海外メディアの報道によると、人工知能によるニュースのパーソナライゼーションの時代では、従来の報道機関...

Ctrip列車チケットSMSリコールアルゴリズムの最適化の実践

著者についてCtrip アルゴリズムの専門家であるライアンは、パーソナライズされた推奨事項、スマート...

南開大学、山東大学、北京理工大学のチームがtrRosettaRNAを開発: Transformerネットワークを使用してRNAの3D構造を自動的に予測

RNA 3D 構造予測は長年の課題です。タンパク質構造予測における最近の進歩に触発され、南開大学、山...

医療用ロボット:世界第2位のロボットの現状と今後の応用展望

医療用ロボットという用語は、監督なしで事前にプログラムされたタスクを自律的に実行する機械のイメージを...

調査結果:人工知能はクリエイターにより多くのファンと収入をもたらす可能性がある

7月18日、DescriptとIpsosがポッドキャストや動画の制作者1,004人を対象に実施した調...

...

Ant Marketingの推奨シナリオにおける因果修正法

1. 因果修正の背景1. 逸脱の発生推奨システムは、収集されたデータに基づいて推奨モデルをトレーニン...

人工知能技術がホームセキュリティ市場の急速な発展を促進

[[240109]]ホームセキュリティ市場はAIを活用してどのように安全を確保しているのか家庭のセキ...

...