デザイナーのための人工知能ガイド: 基本概念

デザイナーのための人工知能ガイド: 基本概念

Google が開発した AlphaGo が囲碁の名人に勝利したとき、シンシナティ大学の Psibernetix が戦闘機パイロットに勝利したとき、インターネット時代がインテリジェント時代になったとき、時代が移行し始めたとき、時代のペースに追いつけない者は、やがて時代によって淘汰されるでしょう。では、デザインと人工知能の収束点は何でしょうか? デザイナー、インタラクション、製品開発者として、私たちは人工知能をどのように理解すればよいのでしょうか? このシリーズをぜひフォローして、デザインと人工知能について一緒に探究しましょう!

序文

近年、インターネット従事者が最もよく耳にする言葉は、インテリジェンス、アルゴリズム、AI です。膨大なデータストレージとコンピューティング能力の発展に伴い、人工知能 (AI) は基盤となる能力となり、構造化データコンピューティング、自然言語処理、コンピュータービジョンなどの分野で広く使用されています。このシリーズでは、人工知能(AI)の基本的な機能とデザイン分野のインテリジェンスに焦点を当てます。デザイナーやプロダクトマネージャーの場合は、AIを始めるための基礎知識、人工知能がデザインやインタラクションに与える影響、インテリジェントデザインの「できること」と「できないこと」を把握できます。アルゴリズムやテクノロジーを学んでいる学生の場合は、このシリーズでは最先端のアルゴリズムの共有は行いませんが、デザイン分野におけるインテリジェンスに関する私たちの考えを知ることができます。

AI x デザイン 人工デザイン知能

人工知能(AI)は、基本的な能力として、従来のデザイナーの仕事を置き換えるものではなく、コンピューターの計算力(コンピューティング能力)とルールを通じてデザイン能力と効率を改善・強化し、機械にデザインを学習させることで機械をデザイナーのアシスタントにすることを目指しています。

デザインインテリジェンスの躍進は、実はAIアルゴリズムフレームワーク(ディープラーニングモデル)の導入と普及による恩恵を受けています。近年、デザインインテリジェンスは主にデザインセマンティック抽出、スタイル認識、スタイル転送、デザイン評価と推奨、デザイン敵対的生成に使用されています。

たとえば、Xiaomi CC9 携帯電話がリリースされたとき、「マジック スカイ チェンジ」と呼ばれる機能が導入されました。ユーザーは空を背景に写真を撮影し、晴れ、曇り、夜など、さまざまなスタイルの空に変えることができます。

インタラクティブなデザインプレゼンテーションモデルの観点から見ると、「空を変える」とは、ユーザー側で「デザインスタイル」をワンクリックで切り替えるだけです。しかし、実装モデルの観点から見ると、まずは画像の意味的セグメンテーションを実装して、機械が空が何であるかを区別できるようにする必要があります。次に、さまざまなスタイルの大量の画像データを入力することで、機械はスタイルが何であるかを学習できます。その過程で、#畳み込みニューラルネットワークCNN#と#注意メカニズムAttention Networks#を組み合わせて、スタイル分類の主要な特徴を抽出するなど、さまざまなアルゴリズムモデルが適用されます。最後に、#生成敵対ネットワークGAN#の生成モデルと識別モデルを使用して、最適なターゲットスタイルの画像をトレーニングして出力し、ユーザーの「魔法の空を変える」操作を完了します。

デザインインテリジェンスの典型的な例はたくさんあります。インタラクティブデザイナーとして、上記のアルゴリズムモデルのフレームワークと実装の詳細は私たちの焦点では​​ないかもしれません。私たちが注意を払う必要があるのは、AIアルゴリズムの機能と限界であり、それによってAIが製品のインタラクションとユーザーの行動にどのように影響するかを考えることができます。アルゴリズムの機能と限界を習得したい場合は、次の基本的な入門概念を必ず理解してください。

アルゴリズムの美しさ

1. 「アルゴリズムとは何か? どのように使うのか?」

平たく言えば、アルゴリズムは実際には数式であり、有限かつ明確なソリューションまたは問題解決手順のセットです。アルゴリズムの場合、入力 A と出力 B は固定されている必要があり、アルゴリズムは中間出力ロジックのみを担当します。たとえば、加算、減算、乗算、除算を計算するために、教師は乗算の公式をまとめました。別の例として、ユーザーが商品をより早く受け取れるようにするために、配送システムは経路計画の最適化アルゴリズムを開発しました。

シナリオ アプリケーションでは、アルゴリズムは特定のビジネス シナリオの問題点に基づいており、特定の種類のビジネス問題を解決するために抽象化されている必要があります。ビジネス シナリオがなければ、アルゴリズムは意味を失います。ビジネス上の問題を解決する際には、ソリューションの正確性と完全性を確保する必要があります。アルゴリズム エンジニアがアルゴリズム モデルを提供するときに通常使用する 2 つの主要な評価指標は、正確性と再現率です。簡単に言えば、精度は、オブジェクトまたはイベントを予測するときにアルゴリズム モデルによって行われた正確な予測の割合を測定し、再現率は、予測されるオブジェクトまたはイベントの山の中でアルゴリズム モデルによって予測できるオブジェクトまたはイベントの割合を測定します。精度優先はより高い精度を意味し、再現優先はより高い完全性を意味します。正確性と完全性を同時に実現できるアルゴリズムはありません。ビジネス シナリオと優先順位に基づいて、この 2 つを比較検討するしかありません。ただし、ほとんどの e コマース推奨シナリオでは、精度に重点が置かれています。

2. 「アルゴリズムには監督機能がありますか?」

先ほど、アルゴリズムとは合意された入力と出力に基づく一連のソリューションであると述べました。論理ブラックボックスのトレーニングと学習方法の観点から、教師あり学習と教師なし学習に分けることができます。

教師あり学習とは、何が A で何が B であるかを事前に機械と合意し、機械を私たちの基準に従ってトレーニングして学習させることを意味します。教師あり学習では、アルゴリズム モデルの入力を事前に手動で処理、つまりデータのラベル付けを行う必要があります。典型的な教師あり学習法には、回帰と分類が含まれます。基礎数学の回帰方程式は、実際には教師あり学習の一種です。

名前が示すように、教師なし学習では標準やルールを定義する必要はなく、アルゴリズムが特徴抽出を通じて自動的にトレーニングと学習を実行します。教師なし学習は、通常、クラスタリング アルゴリズムによって実現されます。

3. まとめ

アルゴリズムとは、合意された入力と出力を持つ問題解決の一連の手順です。機械が判断を学習できるようにするには、段階的に教える (教師あり) か、機械が自ら学習するようにする (教師なし) ことができます。

機械学習とディープラーニング

アルゴリズムが問題に対する解決策であるならば、機械学習とディープラーニングは、異なる段階における問題解決のアイデアや構造に似ています。

1. 機械学習とは何ですか?

機械学習とは、簡単に言えば、機械がタスクをうまく実行できるように継続的に試行してフィードバックを提供することです。もし機械が大学入試を受け、1位を取ることが目標だとしたら、機械学習の考え方によれば、機械は歴史のテスト問題に全て答え、テスト問題と答えの関連性を学習し、その後も繰り返し質問に答え続けることで精度を高め、最終的に試験を受けて1位を取ることになります。

上記の例では、実際にはタスク T、パフォーマンス測定 P、および経験 E といういくつかの重要な要素が関係しています。タスク T は、機械学習またはアルゴリズムの最終目標であり、試験で 1 位を獲得することです。パフォーマンス メトリック P は、データ構造またはアルゴリズム ロジックを最適化するためのベンチマークです。適切なパフォーマンス メトリックを定義することは、機械学習の効率と改善にとって非常に重要です。最後の経験 E は、実際には履歴データまたは効果データ、つまり、過去のテスト問題と誤答されたテスト問題を指します。

電子商取引の分野では、古典的な人と商品のマッチング推奨アルゴリズムは、上記の定義に従って、さまざまなユーザーにパーソナライズされた製品(T)をより正確に推奨し、過去の推奨データとユーザーの行動データ(E)を通じて推奨結果(P)の精度を継続的に向上させる問題解決プロセスとして説明できます。

概要:機械学習は履歴データに基づいて、モデルの学習とトレーニングを通じて予測データを出力し、その後、フィードバック データに基づいて予測モデルを継続的に最適化および改善します。

2. ディープラーニングと機械学習の違いは何ですか?

例に戻りましょう。大学入試では客観的な質問だけでなく、主観的な質問も出題されます。今回、機械を使ってエッセイを採点すると、従来の機械学習では人間の思考や文章の論理に従って分析することが難しくなります。ディープラーニングの登場により、機械は「人間のように考える」ことができるようになりました。バイオニックニューラルネットワークの構築により、機械は複雑なもの同士のつながりを学習して理解し、外界を認識して自身のネットワーク構造を最適化できるようになります。

つまり、ディープラーニングモデルは実際には機械学習の一種ですが、学習方法は、人間の脳のニューラルネットワーク構造に似た多層知覚構造を構築し、低次元の特徴を組み合わせてベクトル化することでサンプルデータの特徴をマイニングし、データと結果の相関関係を確立するように変化しました。

ディープラーニングとニューラルネットワークをより深く理解するには、まず人間の脳が情報(データ)をどのように認識し理解するかを理解する必要があります。中央のネットワーク図は、人間の脳の構造を抽象的に表現したものです。

各円はニューロンを表し、各矢印はシナプスのグループを表します。情報は左側の入力層から入り、いくつかの隠れ層と異なる重みを持つシナプスを伝わり、右側の出力層から出力されます。異なる重みを持つシナプスは、異なる優先度の情報をフィルタリングまたは強化し、それによって人間の行動を導きます。

ディープラーニングモデルは、人間の脳のニューラルネットワーク構造に基づいて、まず埋め込みベクトル化によって高次元のスパース特徴を低次元の密な特徴に変換し、次に隠れ層によって重要な特徴を保持し、次に出力層の損失関数 Loss を使用してトレーニングエラーが出力要件を満たしているかどうかを判断し、最後にモデル出力を完成させます。

機械学習と比較すると、ディープラーニングの最大の進歩は、特徴ベクトル化のプロセスであるデータ特徴マイニングにあります。そのため、ディープラーニングフレームワークは、複雑な非構造化データのシナリオで一般的に使用されます。たとえば、音声認識 ASR、テキスト処理 NLP、画像認識 CV などが典型的なアプリケーションシナリオです。

概要:機械学習は人工知能を実現するための方法であり、ディープラーニングは機械学習のための技術です。

製品の相互作用とアルゴリズムの境界

アルゴリズムであれ機械学習であれ、それらは実際には問題を解決する方法です。アルゴリズムによる問題解決の有効性は、初期段階でのビジネス上の問題の抽象化と変換に大きく依存します。

したがって、製品やインタラクションの学生にとって重要なのは、アルゴリズム技術の機能の限界を理解し、ビジネスシナリオとニーズの分析に基づいてビジネスの問題をアルゴリズムの問​​題に変換し、ビジネス目標を達成するための最も適切で効率的なアルゴリズムフレームワークを見つけることです。同時に、製品のインタラクション設計プロセスでは、パフォーマンス モデルがユーザーの心理モデルに近くなるように、人間とコンピューターのインタラクションの教育コストを可能な限り削減する必要があります。

要約する

アルゴリズムとは、指定された入力と出力を持つ問題解決の一連の手順です。アルゴリズム フレームワークには、機械学習とディープラーニングの 2 種類があります。さまざまなアルゴリズム モデルについて、製品インタラクション担当者は、アルゴリズムがどのような問題を解決できるか、また、より人間味のあるインタラクション ロジックを使用して製品インテリジェンスを実現し、アルゴリズムの適用コストを削減する方法に関心を持っています。

<<:  役立つ情報 | 115 行のコードで数独パーサーを作成する方法を段階的に説明します。

>>:  モバイルビデオがグローバル化する中、テンセントクラウドは小英科技のグローバル市場拡大を支援

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

大規模製造企業におけるインテリジェントな意思決定シナリオの分析

1. 製造業の発展の現状まず、製造業企業の発展状況について紹介します。 1. 企業経営は直線的な発展...

...

あなたの声は私のパスです

最近私の声が盗まれたことで、AI がすでに社会に混乱を引き起こす能力を持っていることが私には明らかに...

世界では毎年24の言語が消滅している。AIは絶滅危惧言語の新たな救世主となった

昨年、国連は2019年を「国際先住民族言語年」と宣言し、今、このお祭りがますます近づいてきています。...

人工知能と伝統的な中国医学が出会うと、青い「箱」は「見て、嗅いで、聞いて、感じることができる」

[[238055]] [[238056]]患者は青い「ボックス」に手首を入れ、赤外線スキャン後に脈...

AIoT = AI + IoT、舞台裏で誰が誰をもっと必要としているのでしょうか?

AIoTとは何でしょうか?多くの人にとって「AI+IoT」が答えになると信じています。昨年初めから...

従来のセキュリティ手法を覆し、AIがWebセキュリティを再定義

Amazonが2006年にEC2サービスをリリースしてから11年が経ちました。この 11 年間で、A...

顔検出を実装するための50行のPythonコード

現在、顔認識技術は広く利用されており、決済や本人認証、美容カメラなどに利用されています。 iPhon...

25年間の素晴らしい実績! MITの科学者はコンピューターに創造性を与え、ロボットの形状を自動設計させる

階段を登れるロボットが必要になったとしたら、このロボットはどのような形状であるべきでしょうか?人間の...

2021 年の人工知能データ収集および注釈業界の 4 つの主要トレンド予測

人工知能データ収集およびラベリングのリーディングカンパニーであるYunce Dataは最近、「202...

ディープラーニングのためのヘテロジニアス アクセラレーション テクノロジー (パート 2): カタツムリの殻の中に道場を構築する

1. 概要記事「ディープラーニング向けヘテロジニアスアクセラレーションテクノロジー(パート1)」で説...

...

SaaS アプリケーションで AI スノーボールはどのように大きくなるのでしょうか?

Shopify の不正防止機械学習から Salesforce の Einstein まで、過去数年...

...

JD.comのインテリジェントな顧客サービス、JD.comの11.11は再び「高い感情的知性」を実証

チャットボックスを閉じた後、Li Li はカスタマーサービスとの先ほどの会話を思い出しました。製品紹...