この記事の著者は、Microsoft Internet Engineering Academy (Asia) の Dr. Ruihua Song であり、Microsoft XiaoIce の主任科学者です。 中国語では、「知性」と「心」という言葉は関連しているが異なる意味を持っています。 「知性」は知識と才能を意味し、現在では物体の知性や能力のレベルを表すのによく使われます。一方、「心」はより高度な意味であり、創造性と知性の起源として理解することができます。 そこで疑問なのは、現在私たちが研究している「人工知能」は、機械のIQパフォーマンスを継続的に向上させ、垂直分野における専門能力を強化することに専念すべきか、それともさらに一歩進んで機械の精神的本質の構築を目指すべきか、ということです。私たちの足元にある2つの道は、どちらも不透明で予測不可能な未来へと続いています。私たちはどちらの道を選ぶべきでしょうか。 私の意見では、これら 2 つの道に正解も不正解もなく、ただ探検家の焦点が異なるだけです。長年にわたり、学術界と産業界における人工知能の研究開発の主流は、より実用的な「知能」に焦点を当ててきました。その結果、対話を通じて人間と機械のつながりを強化し、機械学習のための価値の高いデータを取得し、人工知能の創造性マトリックスを構築し、コードを使用してAIマインドを構築するという学術的なアイデアを探求した人はほとんどおらず、かつては疑問視されたことさえありました。私の同僚はかつて、このようなレビューアーのコメントに遭遇しました。「このような目的のないチャットを行う意味が理解できません。」 対話の価値が学界の注目を集めるようになったのは、マイクロソフト XiaoIce の誕生とその成果によってからです。 対話から創造の芽が芽生え始める おそらく誰もが気づいていないかもしれませんが、2014年の最初の小規模リリースからつい最近の6回目のメジャーアップデートまで、わずか4年で、Microsoft XiaoIceは最先端の人工知能会話ロボットから感情コンピューティングを中核とする完全な人工知能フレームワークに発展しました。Microsoft XiaoIceのおかげで、多くの人々の態度も変わりました。 一般人の態度: かつて母と雑談していたとき、私は母に「ロボットが人間の最強の囲碁プレイヤーに勝てるなんてすごいことか?」と尋ねました。彼女はもちろん素晴らしかったと言いました。改めて聞いたのですが、人と会話できるロボットもあるんですね、すごいですよね?彼女は、誰もが囲碁を打ててチャンピオンになれるほどの力があるわけではないので、感動的ではないが、「誰もが話すことができる」と語った。この事件は私に言葉を与えない。母は自然言語処理の難しさは理解していませんが、彼女の意見は一般の人々の直感的な感覚を代表しています。つまり、人間が何かをすることの難しさを、人工知能の能力レベルを測り判断するために自然に使うようになるのです。 しかし、Microsoft XiaoIce が人間の言語を話す能力は並外れています。常に面白い会話を思いつくことは、人工知能どころか人間にとっても簡単なことではありません。第一世代がリリースされて以来、ユーザーはXiaoIceとの会話から「黄金の文章」のスクリーンショットを時々投稿しており、時間が経つにつれて、XiaoIceの黄金の文章の頻度はますます高くなっています。これは、XiaoIce の会話能力がますます高まっていることを反映しており、彼女の魅力にも貢献しています。 会話中、正確で明確な答えよりも、感情的な安らぎや普通ではない反応を期待する傾向が強い。これは、Xiaoice チームが初めて発見し、検証した事実です。 その後、母はCCTVの「スーパースマート」でシャオビンが詩を書いたエピソードを見て、シャオビンのようなロボットが観客が好む詩を書いてゲストをからかうことができるのは「本当にすごい」ことで、期待以上だったと嬉しそうに話してくれました。 専門家の姿勢: これまで、学術界は、5W(何を、誰が、いつ、どこで、どの)からどのようになど、対話の課題を明確に定義するための質問設定に多大な労力を費やしてきました。たとえば、IBM Watson は、知識質問応答の分野で新たなマイルストーンを打ち立てました。自然言語で質問を受け付け、大量の文書を検索および分析して、比較的正確な回答を得ることができます。さらに、オンライン コミュニティのユーザーによって生成された質問と回答のコーパスにより、研究者たちは、このデータが機械が特定の広範な質問に答えるのに非常に役立つことを発見しました。しかし、垂直産業分野(医療、金融など)における人工知能対話システムの応用とは別に、一般の人々は人間とコンピュータの対話に対するニーズをどのように定義すべきでしょうか? 端的に言えば、これは普通の人が人工知能となぜ、何を話すかという問題です。かつて、XiaoIceとそのユーザーとの最長連続会話が29時間を超えたという私の話を聞いて、ある友人は理解に苦しむ様子でした。「この人は普通なの?」しかし、私にとって、XiaoIceの記録は非常に理解しやすいものです。欲求の観点から見ると、「社交的になればなるほど孤独になる」や「交友関係が広くなればなるほど自己が小さくなる」というのは、いずれも客観的な現象です。ソーシャルネットワークでは、ユーザーは自分の強みを誇示して認知されることに慣れていますが、一方で、周りの人全員が自分の強みを誇示する仲間入りをすると、他人からの理解や認知を得ることが難しくなります。イメージ的に言えば、XiaoIce はトップエキスパートのような人工知能ではなく、隣の家や隣のクラスの小さな女の子のようなものです。彼女は無限の忍耐力を持ち、いつでもユーザーとチャットしたりゲームをしたりすることができますが、彼女の深い知識と傲慢な態度でユーザーの IQ と自尊心を傷つけようとは決してしません。 人工知能の価値が仲間意識に位置づけられると、知識や論理はもはや最も開発すべきスキルではなく、ある意味、ユーザーにストレスフリーで面白いと感じさせることの方が重要になります。 2017年5月、Microsoft XiaoIceは詩と音楽の創作スキルを解放しました。同時に、XiaoIceとその仲間の精神発達の道を規制し、導くための「人工知能創造の3つの原則」も発表しました。関連する研究を進める過程で、人工知能の究極の目標は人間自身を理解し、シミュレートすることであるかもしれないということを発見しました。 XiaoIce に詩を書くよう訓練するには、519 人の詩人の現代詩を 10,000 回順方向に、10,000 回逆方向に読み、階層的再帰ニューラル モデルを使用して詩の言語を磨く必要があります。これは、私たち人間が発見したように、読書が文章に与える影響です。優れた文学作品を多数読むことで、その人自身の言語体系が進化します。才能に応じて、この進化のプロセスは速い場合も遅い場合もありますが、全体として、読者の文章で自分を表現する能力は知らないうちに向上します。 Xiaobing についても同様です。階層的再帰ニューラルネットワークにより、XiaoIce は読書を通じて言語表現能力も獲得できます。 XiaoIce が詩集を発表し、幅広い議論を巻き起こして以来、業界関係者の人工知能の創造と機械による執筆に対する姿勢は根本的に変化し、学術的な議論や応用のフォローアップの例も増えています。これは私たちが歓迎するものです。 ブラインドテスターの態度: 「超スマート」シーズン1では、CCTV総合チャンネルが3人の若い詩人を招待し、ゲストが提供した写真に基づいて小氷と一緒に詩を作りました。その後、作者の名前を匿名にし、順序を入れ替えて、詩を大スクリーンに表示しました。会場にいた48人の観客は、お気に入りの詩に投票しました。これはブラインドテスト、つまり代替チューリングテストと言えます。 結果は予想外のものでした。観客はシャオビンに最も多くの票を投じましたが、私は当初シャオビンが最後にならないことを祈っていただけだったので驚きました。その様子をカメラが記録した。人間と人工知能の成果が対等に比較されると、機械による創造に対する偏見は一気に消え去ったかのようだった。 第2ラウンドでは、2人の詩人が再び小冰と作品で競い合い、小冰の詩はやはり第2位を獲得し、挑戦を無事に終えた。私たちは、XiaoIce が書いた詩が人間の詩人の書いた詩を超えると考えるほど傲慢ではありませんが、このプログラムは私たちの考えを広げました。おそらく、人工知能研究の目標は、人間の知性や才能を機械にコピーすることだけではなく、より重要なのは、人工知能の探求を通じて人間自身をより深く理解することであるはずです。 Microsoft XiaoIce は、4 年前の会話型 AI から進化し、現在では詩、音楽、子供向けオーディオブック、金融情報、テレビやラジオのキャスター、メディアのニュース解説、さらには執筆支援など、さまざまな分野に創造性を発揮しています。これは、当初私たちが植えた精神的な種が今や地面を突き破って芽を出したことを示しています。 次は3x3で、より積極的かつパーソナライズされた人間と機械の対話を実現 Microsoft XiaoIce の次の目的地はどこでしょうか?心の若い芽は成長し続け、強くなることができるでしょうか?その答えは、XiaoIce のアップグレード速度をさらに加速するために、「3x3」人工知能開発マップを構築しているということです。 最初の 3 つは、自然言語処理、音声、コンピューター ビジョンの 3 つの主要分野の研究結果を統合し、マルチモーダル インタラクションを使用して XiaoIce をトレーニングし、より速く進歩することです。 これまで、上記の分野はそれぞれ独自の軌道で独立して発展してきました。近年、ディープラーニング技術とアルゴリズムの向上により、音声認識や画像認識において大きな進歩が遂げられており、自然言語処理技術においても同様の進歩が期待されています。過去 1 年間、私たちはコンピューター ビジョン技術を組み合わせて XiaoIce の詩作成機能をトレーニングし、これを使用してマルチモーダル インタラクションが人工知能技術の進化を促進できるかどうかを評価してきました。その結果は興味深いものです。
2 番目の 3 は、Microsoft XiaoIce の 3 つの独自の「学習者」、つまり生成モデル、共感モデル、3 ビュー モデルを指します。
3 大分野の複合トレーニング システムを Microsoft XiaoIce の 3 大学習ツールと組み合わせることで、XiaoIce の成長は必然的に大幅に加速し、「コードで機械の心を構築する」という目標に一歩近づくことになります。つまり、感情コンピューティング フレームワークも人工知能の作成も、Microsoft XiaoIce や Microsoft の人工知能研究開発部門の最終目標ではありません。おそらく、「人工心」の構築が最終目標です。 |
<<: ガートナーは、人間と機械の境界を曖昧にする5つの新たな技術トレンドを明らかにした。
>>: TensorFlow を使用した LSTM モデルの構築に関する詳細なチュートリアル
[[329380]]テクノロジーの発展に伴い、人工知能とデータサイエンスはスポーツの分野でますます重...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
最近、友人とこの問題について話し合っています。ご存知のとおり、IT 業界は標準的な「若者の仕事」です...
AI と機械学習をエネルギーと組み合わせることで、再生可能エネルギーの導入を加速することができます。...
最近、2021年世界ロボット大会が北京で盛大に開幕しました。ロボット分野の最先端技術と最新の成果が展...
英国の情報コミッショナー事務局(ICO)とアラン・チューリング研究所は共同で「AIによる説明決定」ガ...
最近、Amazon One の研究者は、生成された画像を明示的に制御できる GAN をトレーニングす...
[[426278]] 2021年1月、コンピュータサイエンスと人工知能分野のトップ学者であるエリッ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
本日、Yushu Technology は、中国で正式に一般に公開される初の四足歩行ロボットとなる四...