知覚AIオペレーティングシステム

知覚AIオペレーティングシステム

AI、つまり人工知能の新たな波が到来します。機械学習、ディープラーニング、ニューラルネットワーク、音声認識、画像認識…これらは私たちの耳と目によく響きます。 AI が産業に力を与えるのか、それとも人々の生活を変えるのか、想像の域にとどまる人もいれば、それを実践する人もいます。

人工知能をどのように応用するか?

振り返ってみると、PC やスマートフォンでアプリケーションを開発するにはどうすればよいのでしょうか。非常に重要な点の 1 つは、DOS から Windows、さまざまな Unix からさまざまな Linux、Symbian から Android や iOS まで、コンピュータのオペレーティング システムが存在することです。さまざまなオペレーティング システムがあるからこそ、さまざまなアプリケーションを開発できるのです。

では、人工知能のオペレーティング システムがあれば、産業に力を与え、私たちの生活を変えることができるのでしょうか?

答えは「はい」であるはずです。しかし、人工知能のオペレーティング システムを理解するには、まずオペレーティング システムとは何かというところから始める必要があるかもしれません。

オペレーティング システムとは何ですか?

工学系の大学のカリキュラムには、コンピューターを専攻していない学生向けにも「オペレーティングシステム」に関するコースがあります。

オペレーティング システム (OS) は、コンピュータのハードウェアとソフトウェアのリソースを管理し、コンピュータ プログラムに共通のサービスを提供するシステム ソフトウェアです。------Wikipedia.org より

簡単に言えば、オペレーティング システム (OS) は、コンピュータのハードウェアとソフトウェアのリソースを管理および制御するコンピュータ プログラムです。これは、「ベア メタル」マシン上で直接実行される最も基本的なシステム ソフトウェアです。オペレーティング システムは、基盤となるハードウェアとユーザーの間に位置し、両者間の通信の橋渡しとなります。主な機能は、リソース管理、プログラム制御、および人間とコンピュータの相互作用です。

[[262940]]

オペレーティング システムは、シングルタスク/マルチタスク、シングルユーザー/マルチユーザーなど、さまざまな次元で分類できます。デバイスの複雑さの観点から、スマートカードオペレーティングシステム、リアルタイムオペレーティングシステム、センサーオペレーティングシステム、組み込みオペレーティングシステム、パーソナルコンピュータオペレーティングシステム、マルチプロセッサオペレーティングシステム、ネットワークオペレーティングシステム、大規模オペレーティングシステムなどに大別できます。

現代の基準では、標準的な PC オペレーティング システムには、おおよそ次の機能があります。

  • 処理管理
  • メモリ管理
  • ファイルシステム
  • ネットワーキング
  • 安全
  • ユーザーインターフェース
  • デバイスドライバー

人工知能とは何ですか?

人工知能は、単純に聞こえるかもしれませんが、実際には非常に複雑な概念です。その範囲は比較的広範囲です。「人工知能の簡潔な歴史」という本は、歴史的な背景をある程度提供してくれるかもしれません。

AI、Wikipedia の説明は次のとおりです。

人工知能とは、人間や他の動物ではなく、機械が示す知能のことです。コンピュータ サイエンスでは、AI 研究の分野は「インテリジェント エージェント」の研究と定義されています。つまり、環境を認識し、何らかの目標の成功の可能性を最大化するアクションを実行するデバイスです。口語的には、「人工知能」という用語は、機械が「学習」や「問題解決」など、人間が他の人間の心と関連付ける「認知」機能を模倣する場合に適用されます。 ---- wikipedia.org より

人工知能における知能をどのように定義するのでしょうか? 知能をどのように説明するのでしょうか? おそらく、人工知能を理解するにはチューリング テストを使用する方が便利です。 1950 年、アラン チューリングはチューリング テストを提唱しました。これは、機械が機械であると識別されることなく (テレタイプ機器を介して) 人間と通信できる場合、その機械は知的であると言われるというものです。具体的には、テスターとテスト対象者(人と機械)を分離し、何らかのデバイス(キーボードなど)を通じてテスト対象者にランダムな質問を投げかけることを意味します。複数回のテストの後、テスト対象者が人間であるか機械であるかを判断できないテスト担当者が 30% 以上いる場合、機械はテストに合格し、人間の知能を備えているとみなされます。

人工知能の表面的な理解については、「経験豊富なプログラマーの目から見たシンプルな AI」の記事を参照してください。

AI オペレーティング システムとは何ですか?

話題に戻りますが、人工知能オペレーティング システムとは何でしょうか? まず、それはオペレーティング システムであり、オペレーティング システムに関連する機能を備えている必要があります。では、人工知能オペレーティング システムには人工知能機能があるのでしょうか、それとも人工知能機能を提供するオペレーティング システムなのでしょうか? 個人的には、おそらく人工知能機能を備え、提供しているオペレーティング システムだと思います。

人工知能オペレーティングシステムは、一般的なオペレーティングシステムの機能を備え、音声認識、マシンビジョン、実行システム、認知行動システムなどが含まれます。具体的には、ファイルシステム、プロセス管理、プロセス間通信、メモリ管理、ネットワーク通信、セキュリティメカニズム、ドライバー、ユーザーインターフェイス、音声認識サブシステム、マシンビジョンサブシステム、実行サブシステム、認知サブシステムなどのサブシステムが含まれます。

[[262941]]

異なる次元のオペレーティング システムは、人工知能機能を備え、それを提供する場合、おそらく人工知能オペレーティング システムと見なすことができ、ロボット工学の分野に限定されません。

現在、私たちが利用できる人工知能オペレーティングシステムはありますか?一般的な意味での人工知能オペレーティングシステムはまだ期待されていますが、DuerOSなどの垂直分野の人工知能オペレーティングシステムが私たちの生活に入り始めています。

[[262942]]

DuerOSとは何ですか?

DuerOS は、Baidu の Duer ビジネス ユニットによって開発された会話型人工知能オペレーティング システムです。オープン オペレーティング システムである DuerOS は、常に自動的に学習できるため、マシンに人間の言語機能を持たせることができます。簡単に言えば、現在の DuerOS は音声対話用の AI システムです。

DuerOS の全体的なアーキテクチャは 3 つの層で構成されています。中間層はコア層、つまり対話サービス システムです。最上層はアプリケーション層、つまりスマート デバイス オープン プラットフォームです。3 番目の層は機能層、つまりスキル オープン プラットフォームです。

画像は百度百科事典より

コア層には、音声認識から音声放送、画面表示までの完全な対話プロセス(オペレーティングシステムの入出力として理解できます)と、自然言語理解、対話状態制御、自然言語生成、検索など、対話をサポートするコアテクノロジが含まれます。これらのテクノロジは、上位層と下位層の実装をサポートします。

アプリケーション層では、コア アクセス コンポーネント、チップ モジュール、マイク アレ​​イなどの開発キット、工業デザイン、構造設計、音響キャビティ設計を含むリファレンス デザイン ソリューション、および Xiaodu スピーカー シリーズ製品などの特定のスマート ハードウェアが提供されます。

機能レイヤーは開発者向けであり、ネイティブ スキルとサードパーティ スキルを含むオープン スキル プラットフォームを提供します。開発者はスキル ツールを使用して、DuerOS ベースのスキルを作成および公開できます。

DuerOS を搭載したデバイスを使用すると、ユーザーは自然言語で対話し、オーディオおよびビデオ エンターテイメント、情報クエリ、ライフ サービス、旅行状況などの複数の機能を実行できるほか、サードパーティ開発者による機能へのアクセスもサポートされます。

AIエンパワーメント、DuerOSベースのアプリケーション開発

プログラマーとして、DuerOS をベースにしたアプリケーションの開発は、入力が音声になり、出力も音声または画像表示になる点を除けば、一般的な Web アプリケーションの開発と似ています。いわゆるスキルは、http/https を通じて実装されたビジネス ロジックによって形成されるサービスとして理解できます。

開発者は通常、スキルオープンプラットフォーム(DBP、DuerOS Bot Platfrom)上でアプリケーションの開発、テスト、リリースを完了します。 DBP は Android または iOS として表示でき、アプリケーションのリリースは Android ストアまたは AppStore でのリリースと同様です。 DBP は、開発者にスキル開発、テスト、および展開ツールの完全なセットを提供します。

画像は百度百科事典より

DBP が提供する Java/Javascript/PHP/Python/Go SDK を使用すると、開発が比較的簡単になります。同時に、開発者は DBP プラットフォームを使用して、ビジュアル インターフェースを通じてさまざまなパーソナライズされたスキルを簡単かつ効率的に開発し、ユーザーにパーソナライズされたサービスを提供できます。

興味深いことに、DBP (https://dueros.baidu.com/dbp) は、高度に統合されたアプリケーション テンプレートを通じて、小さなスキル サービスを提供できます。プログラミングは必要ありません。小さなスキル、つまりマイクロ機能を開発して展開するには、リソースをアップロードするだけです。スマート スピーカーで使用するのは非常にシンプルで興味深いものです。

これらはすべて、人工知能オペレーティング システムが開発者にもたらす恩恵と言えるでしょう。

参考文献

[米国] Abraham Silberschatz、「オペレーティングシステムコンセプトの基本」、Machinery Industry Press、2018 年

ニック、人工知能の簡潔な歴史、Posts and Telecommunications Press、2017年

https://dueros.baidu.com

https://dueros.baidu.com/dbp

https://baike.baidu.com/item/DuerOS

[この記事は51CTOコラムニスト「老曹」のオリジナル記事です。著者のWeChat公開アカウント:Oh Home ArchiSelf、id:wrieless-com]

この著者の他の記事を読むにはここをクリックしてください

<<:  PaddlePaddle をベースに構築された産業グレードの ICNET アプリケーションの予測速度は、TensorFlow を 20% 上回ります。

>>:  MorphNetは、ニューラルネットワークをより高速、小型、効率的にするモデル最適化技術です。

ブログ    

推薦する

2021年1月から2月までの中国人工知能の月次情報まとめ

[[389793]]国内人工知能産業への投資と資金調達の調査不完全な統計によると、過去2か月間に66...

機械学習を簡単に理解!クラスタリング、回帰、分類アルゴリズムを説明する 3 つのケース

機械はどのように学習し、何を学ぶのでしょうか?人間はどうやって機械に学習を教えるのでしょうか?この記...

2020年に人工知能は私たちの生活をどのように変えたのでしょうか?

2020年はごく平凡な年であると同時に、非常に非凡な年でもありました。生活の面では、人工知能が配達...

Lisp言語はどうやって生まれたのか?LISPとAIは幼なじみ

[[183485]] LISP 言語の歴史と、いくつかの余談や興味深い逸話は、実際に本として読む価値...

中国チームが超伝導において新たな大きな進歩を遂げました! LK-99のような物質は、再現性と検証性を備えた超伝導性を示す。

室温超伝導に新たな進歩はありますか?華南理工大学、中南大学、中国電子科技大学の研究者らは12月19日...

...

RNN モデルが Transformer の覇権に挑戦!ミストラル7Bに匹敵する1%のコストパフォーマンス、世界最多の100以上の言語をサポート

ビッグモデルが退化する中、トランスフォーマーの地位も次々と脅かされてきました。最近、RWKV は最新...

4つの主要な機械学習プログラミング言語の比較: R、Python、MATLAB、Octave

この記事の著者は、R、Python、MATLAB、OCTAVE の 4 つの機械学習プログラミング言...

機械学習モデルをトレーニングする際に避けるべき 6 つの間違い

[51CTO.com クイック翻訳] AI や機械学習モデルの開発は簡単ではありません。さまざまなシ...

「脳制御+AI」で人は「本能」で運転できるようになる

「左に曲がれ、左に曲がれ、左に曲がれと言っただろう!」「ステップ!ステップ!ブレーキを踏め!」「手で...

...

基本モデル+ロボットの開発軌跡を見通すレビュー

ロボット工学は、特にスマートテクノロジーと組み合わせると、無限の可能性を秘めたテクノロジーです。近年...

...

制御可能な人工知能には未来がある

8月29日、2019年世界人工知能会議が上海で開幕した。世界各国の著名なテクノロジー企業や学界、産業...

...