機械学習の未来

機械学習の未来

[[401300]]

データ ライフサイクルの管理は、自動運転車の開発において重要な部分です。

自動運転車の開発がホットな話題であることは間違いありません。完全自動運転のアイデアは、ロボット時代の最も急進的な概念の1つです。実装には適切なテクノロジーが必要になるだけでなく、道路を使用する人や道路および交通管理に携わる人全員の考え方にも大きな変化が必要になります。もちろん、安全性は大きな懸念事項であり、事故が発生するとニュースの見出しになるのはそのためです。

しかし、こうした議論や見出しの背後には、見落とされがちな別のストーリーがある。それは、自動運転車が都市や社会にうまく統合されるかどうかは、データに大きく依存するということだ。実際、自律走行テスト車両から収集されたデータは、機械学習 (ML) などの技術を通じて車両が自律的に動作するように「トレーニング」するための基礎を提供します。

困難なユースケース

自動運転は、車両を操作するための現実世界の変数が膨大であり、それに伴う誤った安全要件に対するゼロ トレランスを考慮すると、考えられる最も困難な機械学習の使用例の 1 つです。このアプリケーションの成功は、要求の少ないユースケースの直接的な促進につながります。そのため、自動運転車の開発は、特にスマート シティなど、さまざまな分野に影響を与えます。

自動運転車の観点から見ると、機械学習の重要な要件は「認識層」のトレーニングです。つまり、センサー(無線、カメラ、ライダー、慣性測定装置など)を使用して、車両が遭遇する状況を正確に「見る」ということです。これは、実行されるあらゆるアクション(車両に経路調整を指示するなど)が正確な知覚層の視覚に依存するため、非常に重要です。

自動運転の開発が将来のユースケースを推進する可能性が高い理由の 1 つは、この重要な認識レイヤーをトレーニングするために使用される機械学習モデルとニューラル ネットワークが、大規模で多様なデータセットで最も優れたパフォーマンスを発揮することです。自動運転車は膨大なデータセットに依存しています。従来の自動車工学の専門知識も頼りにしているが、自動運転車の製造に必要なデータの平均量は約150ペタバイトと推定されている。つまり、これは単なる機械工学の課題ではなく、データ分析と機械学習の両方の課題なのです。

収集および処理する必要があるデータの量には、データ レイクやデータ ライフサイクルの明確な理解などの高度なデータ管理機能が必要です。将来のユースケースは、データの管理と処理の理解だけでなく、データがもたらす機会にも左右されます。

歴史的に、断片化されたデータ管理ライフサイクルでは、管理ライフサイクル自体に関連する労力、コスト、時間のために、新しいユースケースに拡張する能力が制限されていました。ライフサイクルを最適化することで、ライフサイクルをより速く、より頻繁に繰り返すことができ、機械学習モデルを継続的に改善できます。

一緒に働く

これを実現するには、自動車メーカー、都市、その他の関係者が協力し、急速に変化する環境において最新のハードウェアおよびソフトウェア技術を活用する必要があります。 IoT と機械学習データ分析ライフサイクルを習得するために必要な能力は、どの企業でも対応できる範囲を超えています。したがって、スマート シティとコネクテッド コミュニティを真に変革する機能を強化するには、標準ベースおよびパートナー ベースのエコシステム アプローチが不可欠です。

このレベルのコラボレーションはソリューションの構築に不可欠であり、共同プロジェクトによって標準や再利用可能なパターンも生み出されます。最近の例として、Cloudera は Project Fusion と呼ばれるイニシアチブに参加しています。これは、将来のコネクテッドカーや自律走行車システムを実現し、最適化するためのデータライフサイクルプラットフォームを定義する、自動車業界の複数の関係者による技術コラボレーションです。パートナーは、データ管理テクノロジーを提供する車両からクラウドへのソリューションの構築を目指しています。

協力することで、ビッグデータや機械学習に対するその他の障壁のいくつかが自動運転車の開発において最大限に活用され、その他のユースケースにも対処できるようになります。ライフサイクルの管理にかかるコストと時間を削減するには、システムから無駄と非効率性を排除する必要があります。

潜在的なデータプライバシーの問題に対処することが重要です。前述したように、自動運転車の運転トレーニングは、現実世界で記録されたトレーニング データに依存します。したがって、ソリューションプロバイダーは、運転者の顔やナンバープレートの番号などの個人情報を収集して保存しないように注意する必要があります。

この情報は、収集および保存される前に編集する機能を提供する必要があります。これには、プライバシー データを識別してフィルタリングするための強力なデータ処理機能が必要です。さらに、収集される情報は、EU の一般データ保護規則や米国のカリフォルニア州消費者プライバシー法などの規制に準拠する必要があります。

リアルタイムの意思決定

機械学習は、都市、テクノロジープロバイダー、その他の関係者が、センサーやその他のデバイスからのデータを単に監視して報告するだけでなく、それに基づいて最適化されたリアルタイムの意思決定を行う上で重要な役割を果たします。交通機関を例に挙げてみましょう。

交通状況を監視して渋滞が発生していることを報告することも重要ですが、機械学習を使用して代替ルートを提案したり、旅行者に別の時間に旅行することを積極的に提案したりするなど、提案を通じて積極的に住民を誘導することは、より魅力的な価値提案です。機械学習を使用すると、これらはリアルタイムの状況と過去の経験の両方に基づくことができます。

私たちが知っているのは、自動運転は機械学習の可能性について多くのことを教えてくれ、多くの新しいアプリケーションにつながるということです。

積極的、最適化された、リアルタイムの意思決定は機械学習の強みの特徴であり、これはまだ始まったばかりです。機械学習の可能性についてはまだ学ぶべきことがたくさんあり、その将来の使用例の多くは私たちの現在の想像を超えています。

私たちが知っているのは、自動運転がその可能性について多くのことを教えてくれ、多くの新しい応用分野へと導いてくれるということです。機会を逃さないように、高度なデータ管理とデータ ライフサイクルの重要性を理解するための基盤とエコシステムが整備されていることを確認する必要があります。

<<:  人工知能業界データ分析:中国のネットユーザーの76.8%が2020年の人工知能トラフィックアプリケーションシナリオに満足している

>>:  可視性プラットフォームがセキュリティ オペレーション センター (SOC) にとって重要な理由は何ですか?

ブログ    

推薦する

...

...

2017 年に最も価値のある機械学習のスキルや知識は何ですか?

2017 年に最も価値のある機械学習スキルはどれでしょうか? Quora の 2 つの回答では、最...

...

...

組織のセキュリティを保護するための暗号化トラフィック分析における機械学習の役割

脅威の攻撃者が戦術や手法を進化させ続けるにつれて(たとえば、暗号化されたトラフィック内に攻撃を隠すな...

がん治療への新たな希望:AIが科学者の生きた人間の細胞の観察を向上

[[230060]]細胞生物学者と細胞研究者は、新しい細胞モデルツールを利用できるようになりました。...

自動運転事故を回避するために、CV 分野では物理的な攻撃をどのように検出できるでしょうか?

敵対的攻撃の概念は、Goodfellowら[6]によって初めて提唱されました。近年、この問題はますま...

...

回帰問題に最適な機械学習アルゴリズムを選択する

あらゆる種類の機械学習 (ML) の問題に取り組む場合、選択できるさまざまなアルゴリズムがあります。...

仕事でアルゴリズムが使われることはほとんどないので、なぜアルゴリズムを学ぶ必要があるのでしょうか?

共通のデータ構造とアルゴリズム最も基本的なデータ構造とアルゴリズムは次のとおりです。ソートアルゴリズ...

AIとデータが未来のスマートシティを強化する5つの方法

私たちが住む世界はますます都市化が進んでいます。 2009 年の国連の調査によると、毎週 130 万...

Keras よりも優れた機械学習「モデル パッケージ」: コード 0 個でモデルの作成を開始

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...