人工知能をより賢くするにはどうすればいいでしょうか?オープンソースプラットフォームが必要です

人工知能をより賢くするにはどうすればいいでしょうか?オープンソースプラットフォームが必要です

[[332916]]

ニーダーザクセン州オスナブリュック、2020年6月19日:メラニー・プロッパ先生が教室で小学生に教えている。新しいクラウン隔離規制の制限により、学校は現在、特別な衛生管理措置を講じる必要があります。さらに、教室内の生徒数も制御されます。

COVID-19の流行が本格的に始まった後、多くの学生が自宅でオンライン授業を受けるようになりましたが、この遠隔教育法は確かに通常の授業とは比べものにならないことが判明しました。また、問題を直接伝え、アイデアを議論し、チームの課題を明確にし、グループとして目標を達成するというプロセス全体が、より良い学習成果につながることも一般的に認識されています。まさにそうです。そうでなければ、学校は何のために必要なのでしょうか?

しかし、同じ相互接続性と相互運用性のあるテクノロジーは、データ駆動型の人工知能 (AI) 知識ベースやソフトウェア駆動型の分析エンジンを構築する際に、コンピューターがより優れた「学習」結果を達成するのにも役立つのでしょうか?

機械学習のオープン性

最近、業界では多くのオープン AI ユースケースが登場しています。たとえば、今年 6 月、Databricks はオープンソースの機械学習の成果に基づいて Linux Foundation に正式に加盟しました。 Databricks は、エンドツーエンドのプロセスの形で機械学習機能を提供するという基本的な位置付けを反映して、このプロジェクトを MLflow と名付け、このプロジェクトが開発ライフサイクル全体にわたって実行されることを期待しています。

機械学習の分野では、エンドツーエンドは、開発ライフサイクルの端から端までのソフトウェア ツールの包括的なカバレッジを強調する、かなり一般的な表現です。

用語の観点から見ると、エンドツーエンドでは、データ処理全体に対して、準備(データ解析と重複排除を含む)、実験フェーズ、コードを「繰り返し可能な」形式にパッケージ化すること(インテリジェントモジュールの形式でオペレーティングシステムで自由に組み合わせることができ、対応する機能のプラグアンドプレイを実現できます)、そして最後に、柔軟に共有および共同作業できる AI モデルを入力することが必要です。

最も重要な部分は「コラボレーション」の部分であり、オープン(本質的にはオープンソース)プラットフォームとチャネルコミュニティを通じて、AI および ML データ セット、処理エンジン、さらにはその他のディープラーニング ツールの共有機能を実現することです。現在、業界では一般的に、これが機械学習を実装するためのより生産的で自然な方法であると考えています。

Databricks の MLflow プロジェクトには 2 年の歴史があり、200 人を超える貢献者がいます。これを Linux Foundation に引き渡すことで、プロジェクト自体が特定のメーカーから独立した開発パスを形成すると同時に、採用とコミュニティへの貢献を拡大するためのオープン ガバナンス モデルを選択することになります。

Databricks は、MLflow を作成した当初の目的は、機械学習モデルの開発プロセスにおける「固有の複雑性要因」に対処することだったと説明しました。この分野の経験を持つ友人なら誰でも、マシン モデルの構築、トレーニング、チューニング、展開、管理を伴うこのようなプロセスが、実に頭の痛い作業であることを実感できると思います。

「コミュニティの参加が着実に増加していることは、データ チームが将来の機械学習プラットフォームの構築に注力する必要があることを示しています」と、Linux Foundation の戦略イニシアチブ担当副社長 Michael Dolan 氏は述べています。「採用の増加は、機械学習のライフサイクルを標準化するためにオープン ソース アプローチを採用する必要があることも意味します。世界最高のオープン ソース プロジェクトの多くでの経験から、オープン ガバナンス モデルは、幅広い業界の貢献とコンセンサスを通じてイノベーションと採用を加速できることがわかりました。」

デジタルインテリジェンスの普及促進

オープンソースコードの開発は、ある程度、デジタルインテリジェンスの普及を効果的に促進することもできます。 2020 年 6 月、Abbyy は機械学習モデルの構築、トレーニング、展開に特化した NeoML オープンソース コード ライブラリをリリースしました。シリコンバレー、ロシア、ヨーロッパ、極東で事業を展開する同社は、これまで常に文書のキャプチャと管理を専門としてきたが、最近の事業拡大に伴い、企業顧客向けにデジタルインテリジェンス技術ソリューションの提供を開始した。

NeoML のソース コードは GitHub から簡単に入手できるようになり、ディープラーニングと従来の機械学習アルゴリズムの両方をサポートしています。クロスプラットフォーム フレームワークとして、クラウド環境、デスクトップ、モバイル デバイス上で実行されるさまざまなアプリケーションをインテリジェントに最適化できます。

前述の Databricks オープン インテリジェント テクノロジーは、主にビッグ データ処理とクラウド コンピューティングの「クラスター」管理に使用されますが、Abbyy の機械学習モデルは画像処理タスクに特化して最適化されており、あらゆるデバイスで実行される事前トレーニング済みモデルに優れた推論パフォーマンスを提供することを目指しています。 2 つのプロジェクトはそれぞれ異なる技術的ユースケースを対象としており、インテリジェンスのレベルも異なりますが、その主な魅力は、オープン コミュニティの貢献者の力を最大限に活用し、貢献者に還元することです。

Abbyy 氏は、IT マネージャーの 95% が、オープンソースを中核ミッション ソフトウェア開発の主要な方向性と見なしており、この戦略的トレンドに注目し始めていると述べました。 Abbyy はオープンソースを通じて機械学習フレームワークの急速な開発も推進し、AI の継続的な改善をサポートします。現在、ソフトウェア開発者は NeoML を直接使用してさまざまなモデルを構築、トレーニング、展開し、オブジェクト認識、分類、セマンティック セグメンテーション、検証、予測などのさまざまなビジネス目標に対応するモデル ソリューションを実現できます。

Abbyy の AI エバンジェリストである Ivan Yamshchikov 氏は、より具体的な使用例も発表しました。銀行はこの技術を使用して、信用リスクを管理し、顧客離れを予測するモデルを開発できます。通信会社は、マーケティング キャンペーンの具体的な効果を分析するためにこの技術を使用できます。また、小売業や日用消費財 (FMCG) 企業は、顔認識機能やデータ検証機能を含むリモート顧客タグ付けソリューションを確立できます。

「当社のフレームワークをオープンソース コミュニティと共有することで、開発者は推論の高速化、クロスプラットフォーム機能を実現し、モバイル デバイスのコンピューティング能力を最大限に活用できます。また、開発者からのフィードバックと貢献により、当社のコードベースは継続的に改善され、強化されます」と Yamshchikov 氏は述べています。「AI テクノロジーの全体的な進歩を嬉しく思っており、機械学習をより価値があり、影響力のあるユースケースにするために全力を尽くします。」

心を開いて

しかし、オープンソースは本当に優れた AI インテリジェンスを実現する唯一の方法なのでしょうか? テクノロジーの分野では、粗野なポピュリズムは許されません。機械学習テクノロジーの分野では、閉鎖的なプロプライエタリ サークルも重要かつ生産的な領域です。学習とコミュニケーションの範囲を継続的に拡大し、さらに具体的な学習モデルを直接共有することによってのみ、AI技術の真の普及を実現することができます。

Abbyy が作成した NeoML プロジェクトを例に挙げてみましょう。このテクノロジーは、相互運用可能な機械学習モデルのグローバルなオープン エコシステムである Open Neural Network Exchange (ONNX) をサポートしています。このプロジェクトの目的は、さまざまなツール間の互換性を改善し、ソフトウェア開発者が適切なツールの組み合わせを簡単に使用して期待される機能を実現できるようにすることです。 ONNXオープンソース標準には、MicrosoftやFacebookなど多くのパートナーが参加しています。オープンAIインテリジェンスは今後ますます一般的になると思います。

よく言われる「心を開きなさい」というのは、こういうことなのかもしれません。

<<:  ロボット研究助手が人間の1,000倍の速さで研究を行うために登場

>>:  スタンフォード大学の研究者がAIを活用してCOVID-19の治療薬の発見を加速

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

海外メディア:ソフトバンクがロボット事業を縮小し、ペッパーの生産を停止

ロイターが入手した情報筋や文書によると、ソフトバンクグループは世界的なロボット事業で人員削減を行い、...

人間のフィードバックなしで調整します。田元東チームの新しい研究RLCD:無害で有益なアウトラインライティングはベースラインモデルを全面的に上回る

大規模モデルがより強力になるにつれて、低コストでモデルの出力を人間の嗜好や社会の公共価値により沿った...

...

教育ロボットとベテラン教師の戦い:学習の効率を高めるのはどちらでしょうか?

[51CTO.com]地理的制約と教師の制約により、中国では質の高い教育資源が常に極めて不足してい...

高性能 HTTP サーバーの負荷分散アルゴリズムは何ですか?ほとんどのプログラマーは収集しています...

典型的な高同時実行性、大規模ユーザー Web インターネット システムのアーキテクチャ設計では、HT...

...

専門家は、人工知能はすでに人間に対する「わずかな意識」を持っていると主張している。

北京時間2月15日、海外メディアの報道によると、大規模な人工ニューラルネットワークに基づく人工知能は...

オープン性とクローズ性の戦い: Baidu と Google のどちらの AI プラットフォームが優れているか?

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

ChatGPT コード生成が 10% 増加しました。北京大学中国人第一著者:プロンプトを改良し、大規模モデルのコーディング機能を大幅に改善

大規模モデルの時代では、高品質なコード生成が驚くほど強力になりました。 HumEval のテストで ...

Aスターアルゴリズムの実装手順のJavaバージョン

スターアルゴリズムの手順: 1. 最初に、オープン リストに開始点を追加します。 2. オープンリス...

宇宙全体が巨大なニューラルネットワークなのだろうか?科学者はこう説明する

[[385301]]核となる考え方は、次のように簡単にまとめることができます。ニューラル ネットワー...

世界に革命をもたらす新たなテクノロジートレンド

急速な技術進歩により、私たちの知る世界は変化し続け、変革の可能性を秘めた新たな時代が到来しています。...

PyTorch でシンプルな分類器を実装する

[[328922]]私自身の PyTorch の学習過程を思い出すと、最初はいろいろな情報を見つけ、...

...