AIについて何も知らないのに、どうやってAIを開発すればいいのでしょうか？

「カスタム開発された AI モデル」に対する現在の市場需要は 86% にも上ります。

[[346193]]

ただし、このプロセスでは、エンタープライズユーザーと開発者は次のような問題に直面することがよくあります。

モデルトレーニングの経験不足
データ収集と注釈のコストが高い
モデルの適応と展開のプロセスは非常に面倒です
長いモデル最適化反復サイクル

では、上記の問題をワンストップで「解決」できるツールはあるのでしょうか?

Baidu EasyDL をチェックしてください。

簡単に言えば、EasyDL はディープラーニングの応用の敷居を大幅に下げます。

AI開発を「家電」を使うのと同じくらい簡単にします。さらに、トレーニングによって生成される AI モデルの品質は、上級エンジニアが生成したものと同等のプロフェッショナルなものです。

しかし実際には、Baidu は 2017 年末に EasyDL を立ち上げ、2018 年初頭に正式にオープンしました。同時に、「誰もが AI を活用できる」というビジョンを提唱しました。

それで、ほぼ 3 年が経過した今、このビジョンはどこまで実現したのでしょうか?

AIを家電のように使う場合、どの程度信頼できるのでしょうか？

まず、EasyDL の 3 つの主要な機能を見てみましょう。

操作と使用プロセスが非常にシンプルで、モデルのトレーニングはわずか 15 分で完了します。
画像分類モデルのオンライン平均精度が 99% を超えるなど、高精度のトレーニング結果。
豊富な展開方法、クラウド、ターミナル、エッジ展開を完全にサポートします。

1つ目は、EasyDL の使いやすさと敷居の低さです。

使用プロセスは、「モデルの作成」、「データの準備」、「モデルのトレーニング」、「アプリケーションのデプロイ」という 4 つの簡単なステップのみです。

さらに、プロセス全体が視覚的なグラフィックを使用して実行されるため、企業や開発者にとっての使用ハードルが大幅に下がります。

Baidu AI プラットフォーム研究開発部門のテクニカルディレクターである Xin Zhou 氏は次のように述べています。

コードを 1 行も書かずに、ニーズとデータに基づいて独自の AI ソリューションをカスタマイズできます。

工業製造における生産品質検査の分野では、「愛宝花石」を例にとると、荷物の生産工程で残留異物（針、金属部品など）を監視する際に、EasyDLを使用して荷物品質検査モデルをトレーニングします。AIアルゴリズムの詳細を理解する必要がなく、精度率90％のモデルをトレーニングしました。

「Hancai Headhunter」を例にとると、数人の人事専門家がEasyDLを使用して、AIアルゴリズムを理解することなく履歴書データの構造化処理と自動分類モデルを完成させ、スタッフの履歴書検索効率を大幅に向上させました。

しかし、シンプルさはプロ意識を無視することを意味するものではありません。それどころか、両者は「互換性があり、並行している」のです。

「漢才ヘッドハンター」も例外ではありません。高級管理職人材紹介会社として、さまざまな業界の企業情報と人材情報を200万件保有しています。

しかし、非常に「致命的」な問題は、履歴書の検索率が低いため、200 万件のデータの人材プールの利用率が 10% 未満であることです。

EasyDL を使用した後、履歴書データの構造化処理を促進するために複数のモデルをトレーニングし、「候補者機能」と「候補者ポジションレベル」モデルだけで認識率が 95% 以上に達しました。

これまで、Hancai Headhunters はキーワード検索タスクで 1 日に 60 ～ 70 件の適切な履歴書しか見つけることができませんでした。しかし、現在では、95% の精度で 20 分以内に 600 ～ 1000 部のコピーを作成することが可能です。

一言で言えば、Baidu EasyDL は、企業が「カスタマイズされた AI モデル」を家電製品と同じくらい簡単に使用できるようにするだけでなく、上級 AI エンジニアと同じくらい専門的にも使用できるようにします。

さらに、EasyDL は、パブリッククラウド API、プライベートサーバー展開、デバイス側 SDK、ハードウェアとソフトウェアの統合ソリューションなど、さまざまなモデル展開方法もサポートしています。

たとえば、ハードウェアとソフトウェアの統合ソリューションの展開において、EasyDL は特殊な適応と加速をサポートする 6 つのハードウェアとソフトウェアの統合ソリューションを提供し、高、中、低レベルのマトリックス全体をカバーし、モデル認識速度を 10 倍に高めることができます。

機能が豊富なだけでなく、非常に高速で、わずか 5 分で統合できます。

EasyDL の優れた機能はすべて、その背後にある技術的な強みと切り離すことはできません。

EasyDL の機能はどのように実現されるのでしょうか?

ツールやプラットフォームが表面的に見えて使いやすいほど、その背後にある設計は複雑になる可能性があります。

Baidu EasyDLでも同様です。

このプラットフォームは、多くの複雑なディープラーニングアルゴリズムとエンジニアリングテクノロジを使用しており、それらはすべて、シンプルで使いやすく、使用の敷居が低いように設計されています。

EasyDL がモデルで高精度を実現できる重要な理由の 1 つは、Baidu が独自に開発したディープラーニングプラットフォームである PaddlePaddle をベースとしていることです。ワンストップのモデルトレーニングとサービス体験には、Baidu が長年にわたって蓄積してきた独自のテクノロジーとエンジニアリング能力がさらに組み込まれています。

まず、EasyDL は Baidu の超大規模データでトレーニングされた事前トレーニング済みモデルをプリセットします。

視覚タスクでは、画像分類トレーニングタスクに、10万以上のカテゴリと6,500万枚の画像を含む膨大なインターネットデータに基づくBaiduの超大規模視覚事前トレーニングモデルが組み込まれており、平均精度は3.24%～7.73%向上します。

物体検出トレーニングタスクに関しては、800以上のラベル、170万枚の画像、1000万以上の検出フレームに基づくBaiduの超大規模物体検出事前トレーニングモデルは、平均精度を1.78%～4.53%向上させることができます。

自然言語処理に関しては、EasyDL には、Baidu が開発した業界最高の事前トレーニング済みモデルである ERNIE がプリインストールされており、機械の意味理解のレベルを新たなレベルに引き上げます。

EasyDL は、自動データ拡張や自動ハイパーパラメータ検索などの AutoML/DL 自動モデリングメカニズムも提供し、アルゴリズムの基礎知識がまったくないユーザーでも AI を利用できるようになります。

さらに、PaddlePaddle DGC 加速メカニズムに基づいて、EasyDL は重要な勾配 (スパース更新) のみを送信することで通信帯域幅の使用を削減し、分散トレーニングの効率を向上させます。従来の分散トレーニング方法と比較して、トレーニング速度は 70% 以上向上します。

第二に、データ処理の面では、EasyDL は EasyData インテリジェントデータサービスプラットフォームを構築しました。

データのラベリングとデータのクリーニングに関しては、EasyData は 11 のデータラベリングテンプレートと 5 つの標準および高度なクリーニングソリューションを提供します。

EasyData は、ハードウェアとソフトウェアを統合し、エンドとクラウドと連携する自動データ収集ソリューションも提供しており、データ収集時の機器の選択、デバッグ、統合開発などの面倒で時間のかかる作業を排除できます。

最後に、展開に関して、EasyDL はパブリッククラウド API、デバイス側 SDK、ローカルサーバー展開、ハードウェアとソフトウェアの統合展開という 4 つのソリューションを提供します。

その中で、パブリッククラウド API は弾力的な拡張と縮小をサポートでき、デバイス側 SDK EasyDL は現在、エンドツーエンドのモデル適応サービスを提供しており、15 種類以上のチップタイプと 4 つの一般的なオペレーティングシステムをサポートしています。

これらは EasyDL の強力な機能の背後にあるハードパワーです。

EasyDLを選ぶ理由

需要があるから、それが質問に対する答えです。

人工知能が主導する第四次産業革命は、社会のあらゆる分野に絶えず浸透しており、大企業には一定量の人材の蓄えと技術の蓄積がある場合が多い。

しかし、比較すると、中小企業は、上級開発者のコスト、技術力など、インテリジェンスの閾値が高すぎるため、インテリジェント変革のプロセスで困難に遭遇することがよくあります。

しかし、中小企業は国家経済全体の発展において重要な役割を果たしています。

そのため、このような問題を解決することが「必須」となっています。

だからこそ、EasyDLはオープン後、中小企業から広く認知され、支持されるようになったのです。

EasyDL は 2 年以上にわたって継続的にアップグレードおよび改良され、全体的な製品エクスペリエンスと機能がより充実したものになりました。

これにより、EasyDL は他の AutoDL プラットフォームと比較してより顕著な利点を持ち、より優れた結果を達成できるようになります。

それだけでなく、EasyDL の更新と反復は継続されます。

たとえば、今年のアップグレードの最大のハイライトは、5 月に新しくリリースされた EasyData インテリジェントデータサービスプラットフォームです。

AI 開発シナリオに焦点を当て、業界におけるデータ収集、データクリーニング、データラベリング、データリフローのための完全なワンストップソリューションを開拓しました。

内蔵の超大規模事前トレーニングモデルも今年のアップグレードの中心的な技術的ハイライトの 1 つであり、より高精度のトレーニング結果を提供します。

そして、今年 9 月には、EasyDL がさらに大規模なアップグレードを実施しました。

EasyDL クラシックバージョンでは、カスタマイズされた感情分析、マルチラベルテキスト分類、テキストエンティティ抽出が NLP 方向に追加され、表形式データの予測分析用の新しい ML 方向が導入され、モデルタイプがさらに充実しました。

データサービス面では、既存のインテリジェントラベリングをベースにしたマルチパーソンラベリングを開始し、データラベリングの効率がさらに大幅に向上しました。

新たに開始されたモデルマーケットは、個人または企業がEasyDLクラシックバージョンのトレーニング済みモデルを市場に公開して販売することをサポートします。また、市場から購入したモデルをデータと組み合わせて再トレーニングし、より良いモデル効果を実現することを革新的にサポートする業界初の製品です。

今後もEasyDLは以下の取り組みを継続していきます。

既存の CV、NLP、ML、音声認識アルゴリズムの種類を拡張するだけでなく、OCR やビデオトラッキングなどのカスタマイズされた機能もリリースします。
モデルのパフォーマンスを継続的に改善し、トレーニング速度を上げ、モデルの推論を加速します。
今後もデータ、モデル、サービスなどの利用のハードルを下げていきます。

この時点で、Baidu EasyDL は「誰もが AI を使える」という当初のビジョンに一歩近づいたと言えるでしょう。

<<: ニューラルネットワークモデルの構築に適した最適化アルゴリズムはどれですか? 35,000件の検査でわかる

>>: ディープラーニングパーセプトロンの原理の詳しい説明

ブログ

AIについて何も知らないのに、どうやってAIを開発すればいいのでしょうか？

2021年4月のロボット工学分野の重要な動向の概要

ボストン・ダイナミクスの二輪ロボット「ハンドル」がデビューします！物流ロボットOTTOと連携して商品を配送

マイクロソフト、画像やテキスト内のネガティブなコンテンツを削減する Azure AI コンテンツセーフティを発表

OpenCV を使用した画像の二値化とグレースケール変換

人工知能シナリオにおける HBase の使用

ジェフ・ディーンの長文記事の展望: 2021 年以降の機械学習の 5 つの潜在的トレンド

ニューラルネットワークが適切に機能するには、なぜ十分なパラメータが必要なのでしょうか?

2022年のディープラーニングの5つのトレンド

推薦する

AIの受賞作品の著作権申請が却下されました！著者は624のヒントを与えている

FlashAttention v2 は標準の Attention より 5 ～ 9 倍高速です。大規模なモデルで使用されます。

Nvidiaのアルゴリズムが破られ、RTX30シリーズはマイニング計算能力を100%回復：グラフィックカードの値下げは終わったのか？

グラフやグラフニューラルネットワークについて学びたいですか?論文を読むより良い方法はありません。

OpenAIがSoraを発表: 現実を再定義する画期的なビデオ生成モデル

市場規模が100億ドルに迫る中、外科用ロボットはどのように発展していくのでしょうか？

パラメータ調整器、ここを見てください!ディープラーニングのトレーニング効率を向上させる2つのコツ

スタンフォード大学の学生が出会い系アプリをハッキング！ GAN モデルを使用して男性に変装し、顔認識システムを欺く

文勝ビデオの次の目的地であるメタはすでにビデオ制作を開始している

世界最大の多言語音声データセットがオープンソースになりました! 23言語で40万時間以上

人工知能の時代が到来し、教育は大きく変わるかもしれません。未来の教育は人工知能をベースにしたものになるのでしょうか？

Google、視覚障害者が世界を見るのを助けるAIメガネを開発

MIT の新しい研究: 労働者は AI によって排除されることを心配する必要はありません。コストは非常に高く、視覚的な作業の23％しか置き換えられない

5分間の技術講演 | AI技術と「サイバー暴力」のガバナンス