AIについて何も知らないのに、どうやってAIを開発すればいいのでしょうか?

AIについて何も知らないのに、どうやってAIを開発すればいいのでしょうか?

「カスタム開発された AI モデル」に対する現在の市場需要は 86% にも上ります。

[[346193]]

ただし、このプロセスでは、エンタープライズ ユーザーと開発者は次のような問題に直面することがよくあります。

  • モデルトレーニングの経験不足
  • データ収集と注釈のコストが高い
  • モデルの適応と展開のプロセスは非常に面倒です
  • 長いモデル最適化反復サイクル

では、上記の問題をワンストップで「解決」できるツールはあるのでしょうか?

Baidu EasyDL をチェックしてください。

簡単に言えば、EasyDL はディープラーニングの応用の敷居を大幅に下げます。

AI開発を「家電」を使うのと同じくらい簡単にします。 さらに、トレーニングによって生成される AI モデルの品質は、上級エンジニアが生成したものと同等のプロフェッショナルなものです。

しかし実際には、Baidu は 2017 年末に EasyDL を立ち上げ、2018 年初頭に正式にオープンしました。同時に、「誰もが AI を活用できる」というビジョンを提唱しました。

それで、ほぼ 3 年が経過した今、このビジョンはどこまで実現したのでしょうか?

AIを家電のように使う場合、どの程度信頼できるのでしょうか?

まず、EasyDL の 3 つの主要な機能を見てみましょう。

  • 操作と使用プロセスが非常にシンプルで、モデルのトレーニングはわずか 15 分で完了します。
  • 画像分類モデルのオンライン平均精度が 99% を超えるなど、高精度のトレーニング結果。
  • 豊富な展開方法、クラウド、ターミナル、エッジ展開を完全にサポートします。

1つ目は、EasyDL の使いやすさと敷居の低さです。

使用プロセスは、「モデルの作成」、「データの準備」、「モデルのトレーニング」、「アプリケーションのデプロイ」という 4 つの簡単なステップのみです。

さらに、プロセス全体が視覚的なグラフィックを使用して実行されるため、企業や開発者にとっての使用ハードルが大幅に下がります。

Baidu AI プラットフォーム研究開発部門のテクニカルディレクターである Xin Zhou 氏は次のように述べています。

コードを 1 行も書かずに、ニーズとデータに基づいて独自の AI ソリューションをカスタマイズできます。

工業製造における生産品質検査の分野では、「愛宝花石」を例にとると、荷物の生産工程で残留異物(針、金属部品など)を監視する際に、EasyDLを使用して荷物品質検査モデルをトレーニングします。AIアルゴリズムの詳細を理解する必要がなく、精度率90%のモデルをトレーニングしました。

「Hancai Headhunter」を例にとると、数人の人事専門家がEasyDLを使用して、AIアルゴリズムを理解することなく履歴書データの構造化処理と自動分類モデルを完成させ、スタッフの履歴書検索効率を大幅に向上させました。

しかし、シンプルさはプロ意識を無視することを意味するものではありません。それどころか、両者は「互換性があり、並行している」のです。

「漢才ヘッドハンター」も例外ではありません。高級管理職人材紹介会社として、さまざまな業界の企業情報と人材情報を200万件保有しています。

しかし、非常に「致命的」な問題は、履歴書の検索率が低いため、200 万件のデータの人材プールの利用率が 10% 未満であることです。

EasyDL を使用した後、履歴書データの構造化処理を促進するために複数のモデルをトレーニングし、「候補者機能」と「候補者ポジションレベル」モデルだけで認識率が 95% 以上に達しました。

これまで、Hancai Headhunters はキーワード検索タスクで 1 日に 60 ~ 70 件の適切な履歴書しか見つけることができませんでした。しかし、現在では、95% の精度で 20 分以内に 600 ~ 1000 部のコピーを作成することが可能です。

一言で言えば、Baidu EasyDL は、企業が「カスタマイズされた AI モデル」を家電製品と同じくらい簡単に使用できるようにするだけでなく、上級 AI エンジニアと同じくらい専門的にも使用できるようにします。

さらに、EasyDL は、パブリック クラウド API、プライベート サーバー展開、デバイス側 SDK、ハードウェアとソフトウェアの統合ソリューションなど、さまざまなモデル展開方法もサポートしています。

たとえば、ハードウェアとソフトウェアの統合ソリューションの展開において、EasyDL は特殊な適応と加速をサポートする 6 つのハードウェアとソフトウェアの統合ソリューションを提供し、高、中、低レベルのマトリックス全体をカバーし、モデル認識速度を 10 倍に高めることができます。

機能が豊富なだけでなく、非常に高速で、わずか 5 分で統合できます。

EasyDL の優れた機能はすべて、その背後にある技術的な強みと切り離すことはできません。

EasyDL の機能はどのように実現されるのでしょうか?

ツールやプラットフォームが表面的に見えて使いやすいほど、その背後にある設計は複雑になる可能性があります。

Baidu EasyDLでも同様です。

このプラットフォームは、多くの複雑なディープラーニング アルゴリズムとエンジニアリング テクノロジを使用しており、それらはすべて、シンプルで使いやすく、使用の敷居が低いように設計されています。

EasyDL がモデルで高精度を実現できる重要な理由の 1 つは、Baidu が独自に開発したディープラーニング プラットフォームである PaddlePaddle をベースとしていることです。ワンストップのモデルトレーニングとサービス体験には、Baidu が長年にわたって蓄積してきた独自のテクノロジーとエンジニアリング能力がさらに組み込まれています。

まず、EasyDL は Baidu の超大規模データでトレーニングされた事前トレーニング済みモデルをプリセットします。

視覚タスクでは、画像分類トレーニングタスクに、10万以上のカテゴリと6,500万枚の画像を含む膨大なインターネットデータに基づくBaiduの超大規模視覚事前トレーニングモデルが組み込まれており、平均精度は3.24%~7.73%向上します。

物体検出トレーニングタスクに関しては、800以上のラベル、170万枚の画像、1000万以上の検出フレームに基づくBaiduの超大規模物体検出事前トレーニングモデルは、平均精度を1.78%~4.53%向上させることができます。

自然言語処理に関しては、EasyDL には、Baidu が開発した業界最高の事前トレーニング済みモデルである ERNIE がプリインストールされており、機械の意味理解のレベルを新たなレベルに引き上げます。

EasyDL は、自動データ拡張や自動ハイパーパラメータ検索などの AutoML/DL 自動モデリング メカニズムも提供し、アルゴリズムの基礎知識がまったくないユーザーでも AI を利用できるようになります。

さらに、PaddlePaddle DGC 加速メカニズムに基づいて、EasyDL は重要な勾配 (スパース更新) のみを送信することで通信帯域幅の使用を削減し、分散トレーニングの効率を向上させます。従来の分散トレーニング方法と比較して、トレーニング速度は 70% 以上向上します。

第二に、データ処理の面では、EasyDL は EasyData インテリジェント データ サービス プラットフォームを構築しました。

データのラベリングとデータのクリーニングに関しては、EasyData は 11 のデータラベリング テンプレートと 5 つの標準および高度なクリーニング ソリューションを提供します。

EasyData は、ハードウェアとソフトウェアを統合し、エンドとクラウドと連携する自動データ収集ソリューションも提供しており、データ収集時の機器の選択、デバッグ、統合開発などの面倒で時間のかかる作業を排除できます。

最後に、展開に関して、EasyDL はパブリック クラウド API、デバイス側 SDK、ローカル サーバー展開、ハードウェアとソフトウェアの統合展開という 4 つのソリューションを提供します。

その中で、パブリック クラウド API は弾力的な拡張と縮小をサポートでき、デバイス側 SDK EasyDL は現在、エンドツーエンドのモデル適応サービスを提供しており、15 種類以上のチップ タイプと 4 つの一般的なオペレーティング システムをサポートしています。

これらは EasyDL の強力な機能の背後にあるハードパワーです。

EasyDLを選ぶ理由

需要があるから、それが質問に対する答えです。

人工知能が主導する第四次産業革命は、社会のあらゆる分野に絶えず浸透しており、大企業には一定量の人材の蓄えと技術の蓄積がある場合が多い。

しかし、比較すると、中小企業は、上級開発者のコ​​スト、技術力など、インテリジェンスの閾値が高すぎるため、インテリジェント変革のプロセスで困難に遭遇することがよくあります。

しかし、中小企業は国家経済全体の発展において重要な役割を果たしています。

そのため、このような問題を解決することが「必須」となっています。

だからこそ、EasyDLはオープン後、中小企業から広く認知され、支持されるようになったのです。

EasyDL は 2 年以上にわたって継続的にアップグレードおよび改良され、全体的な製品エクスペリエンスと機能がより充実したものになりました。

これにより、EasyDL は他の AutoDL プラットフォームと比較してより顕著な利点を持ち、より優れた結果を達成できるようになります。

それだけでなく、EasyDL の更新と反復は継続されます。

たとえば、今年のアップグレードの最大のハイライトは、5 月に新しくリリースされた EasyData インテリジェント データ サービス プラットフォームです。

AI 開発シナリオに焦点を当て、業界におけるデータ収集、データクリーニング、データラベリング、データリフローのための完全なワンストップソリューションを開拓しました。

内蔵の超大規模事前トレーニング モデルも今年のアップグレードの中心的な技術的ハイライトの 1 つであり、より高精度のトレーニング結果を提供します。

そして、今年 9 月には、EasyDL がさらに大規模なアップグレードを実施しました。

EasyDL クラシック バージョンでは、カスタマイズされた感情分析、マルチラベル テキスト分類、テキスト エンティティ抽出が NLP 方向に追加され、表形式データの予測分析用の新しい ML 方向が導入され、モデル タイプがさらに充実しました。

データサービス面では、既存のインテリジェントラベリングをベースにしたマルチパーソンラベリングを開始し、データラベリングの効率がさらに大幅に向上しました。

新たに開始されたモデルマーケットは、個人または企業がEasyDLクラシックバージョンのトレーニング済みモデルを市場に公開して販売することをサポートします。また、市場から購入したモデルをデータと組み合わせて再トレーニングし、より良いモデル効果を実現することを革新的にサポートする業界初の製品です。

今後もEasyDLは以下の取り組みを継続していきます。

  • 既存の CV、NLP、ML、音声認識アルゴリズムの種類を拡張するだけでなく、OCR やビデオ トラッキングなどのカスタマイズされた機能もリリースします。
  • モデルのパフォーマンスを継続的に改善し、トレーニング速度を上げ、モデルの推論を加速します。
  • 今後もデータ、モデル、サービスなどの利用のハードルを下げていきます。

この時点で、Baidu EasyDL は「誰もが AI を使える」という当初のビジョンに一歩近づいたと言えるでしょう。

<<:  ニューラル ネットワーク モデルの構築に適した最適化アルゴリズムはどれですか? 35,000件の検査でわかる

>>:  ディープラーニングパーセプトロンの原理の詳しい説明

ブログ    
ブログ    

推薦する

AIの受賞作品の著作権申請が却下されました!著者は624のヒントを与えている

初めて受賞した AI 絵画「スペースオペラ」を覚えていますか?最近また注目を浴びているのが――著者の...

FlashAttention v2 は標準の Attention より 5 ~ 9 倍高速です。大規模なモデルで使用されます。

最近、GPT-4(コンテキスト長32k)、MosaicMLのMPT(コンテキスト長65k)、Anth...

Nvidiaのアルゴリズムが破られ、RTX30シリーズはマイニング計算能力を100%回復:グラフィックカードの値下げは終わったのか?

GPUマイニングで米国証券取引委員会から罰金を科されたNvidiaは、最近、暗号化アルゴリズムが解...

グラフやグラフニューラルネットワークについて学びたいですか?論文を読むより良い方法はありません。

グラフ埋め込み、グラフ表現、グラフ分類、グラフニューラルネットワーク、この記事では必要なグラフモデリ...

OpenAIがSoraを発表: 現実を再定義する画期的なビデオ生成モデル

概要:ほんの数日前、ビッグ アイヴァンが携帯電話でソーシャル メディアをちょっとチェックしたとき、信...

市場規模が100億ドルに迫る中、外科用ロボットはどのように発展していくのでしょうか?

近年、世界各国は医療の発展に継続的に注目しており、スマート医療や精密医療などの概念がこのトレンドを活...

パラメータ調整器、ここを見てください!ディープラーニングのトレーニング効率を向上させる2つのコツ

[[343402]] 1. トレーニングのボトルネックはどこですか? GPU 使用率が低い: モデル...

スタンフォード大学の学生が出会い系アプリをハッキング! GAN モデルを使用して男性に変装し、顔認識システムを欺く

誰かが本当にあなたの顔を真似して、顔認識システムを回避できるのです! 最近、スタンフォード大学の研究...

...

文勝ビデオの次の目的地であるメタはすでにビデオ制作を開始している

テキストガイドによるビデオツービデオ (V2V) 合成は、短編ビデオの作成や映画業界全体など、さまざ...

世界最大の多言語音声データセットがオープンソースになりました! 23言語で40万時間以上

[[416170]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

人工知能の時代が到来し、教育は大きく変わるかもしれません。未来の教育は人工知能をベースにしたものになるのでしょうか?

「大作 SF 映画」を見るのが好きな学生にとって、最も気に入っているのは、映画に遍在する人工知能か...

Google、視覚障害者が世界を見るのを助けるAIメガネを開発

海外メディアの報道によると、オランダの新興企業EnvisionはGoogle Glassと提携し、視...

MIT の新しい研究: 労働者は AI によって排除されることを心配する必要はありません。コストは非常に高く、視覚的な作業の23%しか置き換えられない

人工知能は私たちの仕事を奪うのでしょうか?シリコンバレーの幹部が今日の最先端の AI テクノロジーに...

5分間の技術講演 | AI技術と「サイバー暴力」のガバナンス

パート01 「ネットいじめ」とは何ですか? 「サイバー暴力」とは、インターネット上で文章、画像、動画...