この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 優れたジェスチャー認識 AIになるには何が必要ですか? 姿勢を絶えず変えて、リアルタイムで絵文字を出力できるのはかなりクールです。 それはガード(間違い)で、「スタートレック」のバルカン人の敬礼です。これは一般的には使用されず、実行するのが困難な場合もあります。 それは幸運を意味し、人々は通常両手で比較します。しかし、それは人間にとって普遍的なジェスチャーではありません。 それでも、AIはそれを巧みに識別しました。さらに、ブラウザ上でもほとんど遅延なく動作します。 AI の父親は Nick Bourdakos (略して「ニック」) という名の IBM のプログラマーです。 △ 666 Nick は、リアルタイム認識を簡単にするTensorFlow.jsを使用しています。 彼はそのアルゴリズムをオープンソースにして、誰でも試せるようにした。 たった30分 Nick 氏によると、このモデルは非常にシンプルで、 SSD-MobileNetだそうです。 MobileNet は分類用、SSD はターゲット検出用であり、これらを併用することも一般的な方法です。 彼は IBM クラウドの GPU、無料の k80を使用してトレーニングを行い、トレーニングの完了にはわずか 30 分しかかかりませんでした。 トレーニングを開始する前に、まずデータを準備する必要があります。AI はラベル付けされたジェスチャ マップをフィードします。 準備ができたので、モデルをインストールしましょう。
その後、トレーニングを開始できます。
もちろん、IBM Cloud や GPU を使用する必要はありません。 CPUを使用して AI を調整することもできますが、おそらく数時間かかります。 トレーニングが完了したら、ブラウザで実行します。 GitHub プロジェクトには、TensorFlow.js モデルに変換するためのスクリプトが付属しています。 React アプリにモデルを追加します。 nmp startと入力し、ブラウザでhttp://localhost:3000を開きます。 やった、これで画面に向かって指を振ると AI が理解するようになりました: もちろん、この賢い AI は指を認識する以上のことができます。 飲む それはすべて、AI に入力するためにどのようなデータを使用するかによって決まります。 かつてニックは、AI がソーダを区別する能力を訓練するのを手伝いました。 質問 1 : スプライトのボトルとカナダドライのボトルはどちらも緑色です。 位置が変わっても、ボトルが横向きになっても、AIは混乱しません。見てみましょう: 質問 2 : 難易度を上げてください。どちらのボトルもマウンテンデューで、1 本は通常タイプ、もう 1 本は低糖タイプです。 AIはそれでもためらうことなく違いをはっきりと見分けることができます。 彼はジェスチャーとソーダの区別が得意です。 そこで質問ですが、 AI に何を認識させたいのでしょうか? 考えがまとまったら、調整を始めましょう。コードは次のとおりです。 https://github.com/cloud-annotations/training/ PS 何人かの友人はすでにこれをうまくテストし、簡単だと言っています。 △認識結果が絵文字で表示されるともっと良い |
<<: マイクロソフトリサーチアジアと教育省が協力し、AI産業と教育の統合に向けた双方にメリットのあるエコシステムの構築に取り組んでいます。
>>: 非常に便利な無料データマイニングツール 19 個のコレクション!
1月8日、OpenAIのCEOサム・アルトマン氏は、タイム誌編集長とのインタビューで、昨年末に同社と...
3月21日、北京でiCityスマートシティカンファレンスが開催され、JD CityがJDグループの第...
[[418811]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...
機械学習とは何ですか?答えるのに 10 秒かかります。 …分からない?あなたはまだ人工知能業界で働き...
今年に入ってから、わが国の5G開発は加速しており、各地の5G建設は設定された目標を完了し、5G商用化...
[[392372]] 4月9日、注目されていた「初の顔認証事件」の最終判決が下された。被告杭州野生動...
[[403771]]機械学習における重要な研究はモデルの一般化を改善することであり、モデルをトレーニ...
[[388530]] [51CTO.com クイック翻訳] 「人工知能」は今日では人気の用語となり、...
エッジ コンピューティングは、急成長しているモノのインターネットの成長に不可欠です。最近、機械学習と...
機械アルゴリズムのディープラーニングは、ビジネスの世界に多くの変化をもたらしました。定義上、これは人...
[[263447]]人工知能技術の継続的な導入は、新たな産業発展の中核的な原動力となり、さまざまな...
[[221538]]人工知能とは何ですか? 「第一次産業革命における蒸気機関、第二次産業革命における...
百度AI開発者会議は予定通り7月4日から5日まで北京国家会議センターで開催されました。百度の創業者、...
[[249742]]人工知能システム用の新しいコンピュータチップが利用可能になりました。プリンストン...