人工知能が私たちの生活に大きな利便性をもたらすことができるのは、その背後に多くの機能があるからです。その中でも、データのラベリングは欠かせないものなのです! では、データラベリングとは一体何でしょうか? データラベリングはなぜ人工知能において重要な役割を果たすのでしょうか? 今日、Daxuejun がデータラベリングの謎を解き明かします。
データのラベル付けとは、簡単に言えば、テキスト、音声、画像、ビデオなどにマークを付け、アルゴリズムがこれらのラベルを理解し、学習を続け、最終的にインテリジェントな結果を達成できるようにすることです。 データラベリングを初めて学ぶ人にとって、上記の説明は少しわかりにくく、難解に感じるかもしれません。データラベリングをよりよく理解していただくために、次のような例え話をしました。 初期の人工知能ソフトウェアは、何も知らない新生児に例えることができます。そのため、赤ちゃんに周囲のものを認識できるように教え、これは鼻で呼吸に使うもの、これは口で話したり食べたりするのに使うものなどを伝える必要があります。人工知能についても同じことが言えます。機械に鼻と口の写真を与え、写真の中の鼻と口を指摘する必要があります。すると、機械は写真の中の鼻と口の特徴を学習し、ラベルを付けることで、それらを認識できるようになります。 それでも赤ちゃんを比較対象として使うのが複雑だと思うなら、もう一つ現実の例を挙げてみましょう。 退勤時の出勤記録用の指紋打刻機は誰もが知っていると思いますが、人工知能の原理も同様です。タイムレコーダーを使用する際は、まず従業員の指紋を入力し、次に指紋に対応する従業員の名前または番号を設定します。機械がそれを確認した後は、従業員は指紋を入力するだけでよく、機械は将来それを認識できるようになります。これは人工知能の最も単純な原理です。まず情報を入力し、次に機械がその情報を認識し、それを出力します。 もちろん、実際のデータラベリングはほとんどの場合、指紋入力よりもはるかに複雑ですが、基本的には一般の人が理解して習得できるレベルを超えることはありません。ただし、一部のデータラベリング作業にはトレーニングも必要です。これは、さまざまなシーンや照明によってさまざまな物の見え方が変わるため、人工知能はさまざまな種類や状態の物の写真を見たことがある必要があるためです。そのためには、さまざまなシーンでの物の写真という大量の基礎データが必要です。 データアノテーションの役割は、人工知能に提供される大量の画像からさまざまなシーン内の対象オブジェクトを見つけ、それを人工知能が認知を練習するためのトレーニングデータとして使用することです。 近年、中国政府は人工知能の技術進歩と産業発展を非常に重視しており、人工知能は今や国家戦略となっている。全国人民代表大会常務委員会は、立法理論の研究を強化し、人工知能、ブロックチェーン、遺伝子編集などの新技術・新分野に関連する法的問題の研究に重点を置く必要があると述べた。 データラベリング業界では、「知能と同じくらい人工知能も存在する」という有名な格言があります。人工知能産業が急速に発展するにつれ、「人工知能の先生」として機能するデータラベラーという新しい職業の需要と人材の数は確実に増加するでしょう。 |
>>: 人工知能と機械学習はエンタープライズアーキテクチャの一部となっている
[51CTO.com オリジナル記事] この記事では、現在市場にあるデータサイエンスや機械学習に適し...
遠隔医療の普及に伴い、便利で効率的な医療サポートを求める患者にとって、オンライン医療相談が第一の選択...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
編集:王昊、千山企画丨張傑新型コロナウイルス感染症の世界的大流行の発生と拡大により、過去2年間にわた...
画像ソース: https://pixabay.com/images/id-1069218/ 2024...
グラフ埋め込み、グラフ表現、グラフ分類、グラフニューラルネットワーク、この記事では必要なグラフモデリ...
ソートとは、もともと無秩序だったシーケンスを、順序のあるシーケンスに並べ替えることを意味します。ソー...
AI がますます多くの業界で採用されるようになるにつれ、AI のユーザーは、実用性を効果的に維持しな...