AIオープンクラス | データのラベル付けについてはあまりご存じないのではないでしょうか?

AIオープンクラス | データのラベル付けについてはあまりご存じないのではないでしょうか?

人工知能の分野が日々急速な発展と進歩を遂げていることは疑いの余地がありません。

携帯電話の電源を入れ、美容アプリのさまざまな AI フィルターを有効にすると、私たちが目にするのは面白いアバターやかわいい表情ですが、アプリが「見る」のは私たちの顔にある何百ものポイントです。

[[285286]]

私たちは長い間、さまざまな AI フィルターに慣れてきましたが、これらのアプリがどのようにして目や鼻がどこにあるかを認識するかについてはほとんど考えていません。

実際、これらすべては、AI 時代の最もかわいらしいけれども、最も見落とされがちな人々のグループのおかげです。彼らは、人工知能の「教師」と呼ばれるデータ ラベラーです。

人工知能の背後にある人工知能

朝8時30分、Xiao Xinは「データラベル割り当てタスクグループ」というQQグループを開き、朝の仕事を始めました。

[[285287]]

グループのオーナーは、今日ラベルを付ける必要のあるビデオと写真をすでにグループに送信していました。Xiaoxin には 3 時間のビデオ録画が割り当てられました。

これは、ある歯科大学の先生が講義中に録画したビデオです。ビデオの内容は主に口腔内の虫歯の紹介と分類に焦点を当てています。Xiaoxinの主な仕事は、ビデオ内の黒い虫歯を見つけ、マウスを使用して虫歯の周りにデジタルの「境界線」を描いてマークすることです。

シャオシンは午前中、ビデオが終わるまで同じ動作を何百回も繰り返さなければなりません。最後に、シャオシンはマークされた新しいビデオをグループにフィードバックして、午前中の作業を終了します。

シャオシンさんは医療専門家ではないので、虫歯の跡が残っている部分の機能が何なのかよく分かりません。しかし、目に見えないところで、小欣は人工知能医療システムの「先生」になっています。大量のデータの反復処理を通じて、AIはどの歯が虫歯であるか、また虫歯の進行度を正確に識別することができます。

シャオシンは「データラベリング」という職業について聞いたことがないかもしれませんが、日々実践的な行動でデータラベラーとしての責任を果たし、機械が大量のデータを通じて学習し、無事に「卒業」できるようにしています。

大波に襲われる一般人

過去2年間で、中国ではデータラベリング企業が大規模に出現し始めており、これは中国の人工知能開発の初期段階で必要とされる大量のデータと密接に関係している。

テクノロジー企業が必要とするデータは膨大であるため、データラベリング企業はラベリング作業の大部分を下請けすることになる。データの波はAIをよりスマートにすると同時に、多くの雇用機会をもたらす。

貴陽市の中心部から50キロ離れた白鳥河デジタルタウンには、500人規模の「データファクトリー」がある。500人のラベル付け作業員のうち、ほぼ半数が近隣の貧困支援専門学校の学生だ。

彼らは月に1,500元を稼ぐことができ、経済的に自立し、家族の収入を補うのに十分であると理解されています。レストランでの料理の提供やテイクアウトの配達などのパートタイムの仕事と比較すると、データラベリングは比較的簡単でまともです。

[[285288]]

貧困緩和専門学校の学生がデータラベリング作業を実施

押し寄せるデータの波は資本と技術を巻き込み、無数の夢と野望を背負って突き進む。資本と野望のもと、無数の一般人は当面はこれらの変化を理解していないものの、変化から利便性と利益を得ることができる。

我々が知らない物語

ほとんどの生徒にとって、「データラベリング」は馴染みのない専門用語であり、校長先生が全員にこの知識を話すのは初めてのことでした。実際、データ ラベリングの分類、データ ラベリング業界の発展と影響、データ ラベリングが完全に人間に依存しているかどうかなど、データ ラベリングをめぐる興味深いトピックは数多くあります...

データのラベリングについて、より深く、より全面的に理解してもらうために、AI大学の第26回科学技術夜間自習会では、iFLYTEKのAIリソース部門の音声データディレクターであるLiu Dan氏を特別に招待し、 12月12日19時にAI大学のライブ放送室に来てもらい、データのラベリングの背景にあるストーリーについて学生たちとチャットしました。

【授業内容】

語られざる物語 - データ注釈

【コース講師】

Liu Dan、iFlytek、AI リソース部門、音声データ スーパーバイザー

【講習時間】

2019年12月12日 19:00(今週木曜日)

【コースリンク】

リンクhttp://www.aidaxue.com/live?id=29&ch=ctoをクリックしてライブコースルームに入室してください。

<<:  Tan Mingzhou: テクノロジーイノベーター - あまり知られていない道│LeaTech Global CTO Leadership Summit レビュー

>>:  人工知能市場の需要と応用

ブログ    

推薦する

...

トランスフォーマー+強化学習、Google DeepMindは世界を知覚するロボットの脳となる大きなモデルを作る

ロボットの学習方法を開発する際に、大規模で多様なデータセットを統合し、強力で表現力豊かなモデル (T...

機械学習の特徴選択のためのPythonツール

[[392070]]特徴選択は、データセット内で最も有用な特徴を見つけて選択するプロセスであり、機械...

...

AIが世界中の産業に及ぼす影響

人工知能は、すでに私たちの世界を微妙かつ広範囲に変化させている、画期的な技術です。クラウド コンピュ...

人工知能は大きな進歩を遂げ、意識の認識が実現した

参加者が50の文章を話している間に神経活動が収集されました。機械学習アルゴリズムは、収集されたデータ...

2021年に理解すべき5つのAIコンセプト

人間の知能は、生物学を模倣することで模倣されるべきでしょうか? それとも、鳥類の生物学が航空宇宙工学...

...

2021 年に注目すべき最新テクノロジー トレンド トップ 10

世界中で大きなデジタル革命が起こっています。技術の進歩により、イノベーション、俊敏性、市場開発が加速...

AI面接ロボットのバックエンドアーキテクチャの実践

01 はじめにAI面接ロボットは、Lingxiインテリジェント音声セマンティックプラットフォームの人...

ChatGPT は月間アクティブユーザー数が 15 億人に達し、他社を大きくリードしています。 50社が6か月間競争し、そのうち80%が自社で立ち上げた企業だった

生成 AI が人気を集め始めてほぼ 1 年が経ちましたが、そろそろ年次総括の時期が来ています。最近、...

農業用トラクターと自動運転技術が出会うとき

ラスベガスで開催された2022年コンシューマーエレクトロニクスショー(CES)で、ジョンディアは、ジ...

アマゾン、AIが女性の求職者に低い評価を与えたため研究チームを解散に追い込まれる

[[246043]]アマゾンの機械学習チームは2014年以来、優秀な人材の求職活動をよりスマートにす...