人工知能の分野が日々急速な発展と進歩を遂げていることは疑いの余地がありません。 携帯電話の電源を入れ、美容アプリのさまざまな AI フィルターを有効にすると、私たちが目にするのは面白いアバターやかわいい表情ですが、アプリが「見る」のは私たちの顔にある何百ものポイントです。
私たちは長い間、さまざまな AI フィルターに慣れてきましたが、これらのアプリがどのようにして目や鼻がどこにあるかを認識するかについてはほとんど考えていません。 実際、これらすべては、AI 時代の最もかわいらしいけれども、最も見落とされがちな人々のグループのおかげです。彼らは、人工知能の「教師」と呼ばれるデータ ラベラーです。 人工知能の背後にある人工知能朝8時30分、Xiao Xinは「データラベル割り当てタスクグループ」というQQグループを開き、朝の仕事を始めました。
グループのオーナーは、今日ラベルを付ける必要のあるビデオと写真をすでにグループに送信していました。Xiaoxin には 3 時間のビデオ録画が割り当てられました。 これは、ある歯科大学の先生が講義中に録画したビデオです。ビデオの内容は主に口腔内の虫歯の紹介と分類に焦点を当てています。Xiaoxinの主な仕事は、ビデオ内の黒い虫歯を見つけ、マウスを使用して虫歯の周りにデジタルの「境界線」を描いてマークすることです。 シャオシンは午前中、ビデオが終わるまで同じ動作を何百回も繰り返さなければなりません。最後に、シャオシンはマークされた新しいビデオをグループにフィードバックして、午前中の作業を終了します。 シャオシンさんは医療専門家ではないので、虫歯の跡が残っている部分の機能が何なのかよく分かりません。しかし、目に見えないところで、小欣は人工知能医療システムの「先生」になっています。大量のデータの反復処理を通じて、AIはどの歯が虫歯であるか、また虫歯の進行度を正確に識別することができます。 シャオシンは「データラベリング」という職業について聞いたことがないかもしれませんが、日々実践的な行動でデータラベラーとしての責任を果たし、機械が大量のデータを通じて学習し、無事に「卒業」できるようにしています。 大波に襲われる一般人過去2年間で、中国ではデータラベリング企業が大規模に出現し始めており、これは中国の人工知能開発の初期段階で必要とされる大量のデータと密接に関係している。 テクノロジー企業が必要とするデータは膨大であるため、データラベリング企業はラベリング作業の大部分を下請けすることになる。データの波はAIをよりスマートにすると同時に、多くの雇用機会をもたらす。 貴陽市の中心部から50キロ離れた白鳥河デジタルタウンには、500人規模の「データファクトリー」がある。500人のラベル付け作業員のうち、ほぼ半数が近隣の貧困支援専門学校の学生だ。 彼らは月に1,500元を稼ぐことができ、経済的に自立し、家族の収入を補うのに十分であると理解されています。レストランでの料理の提供やテイクアウトの配達などのパートタイムの仕事と比較すると、データラベリングは比較的簡単でまともです。
貧困緩和専門学校の学生がデータラベリング作業を実施 押し寄せるデータの波は資本と技術を巻き込み、無数の夢と野望を背負って突き進む。資本と野望のもと、無数の一般人は当面はこれらの変化を理解していないものの、変化から利便性と利益を得ることができる。 我々が知らない物語ほとんどの生徒にとって、「データラベリング」は馴染みのない専門用語であり、校長先生が全員にこの知識を話すのは初めてのことでした。実際、データ ラベリングの分類、データ ラベリング業界の発展と影響、データ ラベリングが完全に人間に依存しているかどうかなど、データ ラベリングをめぐる興味深いトピックは数多くあります... データのラベリングについて、より深く、より全面的に理解してもらうために、AI大学の第26回科学技術夜間自習会では、iFLYTEKのAIリソース部門の音声データディレクターであるLiu Dan氏を特別に招待し、 12月12日19時にAI大学のライブ放送室に来てもらい、データのラベリングの背景にあるストーリーについて学生たちとチャットしました。 【授業内容】 語られざる物語 - データ注釈 【コース講師】 Liu Dan、iFlytek、AI リソース部門、音声データ スーパーバイザー 【講習時間】 2019年12月12日 19:00(今週木曜日) 【コースリンク】 リンクhttp://www.aidaxue.com/live?id=29&ch=ctoをクリックしてライブコースルームに入室してください。 |
<<: Tan Mingzhou: テクノロジーイノベーター - あまり知られていない道│LeaTech Global CTO Leadership Summit レビュー
Dim N2 (30) Longは2の累乗されたデータを格納するために使用されるDim Script...
[[258853]]人工知能は今年の全国人民代表大会で注目の話題の一つとなった。多くの代表者や議員は...
この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...
最近、教育部は「教育部の高等大学教育の建設を加速し、人材育成能力を全面的に向上させることに関する意見...
コード設計では、このようなシナリオによく直面します。2 つの要素が与えられた場合、それらが同じセット...
データ センターは、他のテクノロジー ベースの業界と同様に、革新を続けなければ成功できません。従来の...
Microsoft は、大規模言語モデルのパフォーマンスを向上させる新しいツール、Jigsaw を発...
ここ2日間、アメリカ人女性歌手テイラー・スウィフトが中国語を話す短い動画が、さまざまなソーシャルプラ...