1996年生まれの美女が劉強東の豚顔認識選手権で優勝し、賞金30万元を獲得した。

1996年生まれの美女が劉強東の豚顔認識選手権で優勝し、賞金30万元を獲得した。

[[213872]]

レポーターハト

先ほど、JDD-2017 JD Finance Global Data Explorer Competition 決勝の優勝者が発表されました。アルゴリズム グループの優勝者 4 名は次のとおりです。

  • 着陸行動認識チャンピオン:チアリーダー

  • 店舗売上予測チャンピオン:リトルママオ

  • 信用需要予測のチャンピオン:リトルタイガース

  • 豚の顔認識チャンピオン:ペッパピッグ

ビジネスグループの第1位、第2位、第3位の受賞者は次のとおりです。

  • チャンピオンの巨大豚の攻撃

  • 準優勝: Xiangchuang Technology

  • 3位: エントロピービジネステクノロジー

その中でも、ビジネスグループのチャンピオンである「進撃の巨人」の中身の美女は、実は96歳の少女です。彼女は本当に美しさと知恵を兼ね備えています。

JD Finance副社長兼技術研究開発部ゼネラルマネージャーの曹鵬氏によると、JDDコンテストのアルゴリズムグループの優勝チーム4チームにはそれぞれ30万元の賞金が授与され、ビジネスグループの優勝者、準優勝者、3位の受賞者、および***インターネット人気賞の受賞者には、それぞれ約30万元、20万元、10万元、5万元の賞金が授与される。

同時に、アルゴリズムグループでは、すべてのチャンピオンチームがJD Financeからオファーを受け取ります。

さらに、ビジネスグループの優勝者がビジネスを始めたい場合、JD Financeとそのパートナーが設立した1000億の投資ファンドから直接投資を受ける機会が与えられます。

この大会には、アルゴリズム部門3,783チーム、ビジネス部門841チームを含む、全世界から合計4,624チームが登録したと報じられている。チームメンバーは、コロンビア大学、カーネギーメロン大学、清華大学、北京大学、中国科学院計算技術研究所、マイクロソフト、IBM、テンセントなどから来ており、一部は蘭翔工業学校からの参加です。

決勝にはアルゴリズムグループ20チーム、ビジネスグループ16チームを含む36チームが出場しました。

36 チームが JD.com 本社で 48 時間のクローズドオフライン決勝に参加し、最終的に 4 つのアルゴリズム グループ問題のチャンピオンを決定しました。しかし、ビジネスグループには現地での防衛セッションもあります。

公式筋によると、決勝にはシンガポール、香港、台湾からの出場者もおり、平均年齢は25歳だという。 (若くてかっこいい奴らばかりなのに、かわいそうな大隊長はもう40代…)

このコンテストでは、大隊の指揮官は優勝者のバラエティ・ピッグ・マンにインタビューし、彼らがなぜそれほど素晴らしいのかを知る機会を得ました。

豚の顔認識チャンピオン:バラエティ・ピッグマン

JDD競技アルゴリズムグループ「豚の顔認識」競技テーマ決勝戦参加チームのうち、「豚男」のメンバーは、全員が世界的に有名なIT企業のアジア研究所の出身者であり、中国中山大学と科学技術大学の学生でもあります。

[[213873]]

今回のコンテストに参加したきっかけは、キャッチーなタイトルのWeChat記事と、「豚の顔認識」という斬新で興味深いコンテストテーマに惹かれたことだそうだ。当時、チームの博士課程の学生がWeChatで「優勝賞金は30万元!」という記事を目にしました。劉強東は「豚の顔認識」コンテストを主催し、中国と米国で同時に開始しました(詳細なコンテストスケジュールとコンテストテーマの説明付き)」(ああ、これは以前大隊長が書いた記事ではありませんか?クリックして読んでください)。視覚認識分野の研究者である彼はすぐに興味を持ちました。JDDコンテストの賞金30万元と、国際人工知能連盟の取締役会長である楊強を含む強力なメンターチームを見て、彼は研究所でインターンシップをしている他の2人の友人を引き入れてチームを結成し、コンテストに参加しました。

コンテストに参加した最後の理由について言えば、3人は視覚認識の分野で研究に従事しており、これまで多くの関連する学術的探究を行ってきました。同時に、人間の顔認識技術は比較的成熟していますが、豚の顔認識技術は実際には人間の顔認識よりも難しいです。豚は人間のようにカメラを向くことができないためです。そのため、認識する必要があるのは顔だけでなく、体の全体的または部分的な特徴である可能性があり、これもチームにとって新しい挑戦です。同時に、彼らは、豚の顔認識技術が成熟できれば、この技術を牛や馬の顔に転用するのは簡単だと感じています。そのため、非常に幅広い技術的展望があり、非常に価値のある探究です。

[[213874]]

競技プロセスについて、チームは、AI技術を使用して視覚認識を実現する原理は基本的に同じであり、つまり、コンピューターニューラルネットワークのディープラーニングを使用して各豚の特徴を学習し、次にディープラーニングモデルを使用してテストデータセットの各豚の確率を取得し、それを使用してどの豚がどの豚であるかを判断すると述べました。彼らの主な仕事は、モデルコードを書き、モデルにテストセットデータを実行させて結果を得ることです。モデルの実行は比較的定型的な作業内容ですが、参加チームのレベルは非常に高く、競争は熾烈です。時には、眠りから覚めた時に、他の参加者のモデル計算結果がすでに自分のものよりはるかに進んでいることに気づくでしょう。そのため、競争プロセス全体を通して、モデル計算結果に応じてモデルパラメータを常に調整し、複数のモデル間の各部分の割合を1つのモデルに調整することが、勝敗を決める重要な要素となっています。この大会での各チームのパフォーマンスのリアルタイムランキングは、チーム同士が競い合い、優勝者を決めるプラットフォームにもなっており、「Pig Man」チームはそれが非常に良いことだと考えています。

コンテスト参加による成果について、「豚男」チームは、このコンテストで得られた最大の成果は、コンテストで得られた結果がチームのこれまでの予想を完全に上回ったことだと述べています。データセットを入手したとき、チームメンバー自身でさえ、どの豚がどれであるかを見分けるのが困難でした。モデルでデータを実行した後、コンテストの効果は顔認識のモデルを実行した場合よりも優れていることがわかりました。このコンテストでは、視覚認識技術は人間の顔だけでなく、他の動物の顔も認識できるという1つのことが証明されました。これにより、チームメンバーはコンテストの初期段階で説明された技術の展望に期待を寄せるようになりました。豚の顔認識技術は、近い将来、農家の張氏が多くの問題を解決するのに役立つ可能性があります。もう一つの大きなメリットは、このコンテストが限られた時間内で問題を解決するという課題を与え、コードプログラミング、モデルの適用、その他の能力を成長させることができたことです。例えば、コンテストに参加する前は、どのモデルが優れているか劣っているかわかりませんでしたが、このコンテストを通じて、使用する最適なモデルを直接選択する経験が得られました。これは、これまでの学術研究では達成が困難だった成長です。

同時に、JD Financeが提供したデータセットも「Pig Man」チームに感銘を与えました。AIの学術研究は他の科学研究とは異なり、データ、特に大規模、多次元、高品質、実際のデータに大きく依存しています。これらのデータがなければ、モデルの実験と改善は不可能です。JD Finance JDDコンテストが出場者に提供したデータは、次元の豊富さとデータの量の両方の点で、同様のコンテストでは珍しいものです。同時に、このコンテストのデータセットの大きな特徴は、その信憑性です。彼らが参加した以前のコンテストでは、データセットの多くは「クリーン」、つまり明確で標準的で識別しやすい画像データでしたが、実際のアプリケーションシナリオで取得された素材はそれほど理想的ではないことがよくあります。JD Finance JDDコンテストで提供されるデータセットはより現実的であり、学術研究に従事する彼らのチームだけでなく、あらゆるAI開発チームにとっても非常に貴重で珍しいものです。

[[213875]]

「豚男」チームは、JDDコンテストに参加するために、会社にいるときはいつもコンピューターに豚の写真を表示していたという。知らない同僚が通り過ぎるのを見ると、とても驚いて不思議そうな顔をすることがよくあったという。チームの3人のメンバーは全員テクノロジー研究に注力しており、ビジネスにおけるテクノロジーの理解はまだ比較的未熟であるため、決勝戦でビジネスリーダーのアイデアや意見を聞くのを実際に楽しみにしています。彼らは、彼らのアイデアと自分たちのアイデアの違いを理解したいと考えています。たとえば、彼らが今思いつくのは、農場にカメラを設置して、どの豚がどの豚であるかを農家に知らせることだけです。商業的なアプリケーションの見通しと価値については、ビジネスリーダーの意見を聞きたいと考えています。

講師インタビュー

このコンテストには、コンテストの4つの方向性に応じて合計4人のメンターがいると報告されています。

  1. 豚の顔認識メンター:国際人工知能連盟の取締役会長、香港科技大学コンピュータサイエンス工学部ディレクターのヤン・チアン氏

  2. 店舗売上予測メンター:セコイア・キャピタル・チャイナ・ファンドの専門パートナー、チェ・ピンジュエ

  3. ログイン行動認識講師:TalkingData CEO 崔暁波氏

  4. クレジット需要予測メンター: Zheng Yu、Microsoft Research Asia の都市コンピューティング責任者、アメリカコンピュータ協会の著名な科学者

AI Technology Base Campでは、このコンテストに関する重要な情報について、メンターに早速インタビューしました。この情報が皆様のお役に立てば幸いです。

AI Technology Base Camp: この JDD コンテストについて、何か特別な思いはありますか?

崔暁波氏:全体的に見て、今回のJD Financeの競争で最も重要なことは、大量の高品質のデータを公開したことです。これがプレーヤーを引き付ける最も重要な理由です。

データとアルゴリズムの関係は、血液と心臓のようなものです。

AIテクノロジーベースキャンプ:学生にとって、JDDのような活動に参加することの具体的な意義は何でしょうか?

鄭宇:今回のアルゴリズムグループには学生がたくさんいます。彼らは通常、学校でトレーニングを受けます。彼らにはいくつかのデータとベンチマークが与えられます。アルゴリズムを使用して結果を生成した後、それをベンチマークと比較して精度をランク付けします。彼らは商業化がどのようなものになるかを考える必要はまったくありません。

しかし、今回のコンテストでは実際のデータと商用シナリオが使用され、参加者はその結果を実装する必要があるため、まったく異なる課題が生じます。

なぜなら、学生たちはこれまで教科書に載っているアルゴリズムプログラムだけをやっていましたが、実際のデータを使用すると、それがこれまでとはまったく異なることに気づき、実際のシナリオでさまざまな問題に遭遇するからです。

学生の中には、自分は学業成績が良く、アルゴリズムが得意だと思っている人もいます。実際はそうではありません。シナリオの中でさまざまな現実の問題に遭遇することが、学生にとって最大のトレーニングと助けになります。

今後、AI人材の教育は学校という密室の中で行われるだけではいけないと思います。私たちが育成する人材が本当に社会に役立つものとなるためには、実際のシナリオで実際のデータ推論を行う必要があります。

Che Pinjue:実際、企業が重要な競争に勝てば、私たちは非常に高い評価を与えます。

今日の業界では、最も効果的なトレーニングは、コンテストに参加し、コンテストで自分のアイデアとアルゴリズムを常に最適化することです。最も現実的な状況を発見するには、コンテストに参加する必要があります。

AI テクノロジー ベース キャンプ: 楊強教授はこれまでずっと転移学習に注力してこられましたが、金融業界には転移学習の良い例や特別な例があると思いますか?インターネットバンキングも含みます。

楊強:例えば、金融業界で一番身近なものはローンです。ローンにはさまざまな顧客層がいます。例えば、小口ローンやマイクロローンは数千万人規模の大規模な顧客層を抱えており、比較的簡単です。しかし、銀行では頻度の低い現象ですが、多額の融資を受けている VIP 顧客も存在します。このタイプの顧客をモデル化するには、ディープラーニングや多くの学習方法でビッグデータのサポートが必要です。

現在、一つの側面として、転移学習を使用して、ビッグデータに基づく小口融資を、スモールデータに基づく大口融資に移行することが挙げられます。私たちもいくつかの試みを行っており、例えば前回、会社のためにいくつかの試みを行い、改善を達成しました。

しかし、もっと興味深いケースがあります。金融業界のケースは、多くの場合、一度に改善されます。さまざまな規制上の理由により、このデータをどのようにモデル化すればよいのでしょうか。1つの方法は移行です。たとえば、別のシナリオでモデルを構築した場合、このモデルをプライベートシナリオに移行して、ローカルに適応させることができます。現在、新しい試みを行っており、効率と効果の向上の問題、さらに重要なプライバシーの問題を同時に解決できることがわかっています。

AI テクノロジー ベース キャンプ: このコンテストを通じて、参加者が改善すべき分野がわかりますか?商業プロジェクトにはどのような才能が必要ですか?

鄭宇:1つは、科学とシナリオ統合の両方を理解している応用志向の人材です。1つのシナリオを完了した後、それを別のシナリオに適用できる人材です。このような人材は比較的少ないです。

参加者は若く、情熱的でアイデアに溢れているという印象も一般的だが、表現はもっと簡潔にする必要がある。実際、話せば話すほど、人々の記憶は薄れていきます。

楊強:全く同感です。コミュニケーションと集中力の面では、学生チームは特に10の方向と20の問題に集中する傾向がありますが、ビジネスチームは1つの方向に集中する傾向があります。この能力は、まだ実践を通じて習得する必要があります。人工知能やビッグデータについて語るとき、おそらく今最も重要な話題は実装ですが、それをどのように実装するかは集中力に関係しています。

Che Pinjue: 実際、どんな製品でも、誰がそれを支払うのか、そしてそれが誰に役立つのかを理解する必要があります。誰かが喜んでお金を払ってくれるレベルまで、すべての機能を統合する必要があります。

レオ・クイ:まずは産業発展の問題です。まずはデータフローの問題だと思います。ここ数年、私たちは取引や交換を通じてデータフロー全体を実現できるかどうかについて話し合ってきました。今、私は商業的な観点からは失敗だと考えています。本当に質の高いデータを持つ企業は、オープンになりたがりません。例えば、私は彼らがデータを取引しているのを見たことはありません。第二に、政府のデータリソースが開発されていません。この点と米国の間にはギャップがあります。米国のデータは非常によく整理されており、非常に高品質です。

また、データ取引所も各地で構築されていますが、実際の商業基盤がありません。その理由は何でしょうか?

データは取引できないため、米国では、データは取引できないが、アルゴリズムやモデルは商業化できるという認識に移行しており、これは基本的に現在進行中のプロセスです。

人材といえば、弊社にもこの分野を専門とする人材が多くいるので、楊強教授がおっしゃったデータサイエンティストのように、キャリアパスもいくつかに分けていますが、最初のものはどんどん細分化されていくと思います。以前は、プロダクトマネージャーをプロダクトマネージャーと呼んでいましたが、現在、弊社のビジネス慣行では、専任のデータプロダクトマネージャーが登場しています。彼らはデータを製品に変換するのではなく、専門的なシナリオアプリケーションに変換する人です。彼らはビジネスをよく理解し、どのシナリオでデータを使用し、モデルを構築し、評価できるか、どのビジネスシナリオでデータを使用できるかを知っている必要があります。そのような人は非常に少ないです。

第二に、中国のエンジニアリングは非常に貧弱です。過去にはソフトウェアを扱っていた人たちはソフトウェアエンジニアリングを持っていましたが、今ではデータエンジニアリングとデータガバナンスのスキルと手法の両方が欠けています。これは全体的なプロセスの一部です。昨年もこの問題について議論しました。効率が低いため、データの 90% は商用モデルに適用できません。80% がデータ処理用だからです。しかし、これが私たちのビジネスで最も価値のある部分です。データをモデリングやエンジニアリングに使用できるデータに処理するには、この部分を埋める大きなギャップがあると思います。

AI技術基盤:ビッグデータ企業のデータが本物で有効かどうかはどうやって判断するのでしょうか?データの真正性を検証するのは非常に面倒な作業なので、データの良し悪し、優劣、真実か偽りかを判断できる人は誰もいません。

崔暁波:チェ教授がおっしゃったように、基本的な検証方法がいくつかあります。私たちが基本サンプルマッチングと呼んでいるものや、部分サンプル判定などがあります。これは当社の品質管理の部分です。当社に入ってくるすべてのデータは品質検査を受けます。私は3つの方法でテストします。まず、データバッチには品質指標があります。

2 つ目は、ビジネス指標の観点からです。まず、ビジネス シナリオで測定を行い、このビジネス シナリオでデータ モデルがビジネスの CPI と LOY をどの程度改善したかを測定する必要があります。特に明確なビジネス指標が必要です。予測を例に挙げてみましょう。ダブルイレブンの期間中、私たちはクライアントの売上予測モデルの作成を支援しました。昨年の売上予測は不正確だったため、3億元以上の損失を直接被りました。今年はこのモデルを約3か月間使用し、さまざまなデータ機能を活用しました。そのため、データモデルはビジネスにとって価値があります。

楊強:これはまだ皆が議論している問題です。この種の監督と規制はつい最近発表され、皆がさまざまな憶測を目にしています。私の個人的な解釈はこうです。まず、国は金融機関に強力な技術力を持つことを要求し、次に金融機関自身がこの能力を持たなければなりません。そうすることで、金融機関は革新を続けることができるようになります。

2つ目は、金融機関の金融機能は第三者が行うことはできないため、自ら行う必要があるということです。これは、海外で長い歴史を持つ金融サービスを排除するものではありません。JD Financeは、独自のデータ、高頻度データを持っているという点で特にユニークな利点があり、このデータはオンラインビジネスのシナリオと密接に関連しています。この組み合わせはオープンな検討事項であるため、現在は誰もが異なる解釈をしていると思いますが、安全を前提として金融イノベーションをどのように行うかは、国にとっても、膨大な数の金融ユーザーにとっても良いことだと思います。

コンテストに関する背景情報

このコンテストは中国と米国で同時に開催されていると報じられている。コンテストの主なテーマは、ログイン行動認識、店舗売上予測、信用需要予測、豚の顔認識の4つで、各テーマにはアルゴリズムグループとビジネスグループがある。

豚の顔認識が知乎で35万回以上視聴されたことは特筆に値する。

この問題では、豚の顔認識を使用して、養豚農家が各豚の身元を識別し、飼育プロセスにおけるさまざまな豚のさまざまな活動を記録し、豚が活動的かどうか、放し飼いかどうか、病気にかかっているかどうかを判断できるようにします。これは、食品の安全性、飼育管理などの分野で役立ち、さらに農家に信用や保険などの金融サービスも提供します。

興味深いエピソードとしては、豚の最もリアルで包括的な写真を提供するために、JD Finance の 20 人以上の AI エンジニアが養豚場に 2 日間滞在し、3 つのグループに分かれて 105 頭の豚の写真を収集したというものがあります。豚 1 頭の写真を撮るのに 3 枚のカードが必要でした。

[[213876]]

ログイン行動認識問題では、主に競技シミュレーションデータ内のユーザーのログイン行動情報に基づいて、取引が危険であるかどうかを予測し、それによってログイン行動認識のためのビジネス解釈可能なモデルを構築し、アカウントのログイン行動を判断することが求められます。

JD Financeの副社長兼技術研究開発部門ゼネラルマネージャーであるCao Peng氏によると、今回のコンテストでのアルゴリズムグループのチームパフォーマンスは、すでにJD Financeが現在使用している同様のモデルの技術レベルに非常に近いとのことだ。

添付されているのは、JDD-2017 JD Finance Global Data Explorer コンペティション決勝アルゴリズム グループ 4 のチャンピオンと、ビジネス グループ チャンピオン、準優勝、第 3 位の順位です。

[[213877]]

[[213878]]

[[213879]]

[[213880]]

[[213881]]

<<:  感情分析に NLP を使用する理由は何ですか?

>>:  ビッグデータと AI を現代の教育とどのように組み合わせることができるでしょうか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

機械学習を活用して人事部門の時間を節約する方法

導入履歴書データベースに「ソフトウェア エンジニア」という名前の履歴書が 10,000 件あるとしま...

...

...

OpenAIがChatGPT Enterprise Editionをリリース、より高いセキュリティとプライバシー保護を実現

8月29日、OpenAIは、企業ユーザーのニーズを満たし、より高いセキュリティとプライバシー保護を提...

C# データ構造とアルゴリズムのシーケンス テーブルの簡単な分析

C# データ構造とアルゴリズムのシーケンス テーブルとは何ですか?まず、C# のデータ構造とアルゴリ...

この中国のAIスタートアップはトップカンファレンスのコンペティションで優勝し、そのコードはオープンソース化された。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AIがCIOの役割をどう変えるのか

破壊的技術により、CIO はこれまで以上に重要な役割を果たすようになっています。 CIO の役割は長...

自然言語処理 (NLP) 開発で注目に値するオープン ソース ツールにはどのようなものがありますか?

インテリジェント音声アシスタントとチャットボットは、現在人工知能のホットスポットであり、画期的な進歩...

人と「人」の対立を実感する: よく使われるAIセキュリティツールのインベントリ

今日、サイバー犯罪者は機械学習や人工知能などの新しいテクノロジーを使用して、標的の行動をより深く理解...

...

5つのユニークで興味深いChatGPTコマンド

今日は、非常に実用的な 5 つの指示を紹介します。これらの指示は、出力コンテンツの一貫性、記事のスタ...

北京冬季オリンピックのブラックテクノロジーが外国人に賞賛される:このロボットがある限り、防疫は安全

昨日、北京冬季オリンピックはブラックテクノロジーでいっぱいだとネットユーザーが言っているのを見ました...

馬化騰氏は「人工知能の4つの主要な発展傾向が今後10年間で世界を変えるだろう」と述べた。

今後10年間で世界を変える人工知能の4つの主要な発展トレンドの分析61歳のビル・ゲイツ氏は大学卒業生...

...

機械学習を知っていれば十分でしょうか?次世代のデータ サイエンティストは「フル スタック」へと移行しています。

[[342168]]データサイエンスは、特にコンピューターサイエンス、統計、ビジネス分析、エンジニ...