学覇君主任科学者陳瑞峰:テクノロジーを活用して知識のサイロ化を減らし、教育の効率化を実現する

学覇君主任科学者陳瑞峰:テクノロジーを活用して知識のサイロ化を減らし、教育の効率化を実現する

[51CTO.comからのオリジナル記事] 学習圧力が高く、教育資源の配分が不均衡な中国の教育システムは、数万ものオンライン教育アプリケーションを生み出してきました。アプリの数が増えるにつれて、教育コンテンツや教育方法の総量も増えますが、無料アプリが大きな割合を占めており、コンテンツのサポート不足による均質化の問題がますます深刻になっています。学覇君の主任科学者である陳睿峰氏は独占インタビューで、会社設立当初から同社のポジショニングは非常に明確だったと語った。教師と学生は最も重要なパートナーであり、学覇君は教師に取って代わるのではなく、ABCDを活用して知識の孤島と戦い、EEEを実現するだけだ。

ではABCDとは何でしょうか? EEEとは何ですか? Chen Ruifeng 氏は、Xuebajun の技術的側面を ABCDEEE に要約しました。

  • A=AIです。
  • B=ビッグデータ。
  • C=クラウド。
  • D = 配達。
  • EEE=教育効率向上。

これらの要素は教育の効率を高めることを目的としており、教育に直接影響を与えるものではありません。つまり、ABCDがどのように開発されたとしても、教育プロセスにおいて教師に取って代わることはできません。写真撮影や質問検索ソフトウェアの開発から、1対1のオンライン個別指導、スマート教育プラットフォームまで、Xueba Junが行うことはすべてこの観点を中心にしています。

知識の問題点を克服し、知識コーチングを知識グラフ構造に変える

Xuebajun の製品シリーズの主な目的は、知識に関する問題点を解決し、知識指導を教師と生徒が教育に使用できる知識グラフ構造に変換することです。この目標を達成するには、本やテスト用紙など、生徒が目にするさまざまなデータを観察する必要があります。これらのデータはフレームワークシステムを形成しますが、多くの学生はそれに気づかなかったり、注意を払わなかったりして、質問の海に無力に閉じ込められています。フレームワーク システムは人間の神経ネットワークのようなもので、あらゆる筋肉と骨の動きを結び付けます。本のアウトラインは単なる枠組みのシステムだと言う人もいるかもしれません。実は、反映されていないより深いレベルのアウトラインが存在します。

学習プロセスでは、フレームワークの価値が非常に重要です。アイデア全体を整理できない場合、ランダム ウォーキングの効率は非常に低くなります。砂漠でオアシスを探すのと同じです。GPS がなければ、うまく見つけられる可能性は非常に低くなります。

このフレームワークをどのように構築するのでしょうか?これには、人工知能、ビッグデータの収集と分析、クラウド コンピューティング サービス、ターゲットを絞ったコンテンツのプッシュという、前述の ABCD が必要です。

行動や知識などの学習データの大規模収集

2013年、Xueba Junは、学生が何を学んだか、何を理解していないかを理解するためにどのような方法を使用できるかを考えていました。どちらの方法を選択する場合でも、データが基礎となるため、まずは大規模なデータ収集を行う必要があります。

紙の採点システムはデータ収集の伝統的な方法ですが、境界に制限があります。全国の学生をカバーするのは難しいだけでなく、プロモーションコストも非常に高くなります。Xueba Junは質疑応答シーンを写真に撮ってデータを取得しています。

具体的な実装としては、チームが写真を撮ってアップロードする方法を採用し、各ユーザーがバックエンド サーバーに理解できない点を積極的に通知できるようにしています。アップロードされた各写真は、ユーザーの能力不足の点を表します。同時に、テキスト認識技術の使用により、画像は相関および分析が可能な重要なコンテンツに変換されます。

2 番目のステップでは、認識に基づいて、システムは自然言語処理技術を使用して認識結果を分析および処理し、元の認識テキストに対応する知識ポイント ラベルをラベル付けします。これにより、データを同じ知識ポイントのテスト問題に関連付けることができ、予備的な推奨が得られます。

3 番目のステップでは、知識ポイント ラベルが大規模に形成された後、教育および研究担当教師がデータ マイニングのサポートを受けて個別の質問を分類し、関連する構造に集約して、知識グラフを抽出します。

これらの手順を経て、データ処理チームは認識、自動ラベル付け、関連性分析を組み合わせた処理フローを形成しました。

中国には、試験という非常に特殊なデータ生成メカニズムもあります。試験環境は、世界中のどの国でも入手できない高レベルのデータ、つまり膨大な問題バンクをもたらします。

質問バンクには客観的な質問に加えて、主観的な質問も多数含まれており、各質問には対応する回答があります。これらの質問は多くの中国語教師によって採点されたデータであり、各回答はこの質問のデータラベルです。

この膨大な問題バンクは、中国の何億人もの学生にも利用されており、彼らの行動もそれに関連しているため、我が国の教育分野におけるインテリジェント分析が欧米諸国とは異なる独自の技術を形成することを可能にしています。

前述の行動データや知識データのほかに、ソーシャルデータもいくつかあります。例えば、生徒と保護者の関係、保護者と教師の関係、教師と生徒の関係などです。

膨大な量のデータのインテリジェントな分析

行動や知識に関するデータを数値化し、各知識ポイントに対応する重み、難易度、テスト頻度を割り当て、人工知能が行うべきことを蓄積していきます。

頻出質問を分析し、学習に重点を置く

数千の知識ポイントを含む知識ツリーを構築するとします。分析により、約 100 個の高頻度知識ポイントを特定できます。学生は、比較的良い成績を取得し、良い大学に入学し、同時に重要な知識をより深く理解するために、最も頻繁に出題される質問をカバーするだけで済みます。

具体的な実装はビッグデータ プラットフォームを通じて実現でき、質問バンク内の質問をプロファイルし、対応する知識ポイントと難易度を分析できます。次に、ユーザーの行動に基づいてユーザー プロファイルを作成します。

最後に、問題と生徒の相関分析を実施し、過去の大学入試の頻出テストポイントを抽出できるだけでなく、各生徒に合わせた個別の学習プランを提供することもできます。

一方、膨大な問題集を調べる必要があるのでしょうか?答えは必ずしもそうではありません。膨大な問題集を盲目的に解く理由は、どれが重要なポイントなのか分からないからです。

生徒がコンテンツの要点を知っていれば、良いスコアを取得するために基本的な質問の 50% または 40% を練習するだけで済み、知識の枠組みがより強固になります。したがって、大量の質問をするという戦術を必要とせず、学生はより生産的に、より広い範囲をカバーできます。

正確な知識検索を実現するためにグラフィカルな質問バンクを構築する

データを整理し、ディープラーニングや機械学習などの技術的手段を使用して質問バンクを構築し、数学、化学、物理学、生物学などの主要科目のナレッジグラフを構築することで、K12分野(幼稚園から高校まで)のさまざまな知識の構造化を効果的に整理できます。

この特別な質問バンクでは、生徒が特定の知識ポイントを検索するとき、その動作は微視的に見えますが、実際に開くと、次の図に示すように、よりマクロな世界になります。

マクロの世界は地図のようなものです。各建物を質問と比較します。それらを再度詳細に研究し、知識ポイントが近い質問をグループ化し、遠く離れた質問を除外して、地図のような構造にマッピングします。これを実行するとどのような利点がありますか?陳瑞鋒氏は学習プロセスをモバイクに乗ることに例え、ルートを走ることは宿題をしたり試験勉強をしたりすることと同じだと述べた。生徒が質問をしたり、写真を撮ったり、質問を読んだりすると、Mobike が特定の場所での自転車の受け取りと返却を記録するのと同じように、その場所が記録されます。

同時に、生徒の正解と不正解のデータを記録し、以下に示すように、間違った質問の分析に基づいて個人のポートレートを作成することもできます。

生徒に関する一定量のデータが蓄積されると、生徒の学習軌跡をより明確に把握できるようになります。こうすることで、全員が同じになってしまうという問題を回避できます。つまり、電子商取引や旅行で一般的に使用されているテクノロジーを教育の分野に応用できるのです。

もう 1 つの効果は、特定の質問に対する学生の正解と不正解を分析し、既存の学生グループ内で学生を特定のカテゴリに分類することです。生徒が幾何学を得意としている場合は、幾何学の問題を除外し、代わりに代数学の問題を推奨します。異なるセクションの異なる知識ポイントと学習内容は、生徒の抽象的思考能力に対する要件も異なります。たとえば、男子は革新性と境界のなさに優れ、女子は厳格さ、厳格さ、構造に優れています。

教育を支援する学習シナリオの構築

大規模なデータを収集し、インテリジェントな手段を使用して分析し、質問バンクを構築した後、次に行うことは、指導をサポートするための学習シナリオを構築することです。

シナリオ1: 問題に遭遇したら、写真を撮って質問を検索し、リアルタイムで回答を得る

記憶は移植できないので、先生が説明するとすぐに、この理想的な状態は稀なことだと生徒は理解します。一般的に言えば、教室での授業はダイヤルアップインターネットアクセスのようなもので、パケット損失が発生します。教師はたくさん話しますが、生徒はネットワーク全体の一部のノードだけを収集します。生徒は理解したつもりでも、つながりや関係性が脳に記憶されていないため、質問を探すために写真撮影機能が必要になります。脳は私たちにとってブラックボックスです。理論的に言えば、観察も制御もできないブラックボックスシステムの場合、その周辺条件を通じて有用なデータを取得する必要があります。

生徒が何を理解していないのかを知りたい場合は、生徒が何によく注目しているのか、どのような質問に困っているのかを観察する必要があります。これにより、生徒が理解していないことが直感的に反映され、マークすることができます。質問を探すために写真を撮ることは、生徒が理解できない質問に関する情報を収集するための自然な手段です。以下に示すように、ここでは多くの認識テクノロジが関係しています。

この図は、それぞれ印刷されたテキスト、手書きのテキスト、オンラインの手書きの単語、オンラインの複雑な手書きのテキストの認識を示しています。ここでは、インテリジェント認識エンジンが役割を果たします。

印刷されたテキストの認識では、畳み込みニューラル ネットワークを使用して画像の特徴を抽出し、レイアウト分析を実行し、画像をセグメント化してから、各単語を個別に識別します。手書き文字の認識については後述します。

シナリオ 2: 宿題の状況に基づいたターゲットを絞った練習問題と推奨演習

Cエンドでは、生徒が宿題を終えた後、写真を撮ってアップロードすると、数分ですべての質問が正解か不正解かがわかります。システムが自動的に判断し、結果に基づいて適応的な演習を提供するため、今日の課題は今日中に終わらせることができます。

次の図は、学習データの識別と収集のプロセスを示しています。

生徒が手書きで書いた質問の回答は、まず畳み込みニューラル ネットワークを通じて計算され、次に再帰型ニューラル ネットワークを通じて勾配データ構造に形成され、最後にデコード層に到達してデコードされます。

生徒の手書き文字については、まず畳み込みニューラル ネットワークを使用して画像に対して多重畳み込みダウンサンプリングを実行し、手書き文字の線分分割を行います。次に、非最大抑制法を使用して各行のストロークを分割し、手書き文字の各行をシーケンス認識問題に変換します。その後、多層リカレントニューラルネットワークを使用してデコードし、高精度の認識結果を出力します。

B 側では、各クラスの生徒が宿題をアップロードし、システムがそれを評価して修正し、ナレッジ グラフと行動グラフにマッピングすると、教師は各生徒の学習状況を把握できるようになります。

従来の教育では、たとえ優秀な教師であっても、生徒一人ひとりの詳細をすべて覚えることはできず、閉ループを形成することもできません。これは、関連データがシステムに入力されず、教師が閉ループ接続を完了する必要があるためです。

このとき、教師はこのつながりのボトルネックになります。ある程度、教師の価値が弱まるだけでなく、生徒のニーズにタイムリーに応えることもできなくなります。

教師の最大の価値は、各生徒がどの問題に問題があるかを覚えるのを助けることではなく、教育し指導することであるべきです。この方法を採用することで、人手を節約できるだけでなく、関連するすべてのデータを蓄積して閉ループを形成することもできます。

シナリオ3: 生徒は自己評価と練習を行うことができる

学覇君はビッグデータとインテリジェント分析に基づいて8000万の質問のデータベースを整理し、適応型自己評価のために学生に提供しました。その後、評価結果が学生にフィードバックされ、ターゲットを絞った演習が推奨されます。

現在達成されている効果は、学生の能力や問題の難易度などの属性を総合的に考慮し、IRT モデルと組み合わせることで、学生の回答が正しいかどうかを予測する精度を向上させ、知識ポイントを超えて質問を進め、学生の学習パスを計画することです。

将来について

将来の教育のビジョンについて尋ねられると、陳睿峰氏は次のように答えました。「将来的には、学習プロセスがより容易になり、学習が楽しいものになることを願っています。何度もボトルネックに遭遇して答えが得られないという苦痛が最小限に抑えられ、質問にタイムリーに答えられるようになります。知りたいことは何でも、ソフトウェア リソースやリモート教師リソースを通じてサポート サービスを受けることができ、学生は情報を取得する際にタイムリーな回答を得ることができます。もちろん、これには大量のデータの蓄積と、学生が知りたいことを本当に理解することが必要であり、それによって必要なコンテンツ知識をパーソナライズされた方法で提供することができます。」

これを達成するにはまだ多くの課題があります

より深く、よりインテリジェントで、より詳細を捉えることができる分析フレームワーク。例えば、生徒の筆跡のリズムを分析して、積極的か、先延ばしにしがちなのかといった性格を分析し、性格や行動に基づいて整理することは可能でしょうか。なぜなら、生徒の行動は知識に影響を与えるだけでなく、学習効率にも影響を与えることがあるからです。

より完全なデータを入手できますか?なぜなら、質問バンク、コンテンツ、ドキュメントライブラリ、またはその他の対応する学習ビデオを作成する場合でも、データ量は多いものの、その一部しかカバーしておらず、より包括的にカバーしたいからです。

理論レベルではより体系的な分析が行われます。中国の現在のAI+教育、あるいは教育+AIには、実はあまり完全な理論体系がありません。私たちは、これら2つのモジュールを組み合わせて、その後の取り組みの指針となる効果的な理論的方向性を生み出したいと考えています。

[[208510]]

彼はシンガポール国立大学で博士号を取得しています。2013 年に技術研究責任者として Xuebajun に入社し、テキスト認識、画像アルゴリズム、データ マイニングに重点を置いたインテリジェント コンピューティング チームを設立しました。彼はチームを率いて、中国で自然の風景と複雑なレイアウト画像の両方に適応できる写真認識エンジンの先駆者となり、質問検索と 1 対 1 のリアルタイム質問回答サービスの技術的基盤を築きました。同時に、ディープラーニングに基づくテキストマイニング技術が製品に導入され、効率的でインテリジェントな知識ナビゲーションを実現します。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  AIの千里の道のりは一歩から始まる

>>:  デジタル経済は新たな時代へ:インターネットが主導権を握り、ビッグデータと人工知能が注目の的

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

5G、AI、IoTが「インテリジェントな接続」を実現する方法

5G、人工知能(AI)、モノのインターネット(IoT)技術の発展により、あらゆるものがインテリジェン...

5Gのサポートにより、AIの顔を変えること以外に人工知能は何ができるのでしょうか?

近年、AIによる顔を変える技術がネットユーザーの間で大流行し、この人工知能の新興技術を一般人の生活に...

人工知能プロジェクトからビジネス価値をうまく引き出すための 8 つの秘訣

[[249778]] AI はビジネスに大きな可能性を秘めていますが、ほとんどの組織がそのメリットを...

一時停止トークンを使用して大規模モデルを再トレーニングすると、AIは行動する前によく考えることを学ぶ

ChatGPT に回答を出す前に手順について考えてもらうことで、精度を向上させることができます。では...

...

GPT-3オープンソースのPutianバージョン:事前学習済みモデルGPT Neoと同等の再現

[[389187]] GPT-3 はオープンソースですか? Eleuther AI のオープンソース...

人工知能と機械学習 – これらの流行語を理解していますか?

2017 年現在までに最もよく使われている流行語は人工知能 (AI) と機械学習 (ML) ですが...

...

ビジネス上の問題を機械学習の問題に変換するにはどうすればよいでしょうか?

[[196752]]機械学習が価値を変革するための最も重要なステップは何ですか?ビジネス上の問題に...

人工知能翻訳は、障害なく外国人と恋に落ちるのに役立ちます

AI 音声翻訳の分野では、ノイズは対処しなければならない主要な課題の 1 つです。この装置は研究室や...

IBM TRIRIGA統合ワークプレイス管理システムに新機能が追加

IBMは、人工知能とほぼリアルタイムの洞察を活用して組織が安全で効率的かつ生産性の高い職場を構築でき...

ミュンヘンモーターショーからのシグナル:自動車メーカーがOS開発に躍起になり、中国の力が増す

今年ドイツで開催された国際自動車・スマートモビリティ博覧会(IAA)では、Amazon、Qualco...

MWC2018が開催間近、人工知能が焦点に

人工知能はバブルを抜け出し、徐々に細分化された分野に入り込み、繁栄し始めており、近年ではCESやMW...

大規模グラフニューラルネットワークの応用と最新のパラダイムの探究

1. 大規模グラフメモリ/計算問題を解決するための3つのパラダイム2年前に作成したチュートリアルでは...