教育業界における自動問題解決と適応学習AIの応用

教育業界における自動問題解決と適応学習AIの応用

[51CTO.comより引用] 近年、人工知能が大流行し、多くの大企業、中堅企業、中小企業が動き始めています。スタートアップ企業が成果を上げるには、垂直的なニッチ領域を深く掘り下げることが鍵となります。ここには業界の背景知識がたくさんあるため、大手企業が巨額の資金を投資したとしても、まずは業界の状況を理解する必要があります。このプロセスには1年以上かかることが多く、スタートアップ企業に多くの時間と機会をもたらします。このような状況では、大企業は独自のチームを構築するよりも、買収したり資本を注入したりする傾向が強くなる可能性があります。

過去3年間、薛柏君は教育業界、特に校内業務に関して多くの業界知識を蓄積しており、学校の状況に精通しています。同時に、学内業務のニーズにより、Xueba Junは常に人工知能関連技術の研究開発に大きな注意を払ってきました。一般的な人工知能技術の開発は非常に困難ですが、垂直産業のシナリオと組み合わせると、アルゴリズムの難易度が軽減され、アルゴリズムがその位置を見つけることができます。この過程で、私は多くの問題に遭遇し、また多くの実践的な経験も得ました。この記事では、キャンパスビジネスにおける学問の主要な応用として、構造化された問題バンクの構築、自動問題解決と知識グラフ、自動宿題採点、適応型学習などを紹介します。

【構造化質問バンクの構築】

構造化された質問形式

質問バンクは教育会社の中核機能の 1 つです。市場に出回っているほとんどの質問バンクでは、質問のデータは単なる単純な文字列です。質問の構造を真に復元するために、Xueba Jun は質問の構造を記述するために json を使用することを選択しました。質問は、特定のルールに従って組み合わせられた多くの部分で構成されています。

下図に示す多肢選択問題は、語幹記述部分と選択肢部分から構成されています。選択肢は4つに分かれています。語幹には空欄を埋めるスペースがあり、各式の位置がマークされています。 json 構造を使用して質問構造を記録することで、大きな質問を小さな質問に分割したり、各空白の位置を正確に特定したりすることができます。このような質問バンクは、製品設計にますます柔軟な使用条件を提供できます。

このデータ構造は質問の適用に利点をもたらしますが、質問の入力プロセスでは質問の構造的分割と関連付けが必要になるため、質問バンクの作成コストも増加します。コストを削減するために、Xueba Jun は多数の画像認識アルゴリズムを使用しています。

次のフローチャートは、簡略化された質問入力プロセスです。図から、多くのキーリンクが認識アルゴリズムを使用して効率を向上させていることがわかります。

たとえば、構造化データ入力プロセスでは、レイアウト分析、OCR、数式認識などのアルゴリズムを使用します。すべての質問は最初にアルゴリズムによって識別され、予備的な結果が得られ、データ入力担当者が手動で結果を確認します。正しい場合は、直接スキップされます。エラーがある場合は、部分的に修正されます。これにより、データ入力担当者の効率が大幅に向上します。現在の問題バンク作成システムは、あらゆる教材用書籍のすべての問題の構造化された処理と作成を 1 日以内に完了できますが、これはシステムとアルゴリズムのサポートがなければほぼ不可能です。

ラテックス保存式

理科の問題では、問題構成に加え、出題形式も重要なポイントです。数式の構造とレイアウトは比較的複雑なため、多くの問題バンクでは数式を保存するためにスクリーンショットを使用しています。この方法では数式の内容情報が失われ、画像のスケーリングが外観に影響を与えるという問題があります。

Xueba Jun は数式を保存するために LaTex を使用します。LaTex は、さまざまな組版シナリオに適用できる汎用的な組版仕様です。 K12 に表示されるすべての数式と記号に対して、LaTex ベースの表示標準セットを開発しました。この標準セットに基づいて、Web 側 JS レンダリングの品質と効果が理想的な要件を満たすように、MathJax オープン ソース ツールを最適化しました。

Xueba Jun は、JS レンダリング ツールに加えて、C 言語カーネルに基づく LaTex レンダリング ツールも開発し、これを Android および iOS バージョンの SDK にパッケージ化しました。その原理は、LaTex テキストを解析して SVG ベクター グラフィックスに変換し、それを Web ページに渡して最終結果をレンダリングすることです。 C言語カーネルを搭載したSDKのレンダリング速度はJSよりも数倍高速で、特に学校で大規模に使用されるローエンドのPADに適しています。

LaTex を使用して数式を保存する場合、質問を入力するときに質問リストを LaTex 形式に変換する必要があります。これには人件費が高く、特にアルゴリズムの助けが必要になります。

従来の数式認識アルゴリズムは、まず画像処理方法によって数式を個々の文字に分割し、次に各文字を個別に認識し、最後に 2 次元空間の構造関係によって文字を数式に結合していました。このタイプのアルゴリズムには多くの制限があります。文字がくっついている状況には対応できません。空間構造に基づく組み合わせの計算の複雑さは、深さとともに幾何学的に増加します。さらに、文字が誤って認識される可能性があり、膨大な候補リストから正しい結果を見つけることができません。

Xuebajun は、エンドツーエンドの認識方法を使用して、上記のすべての問題を回避します。入力は画像全体であり、出力は LaTex 構造に基づく数式の認識結果です。アルゴリズムのニューラル ネットワーク構造は、CNN (畳み込みネットワーク) + BLSTM (双方向長短期記憶モデル) + CTC (時間分類) です。

モデルをトレーニングするために、Xueba Jun は学校で大量の生徒の手書きの数式データを収集し、LaTex 構造で注釈を付けました。このネットワーク モデルには現在制限があり、非常に複雑な数式を正確に認識することはできません。形式が複雑すぎる数式については、空間構造関係に基づいて数式をいくつかの単純な数式に分割し、エンドツーエンドの方法を使用して個別に認識し、最終的にそれらを結合します。

【自動問題解決とナレッジグラフ】

構造化された形式に加えて、Xueba Jun は、質問バンク内の各質問で、どの知識ポイントが使用されているかを明確に示し、問題解決プロセスの各ステップでどの知識ポイントが使用されているかを知ることを望んでいます。人がすべての質問のすべてのステップで知識ポイントをマークするとしたら、タスクを完了することは不可能です。私たちはアルゴリズムを使用して手作業を置き換えたいと考えており、そこで自動問題解決テクノロジーが登場します。自動的な問題解決は、一般的に理解、演繹、表現の3つのステップに分かれており、全体のプロセスは以下の図に示されています。

質問の意味を理解する

まず、質問の語幹の意味を理解し、質問の語幹の内容を自然言語から形式言語に翻訳します。これが NLP のプロセスです。オープンな意味理解は科学研究コミュニティにおける難しい問題であり、実用化にはまだまだ遠い状況です。しかし、中学校の理科では言語表現が非常に標準化されていることが多く、NLP の難易度が大幅に低下します。

さらに重要なのは、オープンな意味理解シナリオでは評価基準を定義することが不可能であることです。客観的な基準が欠如していると、トレーニングに大きな困難が生じます。しかし、中学校の理科のシステムでは、善悪を定義することが容易であり、大量のデータを組み合わせることで、より理想的なモデルをトレーニングすることができます。

質問には数式がよく登場します。前述のように、弊社の質問バンクの数式は、統一的に定義され標準化された LaTex 形式であるため、機械が数式の内容を正確に認識できます。

問題解決のステップの推論プロセス

次に、問題解決のステップの推論プロセスが続きます。すべての現在の状況に基づいて、必要な知識のメタ情報を取得する必要があります。知識要素とは、私たちが定義する最小の細分化された知識ポイントです。知識要素とは、知識ポイントの定義と特性の合計です。たとえば、円は知識要素として使用できます。円には、直径、半径、円周、面積などの特性があります。直径がわかれば、半径、円周、面積をさらに計算できます。簡単に言えば、知識要素とは小さな知識ポイントです。

現在のすべての条件を組み合わせて、初期状態として使用します。現在のすべての知識要素の特性に応じて、新しい条件を取得するための手順を推測でき、状態は変化し続けます。それぞれの導出には多くの可能性があり、質問内の質問に基づいたモデルによって最適な導出が決定されます。

各状態切り替え後、最終的な答えが得られるか比較します。答えが得られれば、導出プロセスは終了します。演繹プロセスと知識要素は密接に関連しており、中間状態における条件の変化によって新しい知識要素も導入されます。

表現プロセス

最後のステップは表現プロセスです。これは、導出プロセスを標準的な問題解決ステップに変換し、いくつかの異なる次元から重要な情報を出力します。たとえば、各導出ステップには、使用された知識ポイントがマークされます。すべてのステップの中で、質問のすべての知識要素の状況に基づいて、最も重要なステップをキーステップとして見つけます。質問のすべての知識要素を統合して、この問題でテストされる教育および研究レベルの知識ポイントを要約します (教育および研究の知識ポイントは、教師の観点から観察された知識ポイントであり、問​​題解決アルゴリズムの知識要素と同じ次元ではありません)。

大学入試ロボットに問題解決技術を実装

自動問題解決技術の実戦での有効性を検証するため、問題解決技術を大学入試ロボットに組み込みました。2017年6月の大学入試当日、当社の大学入試ロボットは多くの学生とともに大学入試を受け、高校数学で134点を獲得しました。これは、教育業界における人工知能技術の応用における重要な突破口であり、CCTVを含む主要メディアの注目を集め、報道されました。

ナレッジグラフ

自動問題解決テクノロジーにより、すべての質問に対して知識ポイントをマークできます。教育研究教員と技術系学生が協力して、すべての知識ポイントを網羅する 4 レベルの知識システムを開発しました。知識ポイント間には階層関係、依存関係、関連関係があり、ネットワーク構造を形成しています。

この知識システムは、自動問題解決技術を通じて当社の質問バンクとリンクされ、知識グラフを形成することができます。このナレッジ グラフでは、各質問を複数のナレッジ ポイントに関連付けることができ、各ナレッジ ポイントも複数の質問に関連付けることができます。ナレッジ グラフを使用すると、システムは各生徒の課題と試験の学習レポートを自動的に生成し、さまざまな側面から生徒の知識ポイントの習得状況を分析できます。

【宿題の自動採点】

ドットマトリックスデジタルペン

学校調査中に、雪波軍さんは教師にとって宿題の採点の負担が非常に重いことを発見し、このシステムを使って教師の宿題の採点を助け、教師の時間と労力を解放したいと考えている。宿題を採点するシステムを導入したらどうなるでしょうか?

まず、ドットマトリックスデジタルペンを使用して、生徒の手書きの宿題データを収集する必要があります。ドットマトリックスデジタルペンは、普通紙にほとんど目に見えないドットマトリックスパターンの層を印刷する必要があります。デジタルペンの先端にある高速カメラは、いつでもペン先の動きの軌跡を捉えます。同時に、圧力センサーと組み合わせてプロセッサにデータを収集し、コーディング変換を通じてドットマトリックス画像を手書きの座標位置に変換します。最後に、手書き情報はBluetooth経由でPADに送信されます。

下の図に示すように、学生はドットマトリックスデジタルペンを使用して、紙に書くという従来の習慣を変えることなく宿題をしたり試験を受けたりすることができ、同時に手書きデータをリアルタイムでデジタル化することができます。

[[220238]]

手書き認識

生徒の手書きデータを取得した後、まずレイアウト画像処理技術を使用して手書きデータをテキスト行に分解し、次にオンライン手書き認識技術を使用して各行のテキストを認識します。

オンライン手書き認識もCNN(畳み込みネットワーク)+ BLSTM(双方向長短期記憶モデル)+ CTC(時間分類)モデルを使用していますが、具体的な実装は以前の数式認識シナリオとは異なり、特にCNNの入力画像シーケンス部分が異なります。Xueba Junは、華南理工大学のJin教授の論文にあるPath-signature機能をCNNの入力特徴マップシーケンスとして使用しています。

複雑なタイプセットの数式の場合も、まず単純なテキスト行に分割され、認識後に結合されます。トレーニングには学生の実際の手書きデータを使用します。実際のシーンのデータは、雇用した人が書いたデータよりもはるかに優れていることが実証されています。

自動修正

生徒の手書きを認識するだけでは自動採点を完了するには不十分です。標準回答には多くのバリエーションがあり、図の例のように同じ標準回答が異なる表現で正解となる場合があるからです。答えには十数通りのバリエーションがあることが多く、多くの基礎教育と研究の知識が必要です。システムは標準的な答えを識別した後、数学記号言語処理などのアルゴリズムを通じてすべての同義語表現を自動的に生成します。生徒の手書きの最終回答を標準回答の同義表現すべてと照合して比較し、同じ結果になる表現を見つけます。マッチングプロセスでは、生徒の手書きの最終回答に冗長なテキストが含まれる可能性があることも考慮する必要があります。

問題解決の質問についても、学生は手順に従って正解することを望んでいます。しかし、これは非常に困難です。Xueba Jun は、主要な手順を一致させるという妥協案を採用しています。自動問題解決技術により、問題解決プロセスの重要なステップを取得できます。採点の精度を向上させるために、少数の重要なステップのみが選択され、学生の問題解決ステップと照合されます。質問の最終スコアは、主要なステップのスコアと回答のスコアの合計です。

適応学習

学生が学覇君の質問バンクを使用して質問(宿題、試験など)を継続的に行うと、システムは学生の学習行動データを継続的に収集できます。このデータを使用して、適応型学習、つまりパーソナライズされた学習を実現できます。ここでは、従来の IRT モデルが使用されます。IRT 理論は、項目反応理論 (Item Response Theory)、または質問応答理論とも呼ばれ、一連の心理統計モデルの総称です。 IRT は、テストのスコアやアンケートのデータを分析するために使用される数学モデルであり、現在、心理学や教育測定の分野で広く使用されています。

IRTモデルを通じて、大量の学生の受験データと組み合わせることで、各問題の難易度と学生の能力を分析できます。知識グラフシステムと組み合わせることで、各知識ポイントにおける学生の能力をさらに分析できます。これが学生の知識ポイント能力モデルです。このモデルを使用すると、新しい質問に対して、生徒がその質問に正しく答える確率を予測できます。このようにして、生徒に適した中程度の難易度の質問を生徒に推奨できます。簡単すぎる質問や難しすぎる質問に時間を無駄にする必要はありません。

豊富な行動データを持つ領域および主題知識モジュールの場合、RNN モデルを直接トレーニングに使用できます。入力は学生の質問と回答のシーケンスの特性データであり、出力は各質問が正しいかどうかの予測です。データ量が多く、比較的均一な場合、RNN モデルの効果は比較的理想的になります。ユーザーの行動データが継続的に収集され、ユーザーによる製品の使用がますます標準化されるにつれて、RNN モデルが将来の方向性になると信じています。

結論

上記は、Xueba Jun が人工知能アルゴリズムを教育業界と組み合わせる方法について探求した内容の一部です。一部のアルゴリズムは難しそうに思えるかもしれませんが、垂直シナリオで適切に使用し、エンジニアリング プロジェクトと深く統合すれば、比較的理想的な結果を達成できます。雪波軍は、スタートアップ企業における人工知能の実装は、ビジネスシナリオとの深い統合と切り離せないものであると常に信じてきました。当社のアルゴリズムエンジニアは、コードを書くだけでなく、論文や試験を受けることもできます。この方法によってのみ、当社は独自の競争力を維持し、業界で画期的な進歩を遂げることができます。

【苗光義の紹介】

[[220239]]

中国科学院修士課程の学生である苗光一氏は、Sohu、YY、Qihoo 360 で勤務した経験がある。彼は現在、Xuebajun の技術担当副社長を務めており、人工知能関連のアルゴリズムの研究開発とビジネス シナリオにおける基本技術の実装を担当しています。彼はチームを率いて、携帯電話の写真撮影のさまざまな複雑なシーンに適応できる中国初のテキスト認識アルゴリズムを開発し、学八君問題集と教育研究システムの基本データ構造とアルゴリズムサービスを構築し、それをさまざまな業務分野に適用しました。同時に、愛学スマート教育プラットフォーム技術チームを率いて、自動採点や適応学習など、数々の最先端技術を開発し、愛学事業の技術的基礎を築きました。

AIに関するその他のコンテンツについては、公式アカウント「AI Pusher」をフォローしてください。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  MITが世界の画期的な技術トップ10をランク付け、アリババはそのうち4つを研究中

>>:  今後10年間の主要な投資の方向性を予測して、あなたは未来に向けて準備ができていますか?

推薦する

工業情報化部:5G、人工知能などの技術を活用し、中小企業の業務・生産再開を支援

工業情報化部は4月9日、「工業情報化部弁公室による2020年の業務・生産再開を支援するための中小企業...

新しいAGVロボットナビゲーション技術!屋内ナビゲーション用の新しいロボット フレームワークが登場しました。

移動ロボットは、人間が設計したタスクを完了するために、現実世界の環境を効果的にナビゲートし、周囲の人...

企業は AIGC の生産性向上のメリットをどのように活用できるでしょうか?

全米経済研究所が実施した最近の調査によると、ChatGPT のような AIGC を導入すると、従業員...

グラフニューラルネットワーク (GNN) とは何ですか?

[51CTO.com クイック翻訳]グラフィックは人々の仕事や生活のいたるところに存在します。たと...

MapReduceアルゴリズムをわかりやすく説明する方法

Hackbright でメンターをしているときに、技術的な背景が限られている学生に MapReduc...

2020年が到来。人工知能について知っておくべきこと

新年を迎え、皆様にお楽しみいただいている「まとめ記事」が今年も登場です! 2020年に人工知能が大き...

...

IBMは信頼性の低い量子コンピューティングの問題を克服し、エラー軽減を使用して有用な計算を実現し、Natureの表紙を飾った。

量子コンピューティングは長い間、特定の問題に関して従来のコンピューティングよりも高速であると期待され...

...

サイバーセキュリティにおける AI と機械学習の 7 つのプラスとマイナスの影響

人工知能 (AI) と機械学習 (ML) のテクノロジーは、サイバーセキュリティを含め、今や私たちの...

賈陽青氏がフェイスブックを辞任し、アリババ・シリコンバレー研究所の副社長に就任したことが明らかになった。

[[258639]] 3月2日の夜、知书でAI人事異動に関する大きなニュースが報じられた。Caff...

魂への窓!人工知能は網膜をスキャンして心臓発作を予測できる

ビッグデータダイジェスト制作眼鏡をかければ心臓発作の危険があるかどうかがわかるなんて、驚きですよね?...

ChatGPT Civilization Simulator が再びオンラインになりました!クリックひとつで、火山噴火の日の古代都市ポンペイにタイムスリップ

GPT-4のアップデート機能により、AIを使って歴史をシミュレートすることは、単なる「テキストロール...

将来、ロボットは手術を支援し、反復作業をより効率的に実行できるようになるかもしれない。

人々は人工知能の急速な発展と、さまざまな業界でのその応用事例を目撃してきました。ヘルスケアは、AI、...

AI 時代において、人工知能は企業のリスク監視をどのように強化するのでしょうか?

最近、P2Pプラットフォームが頻繁に崩壊していることから、インターネット金融プラットフォームの長期的...