ゲスト | 王 燕 著者 | ユン・チャオ
人工知能は第四次産業革命と呼ばれ、社会のあらゆる分野から大きな期待が寄せられています。人々の生活を向上させるとともに、社会全体の運営効率も向上します。近年、大規模モデルとマルチモーダル性により、関連研究の人気が再び高まっています。 注目を浴びる中で、人々がより多く目にするのは、業界が AI を極限まで推し進めている一方で、「あらゆるものに利益をもたらす」という AI のもう一つの側面をしばしば無視していることだろう。 技術の発展は実際のシナリオと切り離せないものであり、AI 研究の浮き沈みには、常にアプリケーションの実装の問題が伴います。 「ハイエンド」技術を着実に導入するには? AIと細分化された産業の深い統合をどのように見ていますか?大型モデルに対する研究熱をどのように見ていますか? これらの疑問を念頭に、「Tフロントライン」は教育現場に深く関わってきたテクノロジー企業、Zuoyebangにインタビューした。テクノロジーを活用してインクルーシブ教育を推進することに専念する企業として、当社は人工知能やビッグデータなどの最先端テクノロジーを使用して、数億人の C エンドユーザーと数万の B エンド顧客の両方に、一連の効率的な学習および教育ソリューションと製品を提供しています。 特に教育分野において、Zuoyebang は、ユーザー規模や技術選択の面でも、AI 技術の探求と実装における優れた代表者です。これは、人工知能をどのように活用して業界の変化を促進するかを考える上で、重要な参考資料となります。 T Frontline は、Zuoyebang インテリジェント テクノロジー ラボの主任設計者、Wang Yan 氏を招き、これらの問題に関する見解を提供していただくという幸運に恵まれました。 教育製品の基礎: 問題バンク構築の3つのコツZuoyebangに関して、人々が感心するのはその強力な質問バンク機能です。 Zuoyebang は、国内で最も早く問題バンクを設立した教育テクノロジー企業の 1 つであり、現在 5 億 4,000 万件を超える問題が収録された問題バンクを保有しています。このような巨大な問題バンクはどのようにして構築されたのでしょうか?王燕氏によると、質問バンクの構築が成功したのは 3 つの条件によるものです。 まず、それはZuoyebangの本来の強みから来ています。ご存知のとおり、ZuoyebangはもともとBaiduが社内でインキュベートした事業です。当初は質疑応答の相互支援コミュニティとして位置付けられていましたが、後に検索質疑応答事業を立ち上げました。検索と回答結果を最適化するために、Zuoyebang は、フルタイムの教育と研究、およびパートタイムの教師のチームを結成して、最大規模のオンライン質問バンク制作プラットフォームを構築しました。これも百度知道のモデルに由来するものであり、共有とコミュニケーションを推奨するコミュニティの雰囲気の中で、ユーザー同士が問題を解決することを奨励しており、ネットユーザーの実際の質疑応答やコミュニケーションのシナリオに非常に近いものとなっています。当時他の企業が行っていたのとは違い、パートタイムの大学生に問題集を完成させるというやり方です。このように、ユーザーが作成したコンテンツの詳細な分析とマイニングを通じて、学習シナリオにおいてユーザーが最も懸念している問題、より難しい問題、ほとんどの人が遭遇する問題が徐々に理解できるようになります。これは私たちの建設の方向性を明確にする重要な前提です。 第二に、Zuoyebang はリソースの価値と構築を非常に重視しており、問題バンクに十分な注意を払っています。質問バンクは、ユーザーとのコミュニケーションにおいて大きな役割を果たすだけでなく、質問への回答や指導においても非常に重要な役割を果たします。クラウドソーシング システムに頼ることで、問題バンクの構築は、より困難なく独立したプロセス リンクに分割され、問題バンクをより良く、より速く、比較的包括的に構築できるようになり、問題バンクの構築のスケーラビリティが十分に保証されます。 3 番目に、質問があるだけでは十分ではありません。テストされる知識ポイント、難易度、および質問が依存する他の知識ポイントなどのラベル用語をリンクするなどして、質問を相互にリンクする必要もあります。これには、ラベルの処理と、それらをナレッジグラフやナレッジツリーなどの技術インフラストラクチャにリンクすることが含まれます。この方法でのみ、質問バンクを効率的に検索および選別することができ、質問バンクの価値を真に発揮できるようになります。もちろん、問題バンク自体を構築するプロセスには、最初は手動で操作されていたリンクがたくさんありましたが、後にAI技術が導入されました。たとえば、問題の写真を撮るなど、電子入力の手順のほとんどは、AIが自動的にこれらの画像を認識し、コンピューターが理解できるフォーマットされたデータと言語に変換します。自動ラベル付け、フォーマットされた数式、AI エラー修正テクノロジーなどの AI 機能による自動支援処理により、精度率が大幅に向上し、人件費が大幅に削減されます。質問バンクの構築と AI 技術の継続的な深化と拡張により、Zuoyebang は一連の AI 加速技術を実装することで、検索と質問への回答の応答時間を 1 秒に最適化しました。一方、初期の類似製品の応答時間は約 8 秒でした。 公立学校と連携したプロジェクトでは、質問バンクが指導シナリオを支援する上で大きな役割を果たします。ハイライトシーンの 1 つは、パーソナライズされた正確な質問の推奨を提供する機能を備えた高品質の宿題システムです。このシステムの本質は、データ分析を実施し、質問に費やした時間の長さやさまざまな知識ポイントの習得度など、さまざまな学生の状態に基づいてパーソナライズされた質問を推奨することです。なぜなら、生徒にとって、簡単すぎる質問や難しすぎる質問は価値を失ってしまうからです。同じ質問でも、生徒によって価値が異なります。したがって、学生を十分に理解し、問題バンク自体の豊富なラベル次元を組み合わせて、正確に一致させる必要があります。問題バンクは、高品質の宿題製品の設計において大きな補助的な役割を果たし、学生が本当に定着する必要がある知識を定着させるのに役立ちます。 自動支援グレーディング: 機械がグラフィックスの問題を解決する方法宿題のシナリオに関して言えば、問題バンクに加えて、より重要なのは自動採点支援技術です。客観的な質問と比較すると、主観的な質問の採点は非常に困難です。数学の問題を例にとると、長年蓄積してきたOCR技術を使って生徒の解答を正確に識別し、NLP技術を使って解答内容の論理的分析などの構造化分析を行い、解答基準に基づいて間違いを特定します。また、ナレッジグラフの力も活用して、生徒がどこで間違えたのかを指摘するだけでなく、なぜ間違えたのかを伝えます。その後、ユーザーポートレートと推奨アルゴリズムを使用して生徒固有の学習レポートを生成し、生徒が学習プロセスの弱点を見つけるのを支援します。同時に、このサービスシステムは、Zuoyebang のクラウドネイティブおよびマルチクラウドの災害復旧システムに依存しており、高い安定性と高い信頼性を提供します。そのため、多くの学校が同時に利用してもダウンタイムが発生せず、ユーザーの安定した利用が保証されます。 王燕氏によると、長年にわたる多数のユーザーの蓄積により、Zuoyebangは定期的に宿題システムのパフォーマンス評価を実施しており、評価結果は業界をリードする位置にあります。市場の同様の製品と比較して、Zuoyebangは現在、より多くの質問タイプをサポートしており、精度も高くなっています。 1. ステップレベルの自動アシスト補正 知識の学習には閉じたループがあります。教師は教えることで知識を伝え、生徒は演習を行うことで、どの知識ポイントを学んだか、どの知識ポイントを知らないかをテストします。知らない知識については、継続的な学習と練習が必要です。 「問題の説明→問題演習→問題判定→問題の説明」という指導ループでは、教師が大量の宿題を繰り返し採点することが大きな悩みの種となっています。従来、教師が生徒一人ひとりに的確に指導することは困難でした。 AI を活用して採点を支援することで、教師は採点の負担を効果的に軽減し、不必要な時間と労力を大幅に削減できると同時に、より多くの生徒が効果的に成績を向上させることができます。 現在、宿題成果物システムは利用率が高く、教師はほぼ毎日使用しています。さらに、このシステムは教師の指導経験やスタイルを統合し、教師のさまざまなニーズに応じてカスタマイズすることもできます。現在、主観的な質問と応用的な質問は、ステップレベルに基づいて修正できます。今後の改善の主な方向性としては、宿題の採点における教師の手作業の割合を引き続き減らしていくことが挙げられます。 2. グラフィックに関する質問に対する回答は非常に興味深いです。 テキスト質問と比較すると、正しい質問は通常、OCR、テキスト検索などを通じて質問バンク内で識別され、一致されます。ただし、特別な種類の質問、つまりグラフィックに関する質問があります。例えば、テスト用紙には次のような質問がよくあります。次の図の網掛け部分を見つけてください。このとき、抽出する必要がある特徴は、テキストだけでなく、図の特徴も含まれます。テキスト検索のみが使用されるため、質問バンクの背後にある検索システムは類似した質問を見つけることができますが、結果内の各質問の形状は異なります。この時点で、画像に対してベクトル化された特徴抽出を実行する必要があります。デジタルベクトル表現は、多数の問題バンクの機能と組み合わされ、「テキスト+画像」の機能を形成します。特に小学校の問題では、画像とテキストが混在する問題が多く出題されます。問題文のテキストを理解するだけでなく、ボックス間の構造的な関係も理解する必要があります。これには、線の特徴の開始位置を抽出し、その軌跡を抽出して判断する必要がある「接続線問題」も含まれます。描画に関する質問でも同様です。 3. 試験紙の復元:ブラックテクノロジーは現実に根ざしていることが多い 補助教育の分野では、Zuoyebang は OCR、音声、画像認識、宿題採点などの分野でも多くの技術特許を取得しています。例えば、非常に緊急性の高いニーズのあるシナリオで開発された、歪んだ画像を効率的に補正する AI の特許をすでに公開しています。周知のように、「間違った問題をやり直す」ことは教育場面において非常に重要な部分です。生徒、保護者、教師はテスト用紙を未解答の状態に戻す必要があります。しかし、テスト用紙の写真を撮った後、筆跡が不均一でテスト問題が歪んでいることが多いため、タイプセット修正の問題を解決するには技術が必要です。 当社では、ディープ ニューラル ネットワークを使用して人間の手書き文字を認識し、テスト用紙のフォントと区別しています。画像強化技術と組み合わせることで、テスト用紙を非常に効果的に復元できます。この技術は現在、Zuoyebang アプリで利用可能であり、プリンター製品にも適用されています。紙のテスト用紙を元の状態に復元できます。写真を撮ってから復元するまで、わずか数秒しかかかりません。以前は、学生は通常、質問を手動でコピーして、もう一度やり直す必要がありました。これは強力な「ブラックテクノロジー」と言えるでしょう。もちろん、この技術はテスト用紙の復元だけでなく、オンライン授業に提出する前に撮影した宿題を修正して美化し、より良いレイアウト状態に復元するためにも使用できます。一方では保存に役立ち、他方ではコンテンツの認識精度を向上させることもできます。 4. ナレッジグラフ: 専門知識が集まる場所 ナレッジグラフの構築は人間の経験システムと切り離せないものであり、教育シナリオでも同様です。当社のナレッジ グラフ機能は、主にコース シナリオに蓄積されます。多くの教育・研究教員は、教育・研究のプロセス中に、知識ポイントのコンテキスト、依存性、学習パスを要約します。これらの関係とパスにより、散在する知識ポイントをネットワークに接続し、知識グラフのプロトタイプを形成できます。教育研究の教員は豊富な専門知識と知識ポイントシステムを提供し、研究開発部門は一連の自動化された AI 機械学習機能を採用して、このプロセスで大規模な実装を実行しました。マップを使用すると、より深い知識ポイントを学習できるように、能力に見合った質問やある程度の難易度のある質問を推奨するなど、パーソナライズされた宿題設計の次のステップに進むことができます。現在、Zuoyebang のナレッジ グラフの応用シナリオは非常に幅広く、教育シナリオ、宿題の採点、パーソナライズされた学習、宿題の診断、先ほど導入した質問バンク内の関連する質問間の関連付けなどが含まれます。本質は、質問に検索と推奨のためのより正確な次元を持たせることです。 デジタル化からAIへ:ユーザーの本来の習慣を尊重これまでの教育現場では、紙の教科書や教師の黒板の書き込み、PPTなどはデジタル化されていませんでした。一方で、生徒の回答(正解かどうか、宿題、テストの点数など)もデジタル化する必要がありました。なぜデジタル化が必要なのでしょうか?なぜなら、自然物理世界の内容をコンピュータが理解できるデータ情報に変換しなければ、コンピュータ分野における先端技術研究が実現しないばかりか、検索や推奨など単純に効率化を図る技術さえも役に立たなくなってしまうからです。したがって、音声であれ画像であれ、それらは教育のアイデアや知識を伝えるための重要な媒体であり、伝達手段であり、これらは徹底的にデジタル化される必要があります。 近年、教育の情報化が進み、ほとんどの教室に大型デジタルスクリーンが設置され、日常の授業で使われる教材もデジタル化が進んでいます。私たちが今取り組んでいるのは、宿題の場面のデジタル化を推進することです。ただし、現段階では、AI 機能を使用する際には、教師と生徒の本来の習慣を尊重し、簡単に変えてはいけないことに注意が必要です。例えば、本来の教育モデルでは、誰もが紙ベースのテスト用紙に慣れています。紙ベースのテスト用紙を廃止してすべてをオンラインに移行すると、「現地の環境に適応できない」という深刻な問題が発生します。オンラインでの回答もデジタル化できることが求められていますが、これによって習慣が変わります。一度習慣が変わってしまうと、それを大規模に活用することは難しくなります。 これを踏まえ、教師が答案を採点し、生徒が質問に答える実際の習慣を尊重して、Zuoyebangはビジネスアイデアを革新し、宿題システムに「元の答案の痕跡を残す」機能を導入しました。したがって、王燕氏の意見では、私たちにもっと必要なのは、思考の革新、テクノロジーの使用の敷居を下げること、そして習慣を変えずにデジタル化を実行することである。 仕事のシナリオから教育のシナリオに拡大すると、新しいシナリオで多くの新しい需要が発見されるでしょう。たとえば、スポーツのシナリオでは、授業中、体育教師は心拍数のモニタリングなど、各生徒が耐えられる運動の強度に細心の注意を払います。運動中に生徒の心拍数が高すぎる場合は、運動を止めて休憩するよう生徒に注意を促す必要があります。例えば、「縄跳びカウント」ではカウンターは使いませんが、カメラで自動判別してカウントしてくれると便利です。さらに、身体の動きをキャプチャすることは、生徒が自分の動きが標準的で規範的かどうかを確認するのに役立つ実用的なテクノロジーでもあります。AIは修正を支援できます。 1. AI導入の機会を見つける方法 Zuoyebang はテクノロジー主導の企業です。開発チームはよく次のような質問をします: 他にどのようなテクノロジーを使用できるでしょうか?これまで満たされなかったニーズを満たし、これまで不可能だったことを実現できる優れたテクノロジーはあるでしょうか?これを踏まえて、王燕氏はAI導入の機会を見つけるためのロジックを次のようにまとめました。「習得した技術と保有するリソースを明確にした上で、具体的なシナリオに適切な技術を適用する方法を検討すべきです。」既存の技術リソースに基づいてシーンマッチングを実行します。次のステップは、テクノロジーで何を達成できるかを考え、評価し、パイロット プロジェクトと最適化を実施することです。 2. B面の精度要件はより厳しい 運用シナリオでは、C エンド シナリオと比較して、B エンド 顧客のニーズはより特殊であり、カスタマイズされた要件があります。たとえば、学校では正確性に対する要求が高く、採点プロセスに間違いがあってはなりません。 C エンド製品は機能の豊富さとユーザー エクスペリエンスに重点を置いており、精度に対する期待はそれほど極端ではありません。 AI業界に関する意見1. 基礎研究は基礎であり、最先端技術はより魅力的である 基礎研究は当社の技術の基盤です。これらの技術にはすでに幅広い応用シナリオがあります。基礎技術の最適化により、アプリケーションのパフォーマンスが大幅に向上するため、基礎研究への投資は不可欠です。最先端技術の研究は、ゲームのプレイ方法に変化をもたらす可能性があります。技術が発展し、革新し続けると、以前は不可能だったことがある日突然可能になるかもしれません。研究室の学生は、注意を払ってフォローアップするためにエネルギーの20%から30%を割り当てるように奨励されています。応募者の能力については、一定の学術研究能力を有していることを期待しますが、エンジニアリング能力も重視します。エンジニアリング能力が強化されるということは実装能力も強化されるということであり、AI技術の実装を真に推進するためには、アプリケーションレベルで着実な進歩を続けていく必要があります。もちろん、理想的には、フルスタックの能力を持ち、実験設計とアプリケーションの実装を自主的に完了し、実際のアプリケーションで特定のイノベーションの改善効果を迅速に検証できる人材が望まれます。 2. モデルは単に規模の大きさを追求するのではなく、幅広い層の人々に利益をもたらすものでなければなりません。 教育分野や一般産業における実践や開発経験は、一般的な技術とは多少異なります。 AIは現在、あらゆる分野に適用されていますが、教育のシナリオに関しては、一般的なシナリオに基づくほとんどのモデルを特定のシナリオに「普遍的に適用」することはできません。王燕氏は鮮明な例を挙げました。例えば、手書き入力方式における手書き認識では、アルゴリズム モデルに「成人の手書き」という前提が想定されています。しかし、宿題の場面では、異なる年齢層の生徒の筆跡は異なり、整頓や整頓に関してそれほど厳しい要件はありません。そのため、教育分野では、AIを具体的なシナリオに基づいて洗練させ、具体的なシナリオに深く入り込んで解決し、一般分野ではうまくいかない問題を解決し、新たなビジネスニーズを探索・発見し、実際の問題を解決する過程で関連技術の発展を促進する必要があります。 広く使用されるものは、一般の人々にとって手頃な価格でなければなりません。 「大規模モデルは、認識できるほどのパフォーマンス向上を達成しましたが、ユーザーに広く使用されるにはまだ遠いです。」 王燕氏の見解では、大規模モデルとマルチモーダル研究は確かに精度の向上をもたらすことができますが、95 から 96 へのタスクの精度の向上などには、多くの場合、計算能力の大きな犠牲が伴います。現在、数千億または数兆のパラメータを持つ大規模モデルをサポートして実行するには、非常に大規模なクラスターが必要です。実際のシナリオでは、使用できる大規模なコンピューティングパワーのクラスターがない場合、本来 1 秒以内に結果を生成できる大規模モデルの実行に非常に長い時間がかかる可能性があります。クラスター ハードウェアのパフォーマンスは継続的に向上し、対応する単位コンピューティング パワー コストは継続的に低下していますが、広く使用できるテクノロジは低コストで手頃な価格である必要があります。ある意味、コンピューティング能力の追求に全力を注ぐのは時間の無駄です。 AI の広範な導入は、革新的な思考とテクノロジー自体の費用対効果の追求に大きく依存します。 数万人のユーザーにメリットをもたらす技術をどのように実現するか、また、目新しい機能を実生活で広く利用してもらうにはどうすればいいのかが重要な課題です。現在、膨大な数のユーザーがおり、毎秒多数のユーザーが使用しているため、「コンピューティングパワーを積み重ねる」アプローチを使用すると、コストは想像を絶するほどになります。今私たちがすべきことは、ユーザーに負担の少ない範囲で、できるだけ多くの機能とサービスを提供することです。一方で、機器がアイドル状態にならないようにコンピューティングパワーの利用率をいかに向上させるかを考え、他方で、毎秒数万回レベルの大規模AIサービスを最も合理的なコストで提供するために、モデルとエンジニアリングアーキテクチャをどのように改善し最適化するかを模索しています。さらに重要なのは、アイデアをどのように革新するかです。問題解決のアイデアを革新し、より多くのユーザーにテクノロジーがもたらす利便性を実際に触れて感じてもらうことでのみ、より大きな価値を生み出すことができます。 ゲスト紹介王燕氏はZuoyebangの主任設計者であり、Zuoyebangインテリジェント技術研究所の所長です。彼は百度知識と百度百科事典の技術ディレクターを務め、現在は左葉邦の知能技術研究室の室長を務めています。人工知能、画像技術、大規模高並行オンラインアーキテクチャなどの技術分野の関連研究と実用化に重点を置いています。彼は主に左葉邦の検索Q&A、AI採点、質問バンクなどの関連業務を担当しています。 |
<<: YOLOv6: 高速かつ正確な物体検出フレームワークがオープンソース化
>>: 今年の英語大学入試では、CMUは再構成事前トレーニングを利用してGPT3をはるかに上回る134点という高得点を獲得した。
畳み込みニューラル ネットワークは通常、限られたリソースで開発され、その後、条件が許せば、より高い精...
スマートフォンや駅で顔認識技術が大規模に導入され始めており、誰もがこの新しい技術に精通しているはずで...
最近、「射雁英雄伝」でアテナ・チュウが演じる「黄容」の顔をAI技術で楊冪の顔に差し替えた動画が、ネッ...
デジタル化が進む世界では、すべてがスピードと個々の顧客ニーズの特定と対応を中心に展開されます。サービ...
2023年は科学技術にとって重要な年と言えます。AI、モノのインターネット、ビッグデータ、クラウド...
[原文は51CTO.comより]先日、#Σcotimebetween#ライブブロードキャストプラット...
IT Homeは11月7日、本日開催されたOpenAI初の開発者会議で、OpenAIが「Copyri...
この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...
ビッグデータ概要2014年にクリミアで戦っていたウクライナ軍兵士たちは、ロシアの無人機を目撃すると、...
3月23日から26日まで、2021年重大健康産業(重慶)博覧会と第6回双品会が重慶で開催されました。...
ロボットが建設業界で重要な役割を果たすことは間違いありませんが、マッキンゼーのレポートによると、プロ...
/* 世界を変えるために生きるここでは、あらゆる作品が市場に参入するための種となる可能性があります...