認知知能は魔法のようなもの:2021 年の主要なブレークスルーを振り返る

認知知能は魔法のようなもの:2021 年の主要なブレークスルーを振り返る

著者: ユン・チャオ

[51CTO.com からのオリジナル記事]人工知能ソリューションの応用が進むにつれ、視覚、聴覚、触覚レベルでの認識だけでは、もはや「真の知能」に対する一般の人々の期待に応えることができなくなっています。認知知能は、人工知能ブームがさらに天井を突破し、より大きな産業規模を形成できるかどうかを決定する重要な技術とみなされている。

1. 認知によりAIはより実用的になる

認知知能の目標は、人間の脳の思考プロセスをシミュレートし、データと言語を理解、推論、解釈、要約、推論する能力を備え、人工知能を真に「インテリジェント」にすることです。これにより、AI はスマート ロボット、無人運転車、ドローン、AR/VR、パーソナライズされた推奨事項、その他のインテリジェント サービスなど、より大規模なシナリオを実現できるようになります。

一方で、コンピューター ビジョンや音声認識などの知覚技術はボトルネックに直面しています。たとえば、画像認識における適応性と一般性の欠如、医療画像処理における 3D 再構成のパフォーマンスの欠如、AR/VR における環境との効果的なインタラクション、音声認識における意味の多様性などにより、インテリジェンスは知覚から認知へと移行しています。一方、自然言語処理、インテリジェントな対話、インテリジェントな推奨などの認知インテリジェンス技術では、マルチモーダル性と事前トレーニング済みの大規模モデルの研究が盛んになっています。

さらに、AI 技術を活用して、コストを削減し、収益を増やし、効率を改善し、安全性を確保するインテリジェントなアップグレードを実現する方法が、さまざまな業界の実用的な要求となっています。

過去1年を振り返ると、事前学習済みのビッグモデルがブームとなり、インテリジェントな推奨および検索技術が依然として人気を博し、脳コンピューターインターフェースと仮想アンカーが新たなトレンドとなり、Zhujian Intelligence、4Paradigm、Lanzhou Technology、Zhiyuan Research Institute、Minglu Technologyなど多くのテクノロジー企業が認知知能技術の商業化について多くの考えをもたらしました。

2. プレイヤーがゲームに参加する

2021年は、認知知能の発展と産業のデジタル変革が深く融合し衝突し始める年であると言えます。人工知能分野の主要企業も、新世代の認知知能技術を採用しています。

電子商取引分野に注力するLeyan Technologyは、自動応答、詳細なトレーニング対話、擬人化された顧客サービス受付などの特徴を備えた第4世代の顧客サービスロボットシステム「Leyan Helper」をリリースしました。これは、購入者の相談の自動受付、インテリジェントな推奨、インテリジェントなマーケティング、インテリジェントな品質検査などのワンストップ電子商取引インテリジェント顧客サービスソリューションを販売者に提供し、現在2万社以上の電子商取引顧客にサービスを提供しています。

7月、中国人民大学と知源研究所は共同で「文蘭」アプリをリリースした。強力な視覚言語検索機能と、一定レベルの常識理解力を備えています。研究開発チームは、「Wenlan」マルチモーダルモデルに基づいて、気分に合った曲と画像をマッチングできるアプリケーション「AI Mood Radio」も開発しました。

4Paradigmは9月に人民日報と正式契約を締結し、新メディアの主流アルゴリズムを共同で開発しました。大量のコンテンツとユーザー個別のニーズの正確なマッチングを確保するとともに、主流メディアからの高品質コンテンツの発信を可能にし、AI時代のメディア業界の変革と革新を促進します。

iFlytekが発売したFeiyuシステムは、iFlytekのコア音声認識と意味理解技術を統合し、ユーザーがシナリオのニーズに応じてカスタマイズして開発できる豊富なInternet of Vehiclesアプリケーションシナリオを提供します。合理的なシナリオインタラクションロジック設計により、対応するリスクを回避しながら便利に使用できます。同時に、iFlytekは声紋認識、マルチモード音源定位などの技術を通じて、音を特定の人または特定の発音方向にロックすることができ、使用の安全性を保護します。

Hundred Points Technology は、「シンボリズム」の指導のもと、認知インテリジェンス産業の実装のための新しいパラダイムを提案しています。まず、この分野のビジネスのオントロジーフレームワークを構築し、次にディープラーニングとサンプルデータを組み合わせてナレッジグラフのオントロジーと事実データを洗練し、ナレッジグラフアプリケーション内のフィードバック情報に基づいて継続的に調整および最適化します。

3. グラフ研究とビッグモデルがパラダイムとなることが期待される

基礎研究では、知識グラフは知覚知能を認知知能へと推し進めるための最も有望な鍵であると考えられています。ナレッジグラフは、企業が知識をより良く蓄積、継承、再利用し、知識資産の開発と活用の問題を効果的に解決するのに役立ちます。優れた汎用性により、業界を超えて適用でき、企業が継続的に革新的なブレークスルーを達成し、スマート企業へと移行するのに役立ちます。

全体として、ナレッジ グラフは現在、一般的なナレッジ グラフとドメイン ナレッジ グラフに分けられます。セマンティック検索、レコメンデーションシステム、質問応答システムなどの応用シナリオで大きな役割を果たしており、金融、エネルギー、医療、製造、小売など、さまざまな業界のシナリオに影響を与えています。

知識表現の単純さと知識の大規模性により、この方法はセマンティック検索によく適用されています。そのため、Google、Alibaba、Tencent、Bamboo Intelligence、Baidu Smart Cloud、Haizhi Star Map、Baidu Point Technology、Minglu Technology などの多くの研究機関が、ナレッジグラフに関する多数のアプリケーションと研究作業を実施してきました。

同時に、グラフ ニューラル ネットワーク (GNN) は、ディープ ニューラル ネットワークを、従来の非構造化データ (画像、音声、テキスト シーケンスなど) の処理から、より高レベルの構造化データ (グラフ構造など) の処理に拡張します。大規模なグラフ データは、論理的な関係を含む豊かな人間の常識や専門家のルールを表現できます。グラフ ノードは理解可能な記号知識を定義し、不規則なグラフ トポロジ構造は、グラフ ノード間の依存関係、従属関係、論理ルールなどの推論関係を表現します。グラフニューラルネットワークは、機械学習のインテリジェントな強化のための最も重要な実装パスであると言えます。

最後に、マルチモーダルで大規模なモデルの事前トレーニング済みネットワークが、AI 分野の研究開発パラダイムになることが期待されています。例えば、7月には中国人民大学と中国科学院が視覚と言語の関係から出発し、インターネットで生成された6億5000万組の画像とテキストを使用し、自己教師ありタスクを使用して中国最大の汎用画像とテキストの事前トレーニングモデルである五道文蘭を完成させ、マルチモーダル環境でのAI言語学習の可能性を予備的に探りました。公式発表によると、WenLan 2.0は7つの異なる言語を生成し理解することができ、多言語事前トレーニングモデルの新記録を樹立し、画像テキスト検索や画像質問応答などのタスクで世界をリードするレベルに到達しました。

4. テクノロジーのアップグレード、誰が勝つでしょうか?

2021年を振り返って、注目に値する認知技術の応用シナリオは何でしょうか?自然言語処理、インテリジェントな人間とコンピュータのインタラクション、インテリジェントな検索推奨などが、今年、大手AI企業の大きな焦点となっています。

1. 商用NLPテクノロジー

NLP は人工知能の最高傑作です。Microsoft、Google、Tencent などの業界大手は最先端のハードコアな成果を発表しています。

ACL2021 カンファレンスで、Microsoft Research は、クロスランゲージ固有表現認識、コード検索、音楽生成、Hi-Transformer、事前トレーニング済みモデル、セマンティック インタラクションなど、6 つの主要な研究成果を発表しました。その中で、Hi-Transformerは、速度やビデオメモリの制限によりTransformerが処理できない長い文書を処理でき、そのモデル効果は研究者の注目を集めています。

Tencent Kandianとアルバータ大学の研究者は、シンプルだが効果的な事前トレーニング方法「Lichee」を提案した。これは、データ拡張、事前トレーニング エンジン、共通モデル、推論加速などのモジュールを含む、マルチモーダル コンテンツ理解アルゴリズム フレームワーク プロジェクトです。さまざまな粒度の入力情報を活用して、事前トレーニング済み言語モデルの表現機能を強化します。 Lichee は、Tencent Kandian、Tencent Video、Content Pipeline、QQ などのビジネス シナリオに実装されており、ラベル付けされたサンプルの数を平均 40% 以上削減しています。多くの実践的な反復を経て、情報フローコンテンツ理解のニーズの研究開発サイクルを大幅に短縮し、労働効率を向上させることができます。

テンセントAIラボと香港中文大学は、単一言語メモリを使用して高性能なニューラルネットワーク翻訳を実現する方法を開発しました。この研究では、単一言語記憶を使用し、言語間で学習可能な記憶検索を実行する新しいフレームワークを提案します。この研究では、単一言語データを活用できるため、低リソースおよびドメイン適応シナリオにおける提案モデルの有効性も実証されています。

iQIYIディープラーニングクラウドアルゴリズムチームは、ミュンヘン工科大学の研究者と共同で、単眼RGBハンド画像を「見る」ことで高精度の3D再構築を実現できるI2UV-HandNetと呼ばれる高精度ハンド再構築システムを提案しました。この技術はiQiyiの次世代VRデバイスに応用され、ハンドルへの依存度を減らし、仮想世界との高品質な対話を実現し、より軽量で高速、快適なVRデバイスを生み出すことが期待されています。同時に、ジェスチャー再構築とインタラクション技術も、iQIYI の他のビジネス シナリオとハードウェア端末で検討されています。

DeepMind と Google の研究者は、機械学習を使用して、混合整数計画法 (MIP) の例のデータセットから効果的なヒューリスティック アルゴリズムを自動的に構築できることを示しました。実際には、アプリケーションが異なる問題パラメータを使用して、同じ高レベルのセマンティック問題の多数のインスタンスを解決する必要があるユースケースが頻繁に発生します。

過去2〜3年、自然言語の分野では事前学習済みモデルが非常に広く注目されています。大手企業や学校が事前学習済みモデルの研究を行っており、事前学習済みモデルが大きければ大きいほど良いという傾向があります。

しかし、問題もあります。モデルが大きくなるほど、トレーニングのコストが高くなります。サービスを提供する際には、顧客の機械設備の能力も非常に高いことが求められ、ハードウェア能力が低い多くの中小企業では、これらの重量級の事前トレーニング済みモデルを購入する余裕がないことを意味します。こうした問題点を踏まえ、蘭州科技はモデルを小型化することでトレーニング速度を上げ、使用コストを削減できないか検討してきました。その結果生まれたのが、Mencius という軽量の事前トレーニングモデルです。

Mencius の軽量事前トレーニング モデルは、大規模なコーパスを使用して、教師なし方式で大規模な言語モデルをトレーニングします。この言語モデルは、文またはフラグメントを入力し、基本的に各単語と各文の意味を定義できます。機械翻訳や質問応答検索などのシナリオに適用できます。 「事前トレーニングに基づいて、蘭州テクノロジーは新世代の機械翻訳、テキスト生成、業界検索エンジン技術を開発し、業界協力を通じてこれらの技術を実装しました。」

大規模な教師ありデータの技術的配当は徐々に弱まりつつあります。新しいAIインフラストラクチャは、研究開発と導入コストが低く抑えられます。事前トレーニングと自己トレーニングプラットフォームを通じて、最終的には標準化された低コストの複製可能なモデルに沈殿し、業界とより深く統合されて、人件費を削減するより多くの新しいアプリケーションポイントを模索します。

NLPは現在良い時代にあると言えます。まだ解決されていない問題はたくさんありますが、すでに多くの商用アプリケーションが成功しています。 NLP 向け大規模言語モデルのエンジニアリング実装により、デジタル変革の新たな段階が始まります。

2. 商用インテリジェント推奨技術

2021年、アリババの技術チームは、Double Elevenの検索と推奨のシナリオに深層強化学習と適応型オンライン学習を採用し、ユーザーのクリックスルー率を10~20%向上させました。継続的な機械学習とモデルの最適化を通じて意思決定エンジンを確立することで、膨大なユーザー行動と数百億の製品機能をリアルタイムで分析し、すべてのユーザーが製品をすばやく発見できるようにし、類似の購入者を販売者に紹介し、人と製品のマッチングの効率を向上させ、ユーザーのショッピング体験を大幅に向上させることができます。

ByteDanceの技術チームは、クラウド機能を組み合わせて、Volcano Engineがリソースエコシステムの柔軟性をさらに高め、アルゴリズムの効果をパーソナライズできるようにしました。また、ローカルパッケージサイズの問題を解決し、リソースの動的な引き出しと使用を可能にしました。強力な運用プラットフォームと組み合わせることで、企業にさらに適切なパーソナライズされたカスタマイズサービスを提供できます。

機密情報ビジネスの分野では、58 の技術チームが、ビジネス連携のための包括的なランキングフレームワークやマルチチャネルのディープラーニングモデルなど、検索および推奨機能の構築において建設的なキープラクティスを実現しました。現在の産業アップグレードの波の中で、さまざまなニーズを持つユーザーのユーザーエクスペリエンスとクリックスルーコンバージョン率が大幅に向上しました。

QQ Browser Labは、「Shenzhou」と呼ばれる事前トレーニング済みモデルを独自に開発しました。このモデルは、数百億のパラメータをトレーニングする能力を持ち、検索、推奨、コンテンツ理解など、さまざまなビジネスシナリオに直接的な支援を提供し、さまざまな自然言語理解アルゴリズムの有効性を向上させることができます。このモデルにより、コメント理解や検索クエリ推奨など、QQブラウザ事業におけるNLP要件が満たされるだけでなく、ラベル付けデータの量とそれに伴う必要な研究開発時間が40%以上削減され、ラベル付けコストが節約され、研究開発効率が大幅に向上します。

クリックスルー率、コンバージョン率、マッチング効率からビジネス連携、研究開発効率、ユーザーエクスペリエンスまで、インテリジェント検索と推奨の発展は、静かで驚くべき力で社会のあらゆる側面を変革しています。

3. インテリジェントダイアログの商業利用

会話型ロボットは、業界で認知知能技術の最も人気のある応用分野です。認知知能により、機械は人間と同じように自然に、流暢に、そして興味深くコミュニケーションできるようになります。スマートスピーカー、スマートカスタマーサービス、デジタルヒューマン、スマートコンパニオンロボットなどの製品が、人々の生活や仕事にますます登場しています。

百度は9月に世界最大の対話生成モデル「PLATO-XL」をリリースした。インテリジェントな人間とコンピュータの対話の分野では、PLATO-XLはFacebook、Google、Microsoftが発表した最新の対話モデルを上回り、中国語と英語の人間とコンピュータの対話効果は世界をリードしています。

11月、テンセントデジタルエコシステムカンファレンスのクラウドインテリジェンスセッションで、テンセントクラウド小威は新世代のマルチモーダルヒューマンコンピュータインタラクションテクノロジーに基づく新しいデジタルインテリジェンス製品マトリックスを発表しました。文化観光ガイド、金融カスタマーサービス、多言語アンカー、手話アンカーなど、さまざまな専門的アイデンティティとスキルを備え、カスタマイズされた役割サービスを提供できます。デジタルインテリジェンスは、イメージを表現し、認識し、知覚し、理解する能力を持っています。34以上の言語と方言を認識でき、46万以上の垂直産業シナリオのホットワードライブラリを持っています。

ハルビン工業大学の研究チームは、知識グラフと冬季オリンピックのテーマコンテンツを組み合わせて、冬季オリンピック向けのインテリジェントな顧客サービスロボットを構築しました。このロボットは、スポーツイベントのチケットの問い合わせや予約、交通ルートの計画などのユーザーのニーズを満たし、冬季オリンピックの知識グラフに基づく多段階の対話を実現します。

OPPOが立ち上げた「Xiaobu」は、ユーザーのリクエストテキストに基づいてユーザーの現在の感情状態を分析し、ユーザーに人間的な応答を与えようとします。例えば、ユーザーが孤独や悲しみに関連するテキストを表現すると、ユーザーの気分をすぐに理解し、それに応じた慰めを提供することができます。

12月、「新華社AI合成アナウンサーと仮想人間との初対話」が注目を集めた。スーツとネクタイを着用し、極めて標準的な中国語を話し、生き生きとした手振りを見せるAI合成男性アナウンサーが、同じくフォーマルな服装をした別のAI合成女性アナウンサーと会話を交わした。

さらに、脳コンピューターインターフェースやスマートコネクテッドカーも、今年の認知インテリジェンスの人気の応用シナリオです。

5. 長く困難な道のり、上へ下へと探し続ける

1. さらなるAIインフラが必要

清華大学知識知能共同研究室所長の唐潔教授は、認知知能が重要なブレークスルーを達成するには「まだインフラが不足している」と述べた。たとえば、一般的な知識グラフの構築は、時間と労力を要する基本的なプロジェクトです。たとえば、NLP の分野では、形式的な知識システムには明らかな構造上の欠陥があり、エンティティ間の関係が浅く、また、深く構造化された意味解析には明らかなパフォーマンス上の欠陥があります。一言で言えば、システムは大きいが強力ではない。

特定の分野に焦点を合わせる場合、アルゴリズム、業界データ、業界の専門家という 3 つの要素が不可欠です。これは実践者に対して実際的な要求を突きつけており、実践者は「デモレベルのデモンストレーションだけを行う」や「PPT スタイルの自慢」といった非現実的な考え方を捨て、認知インテリジェンスの構築とアップグレードを長期的な価値の考え方で扱うべきである。アプリケーション層だけのイノベーションでは決して十分ではありません。基盤となるテクノロジーのイノベーションだけが、認知知能のレベルを劇的に変えることができます。

2. さまざまなセグメントにおける製品テスト基準の開発と改善が必要

近年、認知知能の標準化は、国内外の標準化団体、企業、学界からますます注目を集めています。 7月に中国情報通信研究院と竹知能が共同で発表した「2021年認知知能発展研究報告」によると、国際標準、国家標準、業界標準などの分野を網羅し、発表済みまたは開発中のさまざまなタイプの標準が30件以上あることが示された。一般的な規格は開始されていることがわかりますが、各応用分野ごとの製品テスト規格はまだ解決されていません。例えば、スマートシティの実際の構築においては、科学的かつ合理的な都市ガバナンスの規範や、正確かつ効率的なシミュレーションおよび推論技術システムがまだ不足しています。

3. 複雑な環境における偏見と不確実性

認知インテリジェンスの実際の応用シナリオでは、解決すべき問題がまだ多く残っています。たとえば、現在の複雑な都市環境では、シナリオ推論、インテリジェントな推論、意思決定技術において認知上のボトルネックが発生しています(経験的データによる誤った帰属により、犯罪予測アルゴリズムは人種を差別する傾向があります)。既存のモデルは常識/客観的な法則に関する知識が不完全であり、オープンで動的かつ実際の都市環境における推論と意思決定の問題を解決するのは困難です。

4. 多分野にわたる連携の統合を推進する必要がある

認知知能は、理論、技術、アプリケーションの完全なシステムです。認知知能の実現は、脳科学、心理学、論理学、言語学など複数の分野の国境を越えた統合と共通の進歩と切り離せないものです。しかし、複数の分野の統合と進歩には一定のギャップがあります。しかし、少数の分野で「コンロ上」研究を行うだけでは、認知知能のレベルは必然的に不十分なものになってしまいます。

VI. 将来の見通し

基礎研究から商業的探究まで、認知インテリジェンスは今後数年間で次の 4 つの大きなトレンドを示す可能性があります。

1. ナレッジグラフは徐々に自動化されつつある

まず、現在のナレッジグラフ構築技術の開発効率は比較的低く、主なボトルネックは主に手作業による構築に依存していることです。データ収集、データクリーニング、データ比較から最終的なグラフ構築まで、プロセス全体の自動化度は低いです。第二に、ナレッジグラフの構築は依然として専門家の知識入力に大きく依存しています。現在、市場に出回っているナレッジグラフ製品は、一般的に業界属性が強く、製品の汎用性が低いため、技術の大規模な応用を妨げています。

このため、多くのメーカーがプラットフォームソリューションの検討を始めています。たとえば、Zhujian Intelligence は、知識工学のためのプラットフォーム製品である Gemini を発売しました。このプラットフォームに基づいて、ユーザーは一般的なナレッジグラフと業界のナレッジグラフを独自に構築してナレッジ管理とナレッジ検索を行うことができ、ビジネスプロセスにおける手動テキスト処理に必要な時間を大幅に短縮し、企業のデータアプリケーション問題を解決します。第4パラダイムナレッジグラフ(第4パラダイムKB)は、大量の専門知識をモジュール形式で第4パラダイムNLP製品にカプセル化します。これは、一般的なビジネス担当者が簡単なトレーニングを受けた後に使用できるフルプロセスナレッジグラフプラットフォームであり、さまざまな業界や分野に知識主導の複雑なアプリケーション分析と意思決定サポートを提供します。

2. 大型モデルと小型モデルが互いに補完し合う

現在、人工知能の発展は知覚知能から認知知能へと急速に進歩しており、超大規模な事前トレーニングモデルは世界的な人工知能技術の研究開発におけるホットスポットと競争の焦点となっています。テンセント、Sogou、ファーウェイ、アリババDAMOアカデミーなどの大手企業が、権威ある中国語言語認識評価ベンチマーク(CLUE)リストを次々と独占してきました。

注目すべきは、蘭州科技が発表した軽量事前トレーニングモデル「Mencius」が、10億のパラメータを持つ従来のモデルが更新した記録を、10億のパラメータで達成し、初戦でCLUEリストのトップに立ったことだ。

もちろん、大きなモデルが実用化されるまでにはまだまだ時間がかかり、現在はそれを微調整して小さなモデルに圧縮してからリリースする必要があります。通常、小さなモデルのサイズは数十メガバイト程度で、ソフトウェアとハ​​ードウェアを最適化した後にのみ正常に使用できます。

企業のデジタル化とインテリジェント化への強い需要と、事前トレーニング済みモデルの技術開発により、認知インテリジェンスの分野は必然的に新たな飛躍を迎えることになるでしょう。

3. マルチモーダル融合

会話型ロボットを例にとると、現在、感情は主にテキスト情報に基づいて識別され、次に音響または視覚的特徴分析に基づいて識別され、音響情報とテキスト情報を組み合わせてユーザーをよりよく理解します。 Appleは、ユーザーの音声リクエストの音量に応じて、ユーザーへの応答の音量をリアルタイムで調整できる技術を発明しており、Googleは、ユーザーの視線の焦点に基づいて、ユーザーが実際にスマートアシスタントに話しかけているかどうかを判断する方法を研究している。

4. 単一ポイントのアルゴリズム革新からフルスタック革新への移行

業界のアプリケーションが徐々に深化するにつれて、単一ポイントのアルゴリズム革新を通じてアプリケーション効果を大幅に向上させる方法はもはや存在せず、フルプロセス、フルスタックのアプローチが必要です。

実装シナリオの複雑さと実際のニーズの多様性により、将来のインテリジェント アプリケーションは、産業コラボレーションとシステム統合を通じて、洗練された大規模な統合インテリジェント ネットワークに組み込まれる必要が生じます。

そのためには、計算知能や知覚知能などの関連技術を継続的に活用・継承した上で、認知科学の発展を軸に、脳科学、心理学、論理学、言語学など複数の学問分野の共通の進歩と国境を越えた統合を推進していくことが求められます。

7. 最後に

有名な小説家アーサー・C・クラークは「十分に発達した技術は魔法と区別がつかない」と言いました。完全に開発された人工知能は、最終的には魔法のように、機械に人間のような意識を与えるでしょう。認知知能に代表される新世代の情報技術は、必然的に社会のあらゆる側面に大きな影響を与えるでしょう。

全体的に、認知知能はまだ初期段階にあります。科学技術の更新と反復が急速に進む今日の世界では、どのように協力的なイノベーションを継続し、人工知能のエネルギーを解き放ち、業界に真の力を与えることができるかは、待つだけの価値があります。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  フレームワーク作者の視点から:Reactスケジューリングアルゴリズムの反復プロセス

>>:  2021年のAIチップの在庫:「2つの壁」を破り、ストレージとコンピューティングを統合することがトレンドに

ブログ    
ブログ    
ブログ    

推薦する

CV の世界における 3D ビジョンの究極の実現: コンピューターがこの 3 次元の世界を「見る」方法

携帯電話を開くと顔がロック解除されます。VR と AR 技術は、このような仮想でありながら現実のシー...

待望のAIは人工知能か、それとも人工的な愚かさか?

[[399557]]人工知能という言葉が初めて世間の注目を集めたのは、1956 年にダートマス大学...

STLコンポーネントアルゴリズム

STL は、OOP と従来のプログラミングの両方で使用できる多数のテンプレート クラスと関数を提供し...

それは杞憂ではありません!人工知能が人間の労働に取って代わろうとしている

[[261973]]最近、人工知能に対する大規模な企業投資が数多く行われており、この技術が実用化され...

詳細レポート: ビッグモデルが AI を全面的に加速させます!黄金の10年が始まる

過去70年間に「3つの上昇と2つの下降」を経験した後、基盤となるチップ、コンピューティングパワー、デ...

人工知能は正面の顔に基づいて複数の横顔を生成し、生成的敵対ネットワークを使用して多角度の側面顔を生成します。

人工知能は正面の顔に基づいて複数の側面の顔を生成し、生成的敵対的ネットワークを使用して多角度の側面の...

機械学習がソーシャルメディアのプロフィールから明らかにする5つの秘密

[51CTO.com クイック翻訳] 現在、大手データ企業は機械学習技術を積極的に活用し、人間社会に...

3Dマスクは顔認識を破ることができるのか?アリペイとWeChatが緊急対応

顔認証決済はますます普及しつつあるしかし、この技術の安全性については激しい議論が交わされています。映...

...

データ構造とアルゴリズム: 単調に増加する数値

[[439817]]単調に増加する数字LeetCode の問題へのリンク: https://leet...

最も偽のGANモデル! Facebook、史上最強の移行機能を備えたIC-GANをリリース

[[425904]] GAN モデルは優れていますが、トレーニング データに対する要件が高すぎるため...

分散ID生成スノーフレークアルゴリズム

一意の ID はデータの一意性を識別します。分散システムで一意の ID を生成する方法は多数あります...

モバイクの尹大飛氏:人工知能が何百万台もの自転車の運行改善に貢献

[51CTO.comより引用] 2017年7月21日から22日まで、51CTO主催の人工知能をテーマ...

Zhiyuanは3億個のセマンティックベクトルモデルトレーニングデータを公開し、BGEモデルは反復と更新を続けています

大規模モデルの開発と応用が急速に発展するにつれ、大規模モデルの中核となる基本コンポーネントとしての埋...