過去数年間、機械学習 (ML) とコンピュータサイエンスの分野では多くの変化が見られました。この長い進歩のパターンに従えば、今後数年間で多くの刺激的な進歩が見られるかもしれません。それは最終的に何十億もの人々の生活に利益をもたらし、これまで以上に大きな影響を与えるでしょう。 概要記事の中で、Google AI の責任者であり著名な学者でもあるジェフ・ディーン氏は、2021 年以降に機械学習が最も大きな可能性を秘めた 5 つの分野を強調しました。
記事の具体的な内容は以下のとおりです。 トレンド1: より強力で多用途な機械学習モデル研究者たちは、これまで以上に大規模で強力な機械学習モデルをトレーニングしています。過去数年間で、言語分野は、数百億のトークンでトレーニングされた数十億のパラメータのモデル(110億パラメータのT5モデルなど)から、数兆のトークンでトレーニングされた数千億または数兆のパラメータのモデル(OpenAIの1,750億パラメータのGPT-3やDeepMindの2,800億パラメータのGopherなどの密なモデル、およびGoogleの6,000億パラメータのGShardや1.2兆パラメータのGLaMなどの疎なモデル)へと発展しました。データセットとモデルのサイズが拡大したことにより、複数の言語でのタスクの精度が大幅に向上し、標準的な NLP ベンチマーク タスクが全面的に改善されました。 これらの高度なモデルの多くは、書き言葉の単一だが重要な様式に焦点を当てており、同じドメイン内の複数のタスクにわたっても、言語理解ベンチマークとオープンエンドの会話機能に関する SOTA の結果を実証しています。同時に、これらのモデルは比較的少ないトレーニング データで新しい言語タスクに一般化することができ、場合によっては、新しいタスクにトレーニング サンプルをほとんど必要としないか、まったく必要としません。 LaMDA 言語モデルを使用して Google との会話をシミュレートする Transformer モデルは、スケールから大きな恩恵を受ける画像、ビデオ、音声モデルにも大きな影響を与えています。画像認識およびビデオ分類用のトランスフォーマー モデルは、多くのベンチマークで SOTA を達成しており、画像とビデオ データの共同トレーニング モデルは、ビデオ データのみのトレーニング モデルよりも高いパフォーマンスを達成できることも実証されています。 私たちは、画像およびビデオ Transformer 用のスパースな軸方向の注意メカニズムを開発し、ビジュアル Transformer モデル用に画像をトークン化するより良い方法を見つけ、CNN と比較してどのように動作するかを調べることでビジュアル Transformer メソッドの理解を深めます。畳み込み演算と Transformer モデルを組み合わせると、視覚および音声認識タスクでも非常に有益になります。 生成モデルの出力も大幅に改善されました。これは、過去数年間で大きな進歩を遂げた画像生成モデルにおいて最も顕著です。たとえば、最近のモデルには、1 つのカテゴリのみを指定してリアルな画像を作成したり、低解像度の画像を埋めて自然に見える高解像度の画像を作成したり、任意の長さの空中の自然風景を作成したりする機能があります。 指定されたクラスに基づいて新しい画像を生成するためのカスケード拡散モデルの概略図。 高度なユニモーダルモデルに加えて、大規模なマルチモーダルモデルも開発中です。最も高度なマルチモーダル モデルの中には、音声、画像、言語、ビデオなどの複数の異なる入力モダリティを受け入れ、異なる出力モダリティを生成できるものもあります。これはエキサイティングな方向性です。現実世界と同じように、マルチモーダル データを使用すると、いくつかのことがより簡単に学習できるからです。 同様に、画像とテキストを組み合わせると多言語検索タスクに役立ち、テキストと画像の入力を組み合わせる方法をより深く理解することで、画像の説明タスクを改善できます。視覚データとテキストデータの共同トレーニングは、視覚分類タスクの精度と堅牢性の向上に役立ちます。一方、画像、ビデオ、音声タスクの共同トレーニングは、すべてのモダリティの一般化パフォーマンスを向上させることができます。 新しいタスクに一般化できる、Google のビジョンベースのロボット オペレーティング システムである Robotics のイラスト。 これらすべての傾向は、複数のデータ モダリティを処理し、数千または数万のタスクを解決するようにトレーニングできる、より一般的なモデルの必要性を示しています。今後数年間、私たちは次世代アーキテクチャの道筋を通じてこのビジョンを追求し、この分野で大きな進歩が見られることを期待しています。 トレンド2: 機械学習の継続的な効率向上効率性の向上は、コンピューターのハードウェア設計、機械学習アルゴリズム、メタ学習研究の進歩に由来し、機械学習モデルのより強力な機能を推進しています。モデルのトレーニングと実行に使用されるハードウェアから機械学習アーキテクチャの個々のコンポーネントまで、機械学習パイプラインの多くの側面を、全体的なパフォーマンスを維持または向上させながら効率性を高めるために最適化できます。こうした効率性の向上により、機械学習の効率を大幅に向上させ続けるためのいくつかの重要な進歩が可能になり、より大規模で高品質な機械学習モデルをコスト効率よく開発し、採用をさらに民主化できるようになります。 まず、機械学習アクセラレーションパフォーマンスの継続的な向上です。機械学習アクセラレータの各世代は、以前の世代よりも強力になっており、チップあたりのパフォーマンスが向上し、システム全体のサイズが大きくなることがよくあります。 2021 年に、Google は第 4 世代 Tensor Processing Unit TPUv4 をリリースしました。これは、MLPerf ベンチマークで TPUv3 の 2.7 倍の改善を示しました。モバイルデバイス上の機械学習の機能も劇的に向上しています。 Pixel 6 スマートフォンには、強力な機械学習アクセラレータを統合し、デバイス上の重要な機能を強化する新しい Google Tensor プロセッサが搭載されています。 左: TPUv4 ボード、中央: TPUv4 ポッド、右: Pixel 6 スマートフォンに使用されている Google の Tensor チップ 2 つ目は、機械学習のコンパイルと機械学習のワークロードの最適化の継続的な改善です。ハードウェアを変更できない場合でも、機械学習アクセラレータのコンパイラの改善やその他のシステム ソフトウェアの最適化により、大幅な効率向上を実現できます。 150 の機械学習モデルで ML ベースのコンパイラを使用して自動チューニングを行い、エンドツーエンドのモデル高速化を実現 3 つ目は、人間の創造性によって推進される、より効率的なモデル アーキテクチャの発見です。モデル アーキテクチャの継続的な改善により、多くの問題で一定レベルの精度を達成するために必要な計算量が大幅に削減されました。たとえば、Vision Transformer は、CNN よりも 4 ~ 10 倍少ない計算量で、幅広い画像分類タスクの SOTA 結果を向上させることができます。 4 番目は、より効率的なマシン駆動型モデル アーキテクチャの発見です。ニューラル アーキテクチャ サーチ (NAS) は、特定の問題領域に対してより効率的な新しい機械学習アーキテクチャを自動的に検出できます。ニューラル アーキテクチャ検索の主な利点は、検索空間と問題領域の組み合わせごとに 1 回の作業のみが必要なため、アルゴリズム開発に必要な労力を大幅に削減できることです。 さらに、ニューラル アーキテクチャ検索を実行するための初期の取り組みは計算コストが高いものの、結果として得られるモデルにより、下流の研究および生産環境での計算量が大幅に削減され、全体的なリソース要件が軽減されます。 Neural Architecture Searchによって発見されたPrimerアーキテクチャは、単純なTransformerモデルよりも4倍効率的です。 5番目はスパース性の使用です。スパース性とは、モデルの容量が非常に大きいが、特定のタスク、例、またはトークンに対してその一部のみがアクティブ化されることを意味します。スパース性は、効率を大幅に向上できるもう 1 つの主要なアルゴリズムの進歩です。 2017 年に、私たちはスパースゲートされた専門家混合レイヤーを提案しました。これは、当時の SOTA 高密度 LSTM モデルよりも 10 倍少ない計算量で、複数の翻訳ベンチマークでより優れた結果を達成しました。さらに最近の Swin Transformer もあり、これはハイブリッド エキスパート スタイルのアーキテクチャと Transformer モデル アーキテクチャを組み合わせたもので、結果によると、トレーニング時間と効率の両方が、より密度の高い T5-Base Transformer モデルよりも 7 倍高速であることが示されています。スパース性の概念は、コア Transformer アーキテクチャのアテンション メカニズムのコストを削減するためにも使用できます。 Google Research が提案した BigBird スパース アテンション モデルは、グローバル トークン、ローカル トークン、および入力シーケンスのすべての部分を処理する一連のランダム トークンで構成されています。 トレンド3: 機械学習はよりパーソナライズされ、コミュニティにとってより有益になるGoogle Pixel 6 の Google Tensor プロセッサなどの機械学習とシリコン ハードウェアのイノベーションによって、多くの新しいエクスペリエンスが可能になり、モバイル デバイスは周囲の状況や環境を継続的かつ効果的に認識できるようになります。これらの進歩により、アクセシビリティと使いやすさが向上するとともに、モバイル写真やリアルタイム翻訳などの機能にとって重要な計算能力も向上します。特に、最近の技術の進歩により、プライバシー保護が強化されるとともに、よりパーソナライズされたエクスペリエンスがユーザーに提供されるようになりました。 これまで以上に多くの人々が携帯電話のカメラを利用して日常生活を記録し、芸術的に自分を表現していることがわかります。機械学習を計算写真術に巧みに応用することで、携帯電話のカメラの機能は向上し続け、より使いやすく、より強力になり、より高品質の画像が生成されます。 たとえば、改良された HDR+、非常に暗い場所でも写真を撮る機能、ポートレート処理の改善、あらゆる肌の色調に対応するカメラの強化などにより、ユーザーはより優れた写真を撮ることができます。 Google フォトで利用できるようになった Cinematic Photo などの強力な ML ベースのツールを使って、写真の魅力をさらに高めましょう。 HDR+ は、それぞれ同じ露出のフル解像度のオリジナル画像のセットから始まります (左)。結合された画像によりノイズが低減され、ダイナミック レンジが拡大され、より高品質の最終画像が生成されます (右)。 創造的な表現のために携帯電話を使用するだけでなく、多くの人は、電話のメッセージング アプリでライブ翻訳やライブ キャプションを使用して、他の人とリアルタイムでコミュニケーションするために携帯電話を利用しています。 自己教師学習や雑音のある生徒のトレーニングなどの技術のおかげで、音声認識の精度は向上し続けており、強いアクセント、雑音のある状況、または重複した音声がある環境や、多言語タスクにおいて大幅な改善が見られます。テキスト音声合成の進歩を基に、Google Read Aloud を使用すると、ますます多くのプラットフォームでウェブページや記事を聴くことができるようになり、形態や言語の壁を越えて情報にアクセスしやすくなります。 最近の研究では、視線認識能力が精神的疲労の重要なバイオマーカーであることが示されています。 (https://www.nature.com/articles/s41746-021-00415-6) これらの新しい機能の背後にあるデータは機密性が高い可能性があるため、デフォルトで非公開になるように設計する必要があります。それらの多くは、オペレーティング システムの他の部分から分離されたオープンソースの安全な環境である Android の Private Compute Core 内で実行されます。 Android では、プライベート コンピューティング コアで処理されたデータが、ユーザーの操作なしにアプリケーションと共有されないようにします。 Android では、プライベート コンピューティング コア内の機能がネットワークに直接アクセスすることも防止されます。代わりに、関数はプライベート コンピューティング サービスと少数のオープン ソース API を介して通信します。これにより、識別情報が削除され、フェデレーテッド ラーニング、フェデレーテッド アナリティクス、プライベート情報取得などのプライバシー技術が活用され、プライバシーを確保しながら学習が可能になります。 フェデレーテッド再構築は、モデルをグローバル パラメーターとローカル パラメーターに分割する新しいローカル フェデレーテッド ラーニング手法です。 トレンド4: 機械学習は科学、健康、持続可能性にますます大きな影響を与えている近年、機械学習は物理学から生物学まで基礎科学にますます大きな影響を与えており、関連分野(再生可能エネルギーや医療など)で多くの優れた実用化を達成しています。たとえば、コンピューター ビジョン モデルは、個人的および地球規模の問題の解決、医師の日常業務の支援、神経生理学の理解の拡大、より正確な天気予報の提供、災害救援活動の効率化などに使用されています。他の種類の機械学習モデルは、排出量を削減し、代替エネルギー源の生産量を増やす方法を発見することで、気候変動と闘う上で非常に重要であることが証明されています。機械学習がより堅牢で成熟し、広く利用できるようになると、そのようなモデルはアーティストの創造的なツールとしても使用されるようになるかもしれません。 新たな洞察を得るためのコンピュータビジョンの大規模応用過去 10 年間のコンピューター ビジョンの進歩により、さまざまな科学分野のさまざまなタスクにコンピューターを使用できるようになりました。神経科学では、自動化された再構成技術により、脳組織の薄片の高解像度電子顕微鏡画像から脳組織の神経結合構造を復元することができます。 これまで Google は、ショウジョウバエ、マウス、鳴禽類の脳に関するリソースの作成に協力してきました。昨年は、ハーバード大学の Lichtman 研究室と協力し、あらゆる種の中でこのレベルの詳細さで再構成および画像化された脳組織の最大規模のサンプルを分析し、皮質のすべての層にある複数の細胞タイプにわたる人間の皮質のシナプス接続に関する初の大規模な研究を行いました。この研究の目的は、神経科学者が人間の脳の驚くべき複雑さを研究するのに役立つ新しいリソースを生み出すことです。たとえば、下の画像は、成人の脳にある約 860 億個のニューロンのうち 6 個のニューロンを示しています。 Google が再現した人間の大脳皮質からの 1 つのシャンデリア ニューロンと、その細胞に接続するいくつかの錐体ニューロン。 コンピューター ビジョン技術は、より大規模で世界規模の課題に対処するための強力なツールも提供します。ディープラーニング ベースの天気予報アプローチでは、衛星画像とレーダー画像を入力として使用し、他の大気データと組み合わせて、最大 12 時間の予報期間内で従来の物理ベースのモデルよりも正確な天気予報と降水量予報を生成します。また、従来の方法よりも迅速に最新の予報を生成することができ、これは異常気象が発生したときに重要です。 これらのケースに共通するテーマは、機械学習モデルが、利用可能な視覚データの分析に基づいて、下流のタスクをサポートする特殊なタスクを効率的かつ正確に実行できることです。 自動設計空間探索多くの分野で優れた成果を生み出しているもう 1 つのアプローチは、機械学習アルゴリズムを使用して問題の設計空間を自動的に探索および評価し、可能な解決策を探すことです。あるアプリケーションでは、Transformer ベースの変分オートエンコーダーが美しく便利なドキュメントレイアウトを作成する方法を学習し、同じアプローチを拡張して、可能なレイアウトの空間を探索することができます。 機械学習を活用したもう 1 つのアプローチでは、ゲームのプレイアビリティやその他の特性を向上させるコンピューター ゲームのルール調整の設計空間を自動的に探索できるため、人間のゲーム デザイナーはより優れたゲームをより早く作成できるようになります。 VTN モデルの視覚化。レイアウト要素 (段落、表、画像など) 間の意味のある接続を抽出し、現実的な合成ドキュメント (たとえば、配置や余白が改善されたもの) を生成することができます。 さらに他の機械学習アルゴリズムは、機械学習アクセラレータ チップ自体のコンピューター アーキテクチャ決定の設計空間を評価するために使用されてきました。機械学習を使用すると、人間の専門家が生成したものよりも優れた ASIC 設計のチップレイアウトを、数週間ではなく数時間で迅速に作成できます。これにより、チップの固定エンジニアリング コストが削減され、さまざまなアプリケーション向けの特殊なハードウェアを迅速に作成する際の障壁が軽減されます。 Google は、今後発売される TPU-v5 チップの設計にこのアプローチをうまく活用しました。 この探索的機械学習アプローチは、材料の発見にも応用されています。 Google Research と Caltech のコラボレーションにより、いくつかの機械学習モデルが改造されたインクジェット プリンターとカスタム顕微鏡と組み合わされ、数十万の可能性のある材料を迅速に検索できるようになりました。 これらの自動化された設計空間探索方法は、特に実験の生成と結果の評価の実験サイクル全体を自動化または大部分自動化された方法で実行できる場合、多くの科学分野の加速に役立ちます。このアプローチは、今後数年間でさらに多くの分野でうまく機能する可能性があります。 健康アプリ機械学習は基礎科学の進歩に加えて、より広範囲に医学や人間の健康の進歩を促進することもできます。コンピュータサイエンスの進歩を健康に活用することは目新しいことではありませんが、機械学習は新たな扉、新たな機会、そして新たな課題を開きます。 たとえば、ゲノミクスの分野を考えてみましょう。コンピューティングはゲノミクスの出現以来重要でしたが、機械学習によって新しい機能が追加され、古いパラダイムが破壊されました。 Google の研究者がこの分野で研究を始めたとき、多くの専門家は、シーケンサーの出力から遺伝子変異を推測するためにディープラーニングを使用するというアイデアは非現実的だと考えていました。現在、この機械学習アプローチは最先端のものと考えられています。 機械学習は将来さらに重要な役割を果たすようになり、ゲノミクス企業はより正確で高速な新しいシーケンシング機器を開発していますが、新たな推論の課題ももたらしています。 Google はオープンソース ソフトウェア DeepConsensus をリリースし、UCSC および PEPPER-DeepVariant と協力してこれらの新しい最先端の情報科学機器をサポートし、より高速なシーケンスによって患者に影響を与える応用性がもたらされることを期待しています。 シーケンサー データの処理に加えて、機械学習を使用してゲノム情報のパーソナライズされた健康への利用を加速する機会が他にもあります。広範囲に表現型解析され、配列が決定された個人の大規模なバイオバンクは、人類が疾患に対する遺伝的感受性を理解し、管理する方法に革命をもたらす可能性があります。 Google の機械学習ベースの表現型解析アプローチは、大規模な画像およびテキスト データセットを遺伝的関連研究に使用できる表現型に変換するスケーラビリティを向上させ、DeepNull メソッドは大規模な表現型データを遺伝子の発見に有効活用します。どちらの方法もオープンソースです。 バイオバンクのゲノムデータと組み合わせる解剖学的特性および疾患特性の大規模な定量化を生成するプロセス。 機械学習はゲノムデータに隠れた特徴を見つけるのに役立つのと同様に、他の種類の健康データから新しい情報を発見し、新しい洞察を得るのにも役立ちます。病気の診断では、パターンを認識したり、相関関係を定量化したり、より大きなカテゴリの新しいインスタンスを特定したりすることが多く、機械学習が得意とするタスクです。 Google の研究者は機械学習を使用してこれらの問題の幅広い範囲を解決してきましたが、医療画像における機械学習の応用はさらに進んでいます。糖尿病網膜症のスクリーニングにおけるディープラーニングの使用を説明した Google の 2016 年の論文は、米国医師会雑誌 (JAMA) の編集者によって、この 10 年間で最も影響力のある 10 本の論文の 1 つに選ばれました。 もう 1 つの野心的なヘルスケア イニシアチブである Care Studio は、最先端の ML と高度な NLP 技術を使用して構造化データと医療記録を分析し、臨床医に最も関連性の高い情報を適切なタイミングで提供することで、最終的には臨床医がより積極的かつ正確なケアを提供できるように支援します。 機械学習は、臨床現場でのアクセスを拡大し、精度を向上させるために重要かもしれませんが、同様に重要な新しいトレンドが生まれています。それは、機械学習を応用して人々の日常の健康と幸福を向上させることです。日常的に使用するデバイスに強力なセンサーがますます多く搭載されるようになり、健康指標や健康情報の民主化が進み、人々は健康についてより情報に基づいた決定を下せるようになっています。スマートフォンのカメラは、追加のハードウェアを必要とせずに心拍数や呼吸数を測定してユーザーをサポートできるようになっているほか、非接触型睡眠センサーをサポートして夜間の健康状態をユーザーがよりよく理解できるようにしている Nest Hub デバイスもすでに登場しています。 私たちは、一方では自社の ASR システムで乱れた発話の音声認識の品質を大幅に向上できること、他方では ML を使用して発話障害のある人の声を再構築し、自分の声でコミュニケーションが取れるようにできることを知りました。機械学習を搭載したスマートフォンは、新たな皮膚疾患の研究や視力障害のある人のジョギングの支援に役立ちます。これらの機会は、無視できない明るい未来をもたらします。 非接触型睡眠センシング用のカスタム ML モデルは、3D レーダー テンソルの連続ストリーム (距離、頻度、および時間アクティビティのシーケンスを要約したもの) を効率的に処理し、ユーザーの存在確率と覚醒の可能性 (起きているか寝ているか) を自動的に計算します。 気候危機のための機械学習もう一つの最も重要な分野は気候変動であり、これは人類にとって極めて差し迫った脅威です。私たちは有害な排出の曲線を曲げ、安全で豊かな未来を確保するために協力する必要があります。さまざまな選択が気候に与える影響に関する情報は、さまざまな方法でこの課題に対処するのに役立ちます。 エコルートを使用すると、Google マップは最速ルートと最も燃費の良いルートを表示し、ユーザーは最適なルートを選択できます。 Google マップの山火事レイヤーは、緊急時に重要な最新情報を人々に提供します。 トレンド5: 機械学習のより深く広い理解ML がテクノロジー製品や社会でより広く使用されるようになるにつれて、一部の人だけでなくすべての人が恩恵を受けられるように、公平かつ公正に適用できるよう、新しいテクノロジーの開発を継続する必要があります。 重点分野の 1 つは、オンライン製品におけるユーザー アクティビティに基づいた推奨システムです。これらのレコメンデーション システムは複数の異なるコンポーネントで構成されていることが多いため、その公平性を理解するには、個々のコンポーネントと、それらを組み合わせたときの動作を深く理解する必要があります。 レコメンデーション システムと同様に、機械翻訳ではコンテキストが重要です。ほとんどの機械翻訳システムは、追加のコンテキストなしで単一の文を単独で翻訳するため、性別、年齢、またはその他の領域に関連する偏見を強化することがよくあります。これらの問題のいくつかに対処するため、Google は翻訳システムにおける性別による偏見を減らすための長期的な研究を行ってきました。 機械学習モデルの導入でよくあるもう 1 つの問題は、分布シフトです。モデルのトレーニングに使用されるデータの統計分布が、モデルに入力として供給されるデータの統計分布と異なる場合、モデルの動作が予測できないことがあります。 機械学習モデルのトレーニングに使用されるデータは、下流のアプリケーションでバイアスや公平性の問題を引き起こす可能性があるので、データ収集とデータセット管理も重要な領域です。機械学習におけるこのようなデータ カスケードを分析すると、機械学習プロジェクトのライフサイクルの中で、結果に大きな影響を与える可能性のある多くの場所を特定するのに役立ちます。データ カスケードに関するこの研究は、機械学習の開発者と設計者向けの改訂版 PAIR ガイドブックで、データ収集と評価に関する証拠に基づいたガイダンスを提供します。 異なる色の矢印はさまざまな種類のデータ カスケードを表し、それぞれは通常上流で発生し、機械学習の開発プロセス中に複合され、下流に現れます。 より包括的で偏りの少ない公開データセットを作成することは、すべての人にとって機械学習の分野を向上させるための重要な方法です。 2016 年に Google は Open Images データセットをリリースしました。これには、数千のオブジェクト カテゴリをカバーする画像ラベルと、600 カテゴリの境界ボックス注釈が付けられた約 900 万枚の画像が含まれています。昨年、Google は Open Images Extended コレクションに、より包括的な人物注釈 (MIAP) データセットを導入しました。このコレクションには、人間の階層に関するより完全な境界ボックス注釈が含まれており、各注釈には、認識された性別表現や認識された年齢範囲などの公平性関連の属性がラベル付けされています。 さらに、機械学習モデルの能力が向上し、多くの分野に影響を与えるようになるにつれて、機械学習で使用される個人情報の保護は引き続き研究上の優先事項となります。これに沿って、私たちの最近の研究の一部は、大規模モデルからトレーニング データを抽出することと、大規模モデルにプライバシーを組み込む方法を見つけることの両方によって、大規模モデルにおけるプライバシーの問題に取り組んでいます。 Google は、フェデレーテッド ラーニングと分析に関する取り組みに加えて、他の原理に基づいた実用的な機械学習技術を活用してツールボックスを強化してきました。 [この記事は51CTOコラム「Machine Heart」、WeChatパブリックアカウント「Machine Heart(id:almosthuman2014)」によるオリジナル翻訳です] この著者の他の記事を読むにはここをクリックしてください |
<<: AIはオミクロン変異体の構造を1時間で予測、誤差は原子直径の半分のみ
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
[[408248]]最近、ディープラーニング AI を活用したビデオ監視プロジェクトに携わったことが...
序文最近、アルゴリズムの基礎を固めるために、アルゴリズムの本にある基本的なアルゴリズムをもう一度見直...
[[438709]]大規模なコーパスでトレーニングされた Transformer モデルは、自然言...
9月21日、第三者機関の最新の推計によると、人工知能チャットボット「ChatGPT」のトラフィック...
AI やロボットについて話すとき、多くの人の頭に最初に浮かぶのは、しばしば「終末後の時代」に猛威を振...
[原文は51CTO.comより]先日、#Σcotimebetween#ライブブロードキャストプラット...
01 自然言語生成自然言語生成は、顧客サービス、レポート生成、市場概要などで使用すべくデータをテキ...
[51CTO.com からのオリジナル記事] 周知のように、人、物、オブジェクトは企業管理の 3 つ...
IDC は、2024 年以降の世界の情報技術 (IT) 業界予測レポートを発表しました。 IDC は...
[[373550]]人工知能は、都市をよりスマートで効率的な仕事と生活の場へと変革する道を開きます。...
[[352688]]センサーの電源喪失は IoT の悩みの種です。数百万個のセンサーを導入しても、そ...
Newbing を使い始めてから、CHATGPT 3.5 を諦めました。昨日記事を書いた後、Chat...