2000年前に生きていた古代人が1000年前に戻ったとしても、適応できるものは多くないかもしれません。そして、1000年前に生きていた古代の人々が100年前にタイムトラベルしたとしても、変化はそれほど大きくなく、適応するのが難しいと感じるほどではないでしょう。しかし、100年前の古代人がタイムトラベルして現在に来たとしたら、あるいは一部の人々が10年か20年の間「冬眠」しただけだとしても、彼らが直面する現実世界の変化はおそらく世界を揺るがすものとなるだろう。急速な技術進歩は常に破壊的な変化をもたらしています。 12月14日、北京でQuantum位主催のMEET2024 Intelligent Future Conferenceが開催されました。国内で最も影響力のあるスマートビジネスサミットの1つであるMEETカンファレンスは、スマートテクノロジーの最新の動向を総括し、展望し続け、同時に「2023年トップ10フロンティアテクノロジートレンドレポート」が正式に発表されました。 このレポートは、科学技術分野の長期的な追跡と、約100の新興企業、産業研究機関、投資機関との綿密なコミュニケーションを組み合わせて、2023年のトップ10の最先端技術トレンドをノミネートしたQuantum位シンクタンクによって開始されました。 2023 年のトップ 10 トレンドには、AI テクノロジー、自動運転、宇宙コンピューティング、バイオテクノロジー、宇宙探査、エネルギー革新の 6 つの主要分野が含まれます。 具体的には以下が含まれます: インテリジェントエージェントの流行: ビッグモデルによって、人間とコンピューターの相互作用の新しいパラダイムが開拓されました。 1. AIテクノロジーインテリジェントエージェントの流行:ビッグモデルによって人間とコンピュータの相互作用の新しいパラダイムが開かれた今年の大きなモデルの研究開発ブームはAIエージェントの発展も牽引し、強力な「動力エンジン」となった。現在、多くの学術研究では、大規模モデルを AI エージェントの認知コアとして取り上げています。大規模モデルの推論技術と強力な自然言語理解機能は、エージェントに強力な学習および転送機能を提供し、エージェントの研究に画期的な技術的ソリューションを提供します。 今年、インテリジェントエンティティのアーキテクチャにおいて画期的な進歩があり、思考チェーンや思考ツリーといった従来の推論方法が、より柔軟な思考アルゴリズム技術に置き換えられました。 インテリジェントエージェントの相互作用の面では、スタンフォードが提案するAIタウンは、一般の人々がマルチエージェントコラボレーションのメリットを実感できるようにし、より効率的でインテリジェントな意思決定と行動を実現します。 QuantumBits は、将来のインテリジェント エンティティの開発には 2 つの方向があると予測しています。 自律型インテリジェントエージェントとインテリジェントエージェントシミュレーションは、それぞれ B エンドと C エンドのニーズに対応し、複雑なプロセスの効率を向上させ、感情的な価値を提供できるようになります。近い将来、自律型インテリジェントエージェントが組み込まれたソフトウェアは、既存の使用モードを「ユーザーがソフトウェアに適応する」から「ソフトウェアがユーザーの習慣に適応する」へと変え、真の「パーソナルアシスタント」となる可能性が非常に高いです。 3D世代は出現段階に入り、新しいアルゴリズムと新しいモデルが登場し、品質、効率、制御性が日々変化します。AGI が爆発的に普及した今年、ゲーム、映画・テレビ、XR などの業界で 3D データの需要が高まり、3D 生成の分野では画期的な新しいアルゴリズムやモデルが数多く登場し、品質、効率、制御性など、多くの重要なパフォーマンス面での学術研究の進歩が日々進んでいます。 今年の SIGGRAPH2023 で最優秀論文に選ばれた「リアルタイム放射輝度フィールド レンダリングのための 3D ガウス スプラッティング」では、高速かつ高フレーム レートのリアルタイム レンダリングを実現する新しい手法である 3D ガウス スプラッティングが紹介されています。 この新しい表現とアルゴリズムの出現は、3D 生成の分野における大きな進歩であり、そのパフォーマンス (速度、品質、制御性など) は、一部のデータ セットでは NeRF よりも優れています。 今年 10 月、ByteDance の研究チームは、与えられたテキスト プロンプトに基づいて幾何学的に一貫したマルチビュー画像を生成できる新しいマルチビュー拡散モデル MVDream を発表しました。この新しいモデルは、3D 用に生成されたマルチビュー事前分布を適用できるため、分留サンプリングを通じて既存の 2D リフティング メソッドの安定性が大幅に向上し、3D 一貫性の問題が大幅に改善されます。 同時に、今年はいくつかの3D生成最適化モデルが登場しました。今年、OpenAIがリリースしたShap-Eとカリフォルニア大学サンディエゴ校がリリースしたOne-2-3-45により、A!の3D生成の速度と精度が大幅に向上しました。その中でもOne-2-3-45は、わずか45秒で2D画像から高品質で一貫性のある3Dメッシュを生成できます。 11 月にリリースされたばかりのアップグレード版 One-2-3-45++ では、最初に 2D 拡散モデルを微調整して一貫したマルチビュー画像生成を行い、次にマルチビュー調整された 3D ネイティブ拡散モデルを使用してこれらの画像を 3D にアップスケールすることで、3D モデル生成の全体的な品質が向上していますが、速度はほとんど低下していません (45 秒から 60 秒)。 セグメンテーション モデルの統合: コンピューター ビジョンが「ChatGPT の瞬間」を到来させようとしていますSegment Everything Model (SAM) は、Meta が今年発表した AI モデルです。10 月には、関連論文が ICCV 23 で Best Paper Honorable Mention を受賞しました。 SAMの影響を受けて、CV分野と関連研究は2023年に再び「ホット」になるでしょう。 SAM が登場する前は、私たちが目にする他の画像セグメンテーション モデルはすべて独自のモデルであり、その優れたパフォーマンスを他の分野に反映することはできませんでした。 SAM の最大の貢献は、目に見えない画像を素早くセグメント化し、これまで分散していた画像セグメンテーション モデルを統合できることです。 CV 実践者の中には、SAM の出現がコンピューター ビジョンの分野が「GPT 時代」に入った理由であると考える人もいます。 具現化された知能が新たな想像力をもたらす:AGIの究極のシナリオにおける新たな端末今年はヒューマノイドロボットと大型モデルが同時に登場し、具現化された知能(Embodied AI)がAI研究の新たなホットスポットとなった年です。 2023年には、具現化された知能の分野におけるいくつかの重要な技術が画期的な進歩を遂げました。 6月に、フェイフェイ・リー氏のチームは、3D空間内のターゲットと環境障害物を分析できる新しい具現化インテリジェンス成果であるVoxPoserをリリースしました。これにより、ロボットはトレーニングなしで現実世界で直接タスクを実行できるようになります。 DeepMindは今年、インターネットやロボットのデータから自動的に学習し、学習の成功をロボット制御の一般的な指示に変換できる新しい視覚言語モデル「Robotic Transformer 2(RT-2)」をリリースした。 世界中でさまざまな画期的なバイオニックロボット製品が登場しており、大型モデルの影響を受けて、具現化された知能は新たな段階に入ります。 2. 自動運転エンドツーエンドの自動運転がコンセンサスに:BEV+Transformerが技術ルートを再構築今年の CVPR 最優秀論文賞はエンドツーエンドの自動運転に授与されましたが、これはエンドツーエンドの自動運転が業界の未来であるというコンセンサスをほぼ表しています。 生成AIの発展により、ChatGPTに代表される大規模言語モデルの一般化能力が大幅に向上し、エンドツーエンドの自動運転技術が広く注目されるようになりました。 エンドツーエンドの自動運転技術は、すべてのモジュールがニューラルネットワーク化されており、ルールへの依存度が低く、インテリジェントな創発能力とクロスシナリオの応用可能性を備えています。 2023年には、都市NOAが自動運転メーカーの競争の新たな方向性となり、現時点ではTransformerモデルに基づくBEV技術が唯一の選択肢となるでしょう。 BEV+Transformerは、より有用な情報を含む高品質の3Dデータを直接生成し、より合理的な運転指示を生成することができるため、徐々に自動運転認識の主流パラダイムになると期待されています。 さらに、BEV ベースのオブジェクトは、トップダウン ビューを通じて軌道予測とルート計画を完了することができ、画像視点でのスケールやオクルージョンなどの問題を回避できます。これは、エンドツーエンドの自動運転を実現するための鍵でもあります。 3. 空間コンピューティング空間コンピューティングが明確に定義され、消費者向け製品が発売され、XRフルスタックリンクが開かれる6月、AppleはWWDC2023開発者会議で、初の空間コンピューティングデバイスであるApple Vision Proを正式に発表しました。この代表的な消費者向け空間コンピューティング製品の登場により、「空間コンピューティング」の概念がまさに一般大衆に広まり、急速に普及しました。 空間コンピューティングはコンピューティングの次元を増やし、コンテンツをより 3 次元化し、情報をほぼ 100% 復元できるようにします。 空間コンピューティングが次世代のコンピューティングとなり、従来の情報提示とインタラクションのパラダイムを完全に変革するだろうという見解が一致しています。 今年のAIGCの勃興と急速な発展は、デジタルコンテンツの急速な制作と創造の問題を解決し始め、空間コンピューティングの分野でクローズドループを実現し、XRフルスタックリンクを開拓しました。 同時に、空間コンピューティングの 2 つの主要な技術ルートである VST/OST が並行して存在します。代表的な空間コンピューティング製品が商品化されると、XR 開発者エコシステム、コンテンツ エコシステム、サプライ チェーンが徐々に改善されます。 XR デバイスも「空間コンピューティング プラットフォーム」の定義へと移行しており、これにより XR、デジタル ツイン、メタバースなどの分野の成長がさらに加速するでしょう。 4. バイオテクノロジーmRNAが新たな領域を切り開く: 精密医療に新たなソリューションを提供し、バイオメディカルの新たな章を開く今年はmRNA分野が目覚ましい成果を上げ、関連技術がノーベル生理学・医学賞を受賞しました。 これまでは、mRNA技術やヒトの免疫の不安定性などの理由から、新薬の研究開発に応用することができませんでした。脂質ナノ粒子送達技術と塩基修飾技術のブレークスルーによって、mRNAワクチンの応用における困難が解決され、迅速な大量生産が実現しました。 mRNAは安全性、ターゲット数、有効性、製造プロセス、研究開発サイクルの面で利点があるため、予防ワクチン、治療ワクチン、治療薬などの分野に応用できます。 分子設計レベルでは、多数の mRNA コード配列間の検索問題を解決するために、新しい線形設計法が提案されました。動的プログラミング アルゴリズムによって検索範囲が縮小され、mRNA コードの迅速な配置が実現しました。 送達技術の面では、6月にペンシルバニア大学のドリュー・ワイスマン教授とマイケル・J・ミッチェル教授のチームが、mRNAの送達効率を高める新しいアジュバント脂質を合成した。 脳コンピューターインターフェーステストの新たな段階:製品の信頼性の飛躍的進歩、AIによるデータデコード機能の向上脳コンピューターインターフェース(BCI)の概念が提案されてから50年が経ちました。現在、脳コンピューターインターフェース技術はさまざまな医療現場に導入されており、ヒトへの臨床試験段階に入っています。 今年は、脳コンピューターインターフェースの分野で、通常の人が出力するテキストや音声の速度に近づく神経デコードの速度の向上に重点を置いた進歩が見られました。 「ネイチャー」誌は、新しい脳コンピューターインターフェースデバイスを報告する2つの論文を連続して掲載した。ニューラリンクは5月下旬、初のヒト臨床試験を開始するためのFDA承認を取得したと発表した。世界初となる非ヒト霊長類介入型脳コンピューターインターフェース試験が北京で成功裏に実施され、中国の脳コンピューターインターフェース技術における画期的な進歩となった。 5. 宇宙探査再使用型ロケットが「中国軌道」に突入:技術的困難が克服され、商業航空宇宙が閉ループに入る現段階では、ロケットの回収・再利用は世界の航空宇宙産業の発展のトレンドとなっており、多くの中国の民間航空宇宙企業も独自の再利用・再利用可能なモデルを開発している。 宇宙技術の開発と規模は常に打ち上げコストによって制約されてきました。再使用型ロケットは、単発打ち上げロケットと比較して、生産能力が限られている状況でも、より大規模かつ短い打ち上げサイクルを実現できます。 今年7月、国際的に認められた新世代の再使用型ロケットエンジン技術である液体酸素メタンエンジンが工学上の画期的な進歩を遂げ、ブルーアロー・エアロスペース社の「朱雀2号」が軌道に打ち上げられた世界初の液体酸素メタン運搬ロケットとなった。 「世界で最も先進的な再使用型ロケット」と認められたスターシップは、4月と11月に2回の試験飛行を実施し、スラスターとロケットの分離など重要な問題を解決した。これは非常に意義深いことだ。 6. エネルギーイノベーション制御核融合の画期的な成果:点火成功により商業利用の新たな可能性が開かれる今年は、核融合の分野で連続的な進歩がありました。 4月、我が国のEAST装置は、高出力温度で403秒間の定常長パルス高閉じ込めモードプラズマ動作を達成し、トカマク装置の定常高閉じ込めモード動作における新たな世界記録を樹立しました。 8月、わが国の次世代人工太陽「中国循環3号」は科学技術面で大きな進歩を遂げ、初めて100万アンペアのプラズマ電流下での高閉じ込めモード動作を達成しました。 近年、核融合の基盤技術、特に高温超伝導材料のブレークスルーが継続的に起こっており、クリーンかつ低コストの核融合エネルギーの商業化が加速すると期待されています。 核融合は、新たなエネルギー源として、その極めて高いエネルギー密度とクリーンさから、産業界と学界から人類にとっての「究極のエネルギー」と定義されています。核融合が大規模な発電を行えるようになれば、人類社会のエネルギー供給形態は大きく変わることになるだろう。 さらに、高度なコンピューティング能力、衛星インターネット、合成生物学、量子コンピューティングなど、注目に値するノミネートされた技術分野もあります。 |
<<: ディープフェイクの検出が得意なのは誰でしょうか?人間か機械か?
今日、ビジネスに役立つ新たなテクノロジートレンドが数多く存在します。ビジネスマンとして、新しいトレン...
過去 10 年間で、人工知能の分野で大きな進歩が遂げられてきましたが、その中で自然言語処理 (NLP...
今日、サイバー犯罪者は機械学習や人工知能などの新しいテクノロジーを使用して、標的の行動をより深く理解...
中国ではクラウドコンピューティングが10年以上にわたって発展してきました。5G、AI、ビッグデータ、...
[51CTO.comより引用] 近年、わが国の興行収入市場は飛躍的に成長し、2011年には150億ド...
12月29日、生成AIを使ってネットワークセキュリティを支援するという話題が最近かなり人気を集めて...
[51CTO.comからの原文] 人工知能、モノのインターネット、ブロックチェーンなどの最先端技術が...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[433685]]ペアワイズアルゴリズムとは何ですか?次のテストシナリオの場合:ブラウザ: M、O...