2022年のGoogle I/Oカンファレンスでは、参加者のほとんどがGoogleの社員であったにもかかわらず、講堂はついに再び満席となった。 「過去1年間、私たちはコンピュータサイエンスの最新の進歩を共有してきました。私たちの目標は常に、世界中の情報を誰もがアクセスできるようにすることです」とグーグルのCEO、サンダー・ピチャイ氏は冒頭の挨拶で述べた。 本日のカンファレンスで Google がデモしたアプリケーションのほとんどは、誰でも使用でき、すぐにインストールされる無料のアプリケーションでした。 機械学習ツールにより、このビジョンはほぼ現実のものとなりつつあります。 Google 翻訳の実用的な機械学習モデルは、バイリンガルコーパスを必要とせずに、すでに独自に新しい言語を学習できます。 翻訳システムは、人工知能における最も古典的なタスクの 1 つです。Google の機械翻訳は、長年にわたる開発プロセスで常に主導的な地位を維持しており、Transformer 事前トレーニング済みモデルなどの重要な AI テクノロジも生み出してきました。 I/Oカンファレンスで、Googleは翻訳システムにニッチなアメリカ先住民の言語を含む24の新しい言語が追加され、合計3億人の人々をカバーしていると発表した。 コンピューター ビジョンの分野では、Google マップは 3D 再構築テクノロジーを使用して、完全に無料の没入型ビューを実現しています。空はリアルタイムの天気のように見え、レストランに「歩いて入る」ことさえできます。 実際の環境をシミュレートするゲームを携帯電話でプレイするようなものです。 動画サイトYouTubeでは、DeepMindが訓練したAIが8000万本の動画を自動でチャプターに分割し、視聴者が最も興味のある部分に自動的にジャンプできるようにし、16種類の自動翻訳字幕も用意した。 最先端の事前トレーニング済み大規模モデルが日常業務で使用されています。 「まだ読んでいない25ページの文書があり、誰かと議論を始めようとしているとき、どうしますか?」とピチャイ氏は語った。 Google ドキュメントには現在、数十ページの文書を数文に要約できる自動要約機能が搭載されています。これは自然言語処理 (NLP) の分野における大きな飛躍であり、過去の最高の機械学習の能力を上回っています。 GoogleのAIはドキュメントだけでなく、チャット内容の要約も提供できる。自動文字起こしや要約機能もGoogle Meetに導入されており、今後は議事録を書く必要がなくなる。 Google 副社長の Prabhakar Raghavan 氏は、Google のコアビジネスである検索の改善について紹介しました。今後は、いつでもどこでも、どんな入力方法でも検索ができるようになる予定です。 Google 検索は、キーワードを入力するだけでは満足できなくなり、より自然で論理的な言語、音声、ビデオを通じて完了できるようになりました。 先月、Google は写真を撮って質問することで Google アプリ内で検索できる Multisearch を開始しました。これは、携帯電話で写真を撮って「これが買いたい、どこで買える?」と言うなど、言葉では表現できないものを検索できるようにする強力なアイデアです。 または「花をこのように見せるにはどうしたらいいでしょうか?」 Prabhakar Raghavan 氏は、将来的には Multisearch がローカル検索機能も強化し、今年後半にはさらに多くの国をカバーし、多言語バージョンをリリースする予定であると述べました。 これは単なる写真撮影とテキスト記述による検索ではありません。このアプリはアルゴリズムを使用してビデオ内のシーンをつなぎ合わせ、ナレッジグラフ分析を使用して画像の内容を導き出します。Google は正確なオブジェクト認識を行い、役立つ提案を提供できます。携帯電話のカメラで棚をスキャンすると、各チョコレートバーに対するユーザーの評価が表示されます。 この機能は「シーン探索」と呼ばれ、現実世界に Ctrl + F ショートカット キーをインストールするのと同じように、AR 分野におけるこれまでのデモの中で最高のものかもしれません。 Googleはアルゴリズムの公平性を向上させるため、ハーバード大学のモンク教授と協力し、検索結果に人の肌の色をより正確に反映できる「モンク・スキン・トーン・スケール」を開発した。 画面付きのスマートスピーカーであるGoogleのNest Hubでは、毎回「OK Google」と言う必要がなくなりました。新しい視線機能は、人と人がコミュニケーションをとるときに行うアイコンタクトとまったく同じです。ウェイクアップワードを使わずにスピーカーに話しかけることができます。 クイック フレーズ機能はより直接的です。「電気を消して」、「カーテンを開けて」などの命令文を言うだけで、Google アシスタントにタスクを完了するように指示できます。 人間と音声アシスタント間のコミュニケーションをよりスムーズにするために、より多くの機械学習モデルがローカルで実行されるようになり、応答の遅延が大幅に削減されました。 すべてが人間化に向かっています。 次世代AIモデル舞台裏では、Google は人工知能の最前線を探求してきました。 Googleの会話型AIモデルLaMDAは今年、第2世代にアップグレードされました。新しいモデルでは会話の質が大幅に向上しています。AIテストキッチンでは、トピックを継続的に選択することで、モデルにストーリーを自動生成させることができます。 また、アドバイスをくれる機能も搭載。会場では「小さな庭の始め方」というテーマの実演が行われました。AIが継続的に提案してくれるほか、知りたい方向を選んで深掘りしていくことも可能です。 「これは言語モデルの将来的な可能性を示しており、新しい都市に引っ越したときに多くの問題を解決するのに役立つ可能性がある」とピチャイ氏は語った。 昨年、ジェフ・ディーン氏が率いるチームは、「次世代汎用 AI アーキテクチャ」パスウェイを提案しました。これは、1 つのアーキテクチャを使用して複数のタスクを同時に処理し、新しいタスクを迅速に学習して世界をよりよく理解できるようにすることを目的としています。 今年 4 月に提出された論文「PaLM: Pathways による言語モデルのスケーリング」では、Google の研究者が Pathways システムを使用して、5,400 億のパラメータを持つ大規模な言語モデル、PaLM (Pathways Language Model) をトレーニングしました。 これはデコーダー専用の Dense Transformer モデルです。完了できるタスクには、コードの自動生成、数学の問題の解決、バグの修正、ジョークの説明などがあります。 ピチャイ氏は、言語モデルの利点は原因と結果を区別し、文脈における概念の組み合わせを理解できることだと述べた。このアプローチを使用することで、数学の問題に対するモデルの精度は 58 パーセントに向上し、9 歳から 12 歳の子供の 60 パーセントが問題を解くレベルに近づきました。 PaLM は、モデルが対応するコーパスでトレーニングされておらず、新しい言語での質問応答用にトレーニングされておらず、翻訳用に特別に設計されていないにもかかわらず、ベンガル語で質問し、正しく回答できるようになりました。 ジェフ・ディーン氏が語った理想的な汎用AIモデルは現実のものとなったのでしょうか? 新しいAndroid 13システム:ユーザーエクスペリエンスをカスタマイズ毎年開催されるI/Oカンファレンスは、Androidシステムの新バージョンを発表する場です。今年はすべての端末を網羅することに重点が置かれており、Googleはすべてのハードウェアも製造しています。 長年にわたり、Android は世界で最も人気のあるオペレーティング システムになりました。昨年だけでも、消費者は 10 億台の新しい Android スマートフォンをアクティベートしました。機械学習が進歩するにつれて、携帯電話はこれまで想像もできなかったことを実現できるようになります。携帯電話は依然として最も人気のあるコンピューティング形式ですが、人々は車、テレビ、時計などのコネクテッドテクノロジーを生活に取り入れる傾向が高まっています。人々は、これらのデバイスが互換性があり、手間がかからず、トラブルがないものであることを望んでいます。 Google I/O カンファレンスで、次の 3 つの新機能を備えた Android 13 がついにリリースされました。
まずモバイルデバイスを見てみましょう。 Android 13 はより多くの方法でユーザーのスタイルに適応し、すべてのアプリ アイコンを独自のカラー テーマに統合できます。 Android 13 には、ユーザーが聴いている音楽に基づいて外観をカスタマイズできる新しいメディア スペースもあります。さらに、ユーザーはアプリケーションごとに異なる言語を設定して、ユーザーエクスペリエンスをパーソナライズできます。 Android 13 では、セキュリティとプライバシーに関する機能も多数追加されています。他の人にメッセージを送信するときは、相手のプライバシーとセキュリティも確保する必要があります。このため、Android 13 ではテキスト メッセージを「RCS」と呼ばれる新しい標準にアップグレードし、エンドツーエンドの暗号化などの重要なプライバシー保護を可能にしています。これはモバイルエコシステムにとって大きな前進です。現在、Google のメッセージング アプリには、月間 5 億人の RCS アクティブ ユーザーがいます。 Google は、すべてのモバイル デバイスが RCS 標準にアップグレードされることを望んでいます。 携帯電話と財布は人々の日常生活に欠かせないアイテムですが、問題は、携帯電話が財布の代わりになるかどうかです。 Google は次世代の Google Wallet を発表しました。この Android デジタル ウォレットを使用すると、日常のニーズに迅速かつ安全にアクセスできます。 Google ウォレットはクレジットカード情報を安全に保存するため、Google Play が利用できる場所であればどこでもタップするだけでお支払いいただけます。 Google ウォレットは支払い以外にも、学生証の提示、フライトのチェックイン、車のエンジン始動、ディズニーランドのチケットとしての利用など、さまざまな用途に使用できます。同時に、Google は今年後半に Wallet にデジタル ID を導入する予定です。運転免許証をはじめ、NFC 経由で QR コードをタップまたはスキャンするだけで、携帯電話を他人に渡すことなく ID 情報を共有できます。 Google Wallet は、今後数週間以内に Android および WearOS デバイスで世界中で利用できるようになります。 さらに、今年後半には Android 13 で WearOS デバイスに緊急 SOS が導入され、信頼できる家族や友人に即座に連絡したり、時計から直接助けを求めたりできるようになります。 Android 13 の地震早期警報システムは、早期警報を実現するために、世界中の危険度の高い地域にも拡大されます。 Google は、携帯電話に加えて、タブレットや時計などの個人用デバイスでも優れた Android エクスペリエンスを提供することに取り組んでいます。 WearOS デバイスは昨年から 3 倍に増加し、大画面デバイスのアクティブ ユーザー数は 2 億 7,000 万人に達しています。注目すべきは、Android は現在、ポケットにタブレットのような体験をもたらす唯一のシステムであり、折りたたみ式デバイスは携帯電話の携帯性と大画面デバイスの利点をすべて兼ね備えているということです。 次のステップは、複数のデバイスに互換性を持たせ、連携させることです。この目的のために、Google は Fast Pair テクノロジーを開発しました。これにより、ユーザーは設定を管理することなく、携帯電話、タブレット、テレビを簡単にペアリングし、ヘッドセットやスマート デバイスとの即時接続を実現できます。 しかし、このような便利な相互接続機能を家庭内のあらゆる機器に普及させたい場合には、「matter」を利用する必要があります。これは今秋リリースされるオープンな業界標準であり、Google のハードウェアを電球、ドアロック、スマートプラグなどのサポートされている数百の製品に接続します。これらの Matter 対応デバイスは、わずか数秒で自宅、ネットワーク、Google Home に接続し、Fast Pair 経由でお気に入りのアプリに接続します。 Google の新しいスマートフォン: Pixel 6a と Pixel 7/7 Pro Googleは2021年10月、自社開発のTensorチップを初めて採用した新しいPixel 6と6 Proスマートフォンを発売した。 Tensorチップの名称は、Googleが提唱するディープラーニングフレームワークTensorFlowや、GoogleのサーバーチップTPUを思い起こさせます。その設計目的は、Googleの最先端のAI技術を携帯電話に直接もたらすことです。 I/Oカンファレンスで、Googleはわずか449ドルの新しい手頃な価格のスマートフォン、Pixel 6aを発表しました。 Google は「この価格では史上最高のスマートフォンです」と語っています。Pixel 6a は、カーボン ブラック、ピンク ホワイト、グレー グリーンの 3 色で提供されます。予約注文は7月21日より開始され、7月28日より店頭販売が開始されます。 Pixel 6a の外観スタイルは Pixel 6 シリーズと一致しており、ユニークなツートンカラーの外観、スリムなベゼル、6.1 インチ AMOLED 1080p ディスプレイ、IP67 の防塵・防水性能、60Hz のリフレッシュ レートを備えています。カメラに関しては、Pixel 6a には 12 メガピクセルのメイン レンズと超広角レンズを含むデュアル背面カメラ システムが搭載されています。前面の自撮りカメラは800万画素です。 さらに重要なのは、Pixel 6a には Pixel 6/6 Pro と同じ Tensor プロセッサと Titan M2 セキュリティ チップが搭載されており、5G 接続をサポートしていることです。 Pixel 6a は、より優れたパフォーマンスとより充実した AI を活用したエクスペリエンスをより低価格で提供し、ユーザーは Pixel 6/6 Pro と同じ優れた Android エクスペリエンスに加えて、独自の写真撮影、音声、セキュリティ機能を楽しむことができます。 GoogleはPixel 6aに加え、今秋発売予定のPixel 7および7 Proシリーズも発表した。これらにはGoogleが独自に開発した次世代Tensorチップが搭載され、音声、写真、ビデオ、セキュリティの分野でAI主導のさらなる進歩と極めてパーソナライズされた体験がもたらされる。もちろん、Pixel 7/7 Pro には Android 13 システムがプリインストールされており、最新のモバイル オペレーティング システムによってもたらされる多くのメリットを享受できます。 中でも、Pixel 7 Pro ではアルミニウム素材をカメラ全体にまで広げており、Pixel のデザイン言語がさらに進化しています。トリプルカメラシステムは、写真撮影、パフォーマンス、デザインにおいて新たな基準を打ち立てます。 良い携帯電話には良いヘッドフォンが欠かせません。新しいワイヤレスヘッドフォン Pixel Buds Pro が I/O カンファレンスで発表されました。 Buds Pro には、Google が設計した最高のモバイル オーディオ ハードウェアが組み込まれているだけでなく、アクティブ ノイズ キャンセレーションを搭載した初のヘッドフォンでもあります。 Google によれば、このヘッドフォンは新しいカスタム オーディオ プロセッサに基づいて設計されているため、今日のヘッドフォンの中では最高のノイズキャンセリング機能を備えているとのことです。 耳は人それぞれ異なるため、イヤーチップが必ずしも完璧に密閉されるとは限らず、外部から音が漏れる可能性があります。この問題に対処するため、Google のアクティブ ノイズ リダクションでは、新しいサイレント シーリング テクノロジーを使用して音漏れを補正し、ノイズを最大限に除去して、邪魔にならない没入感のある高品質のサウンドを実現します。 しかし、時には周囲で何が起こっているのかを聞きたいときもあります。そんなときは透明モードが役立ちます。外部の音を取り込むので、ヘッドホンをまったく装着していないかのように周囲の世界を体験できます。 カスタム オーディオ チップは電力効率を向上させるように設計されているため、Pixel Buds Pro は 1 回の充電で最大 11 時間、ノイズ キャンセル モードで 7 時間使用できます。イヤホンは便利なハンズフリー体験も提供し、40 以上の言語でリアルタイム翻訳を取得するなど、アシスタントにさまざまなことを質問できます。マルチポイント接続を同時にサポートし、互換性のある携帯電話、タブレット、ラップトップ、テレビ間で切り替えます。また、今年後半には空間オーディオをサポートするようにアップデートされる予定で、これにより、互換性のある Pixel スマートフォンで映画やテレビをより臨場感を持って視聴できるようになります。 新しい Pixel Buds Pro は 4 色展開で、価格は 199 ドル、7 月 21 日から予約注文可能、7 月 28 日に発売されます。 長らく噂されていた Google Pixel Watch が、この秋 Pixel 7 スマートフォンと同時に発売される予定です。 Googleが全面的に設計した初のスマートウォッチとして、最も優れたWearOS体験を備え、言語アシスタントやNFCなどの機能を備え、ナビゲーションなどの機能を独自に実現できます。最も重要なのは、同レベルの多くの製品のように文字盤が大きすぎないことです。 携帯電話、時計、ワイヤレス Bluetooth ヘッドセットはすべて利用可能ですが、最後に欠けているのは大画面です。Google は、Pixel タブレットを 2023 年に発売すると発表しました。 これらのデバイスがリリースされると、Google は現在の大手携帯電話メーカーのように、比較的完全なエコシステムを確立することになります。 |
<<: プラグアンドプレイ、トレーニング不要:ケンブリッジ大学、テンセントAIラボなどがトレーニング不要のクロスモーダルテキスト生成フレームワークを提案
>>: AI科挙制度がイノベーションを阻害する!あなたの目に映る良いモデルは単なる「ランキングマシン」です
これは、3D ポイント クラウド用に提案された教師なしカプセル アーキテクチャであり、3D ポイント...
[[255971]] 「インターネット+」から「AI+」まで、人工知能技術は経済と社会の発展に大き...
「人工知能はすべての仕事を自動化し、人間を失業させるだろう。」 「人工知能は単なる架空の技術だ。」 ...
人工知能(AI)技術は静かに人間の生活を変えています。顔認証、顔スワイプ決済、新型コロナウイルス感染...
マイクロソフト(アジア)インターネットエンジニアリングアカデミーは、新世代の音声インタラクション技術...
人工知能 (AI) と機械学習 (ML) をモノのインターネット (IoT) システムに統合すること...
社会的支援ロボットは、自閉症スペクトラム障害(ASD)の子供たちが適切な行動とコミュニケーションを促...
製薬会社における人工知能 (AI) の活用は、より優れた診断の提供、より高品質の医薬品の開発、患者に...
9 月 13 日、Microsoft は Windows 11 ビルド 22621.2338 および...
キーボードと帽子を組み合わせたらどうなるでしょうか?冗談はさておき、Google 日本支社のエンジニ...
データと製品を組み合わせるトピック 1 は、データと製品の組み合わせです。Stitch Fix を例...
上海で開催されたHUAWEI CONNECT 2019で、ファーウェイはエンタープライズサービス開発...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
[[257674]]まだ始まったばかりの 2019 年には、どのような新しいアプリケーションが登場す...