Facebookは視覚障害者向けに写真の説明を改善するためにAIを活用

Facebookは視覚障害者向けに写真の説明を改善するためにAIを活用

[[377490]]

海外メディアの報道によると、フェイスブックは1月21日、視覚障害のあるユーザー向けにインスタグラムなどのプラットフォームに投稿された写真の説明文の生成を強化するため、人工知能(AI)技術の新たな改良を発表した。

Facebook は早くも 2016 年に、「自動代​​替テキスト」(AAT) と呼ばれる新しいテクノロジーを導入しました。これは、視覚障害のあるユーザー向けに、オブジェクト認識テクノロジーを使用して写真の説明をオンデマンドで生成するものです。

「それ以来、私たちは改良を続け、次世代のAATを発表できることを嬉しく思っています」と同社は火曜日の夕方の声明で述べた。ユーザーの写真体験を向上させる改良型AATは、2016年版の10倍以上となる1,200以上のコンセプトを確実に識別できる。つまり、説明のない写真が少なくなり、より詳細な説明が提供されることになります。また、アクティビティ、ランドマーク、動物の種類などを識別することもできます。

フェイスブックは、この進歩により、家族や友人が投稿した写真の内容を、より詳しい情報が提供され、視覚障害のあるユーザーがより理解しやすくなると述べた。

AAT の最新バージョンでは、数十億枚の Instagram 公開画像とラベル付けされたデータでトレーニングされたモデルが使用されています。これらのモデルが誰にとってもより使いやすくなるよう、同社はモデルを微調整し、あらゆる地理的場所の画像からデータを取り込み、ハッシュタグを複数の言語に翻訳できるようにしました。コンセプトは性別、肌の色、年齢に基づいて評価されました。結果として得られるモデルは、より正確で、文化的、人口統計的に包括的になります。

<<:  AI技術がデータセンターの省エネに向けた新たな戦いに参入

>>:  人工知能技術はCOVID-19の流行との戦いで重要な役割を果たしてきた

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

ビッグデータの機械理解の秘密:クラスタリングアルゴリズムの詳細な説明

この記事では、いくつかのクラスタリング アルゴリズムの基本的な概要を示し、シンプルでありながら詳細な...

...

AIがサイバーセキュリティに与える影響

人工知能(AI)は、人間の知能をシミュレート、拡張、拡大するための理論、方法、技術、アプリケーション...

教師なし学習のためのアンサンブル法: 類似度行列のクラスタリング

機械学習において、アンサンブルという用語は、複数のモデルを並行して組み合わせることを指します。その考...

DeepMind がワンクリックで「Mole」言語モデルを起動します。 2,800億のパラメータがSOTAに到達可能

太い眉毛と大きな目を持つ「強化学習の専門家」も、大規模言語モデルに取り組み始めているのでしょうか? ...

...

全光自動運転ネットワーク、F5G全光スマートシティの共同構築

新たなインフラ、都市のデジタルガバナンス、政府と企業のデジタル変革、デジタルホームの急速な発展に伴い...

ChatGPTがまた進化しました!オールインワンツール、ネットユーザー:今日、起業プロジェクトがいくつ消滅したか

ChatGPT は一晩で静かにアップデートされ、数多くの起業家プロジェクトが始動しようとしています。...

...

...

2018年世界AI大学ランキング:カーネギーメロン大学がトップ、清華大学は13位

最近、CSRankingsは2018年のコンピューターサイエンスのトップスクールのランキングを発表し...

...

セキュリティとインテリジェンス: 銀行における IoT の導入と応用

人工知能 (AI) 対応ソリューションの機能からスマート デバイスによるモビリティの向上まで、コネク...

ルカンはソラを世界モデルとして非難し、自己回帰LLMは単純すぎると述べた。

近年、ソラは世界中の注目を集めています。それに関連するすべてのものが極端に拡大されます。 Sora ...