Facebookは視覚障害者向けに写真の説明を改善するためにAIを活用

Facebookは視覚障害者向けに写真の説明を改善するためにAIを活用

[[377490]]

海外メディアの報道によると、フェイスブックは1月21日、視覚障害のあるユーザー向けにインスタグラムなどのプラットフォームに投稿された写真の説明文の生成を強化するため、人工知能(AI)技術の新たな改良を発表した。

Facebook は早くも 2016 年に、「自動代​​替テキスト」(AAT) と呼ばれる新しいテクノロジーを導入しました。これは、視覚障害のあるユーザー向けに、オブジェクト認識テクノロジーを使用して写真の説明をオンデマンドで生成するものです。

「それ以来、私たちは改良を続け、次世代のAATを発表できることを嬉しく思っています」と同社は火曜日の夕方の声明で述べた。ユーザーの写真体験を向上させる改良型AATは、2016年版の10倍以上となる1,200以上のコンセプトを確実に識別できる。つまり、説明のない写真が少なくなり、より詳細な説明が提供されることになります。また、アクティビティ、ランドマーク、動物の種類などを識別することもできます。

フェイスブックは、この進歩により、家族や友人が投稿した写真の内容を、より詳しい情報が提供され、視覚障害のあるユーザーがより理解しやすくなると述べた。

AAT の最新バージョンでは、数十億枚の Instagram 公開画像とラベル付けされたデータでトレーニングされたモデルが使用されています。これらのモデルが誰にとってもより使いやすくなるよう、同社はモデルを微調整し、あらゆる地理的場所の画像からデータを取り込み、ハッシュタグを複数の言語に翻訳できるようにしました。コンセプトは性別、肌の色、年齢に基づいて評価されました。結果として得られるモデルは、より正確で、文化的、人口統計的に包括的になります。

<<:  AI技術がデータセンターの省エネに向けた新たな戦いに参入

>>:  人工知能技術はCOVID-19の流行との戦いで重要な役割を果たしてきた

ブログ    
ブログ    

推薦する

なぜ人工知能には膨大な電力需要があるのでしょうか?

今日の人工知能 (AI) システムは、真の人間の知能を再現するにはまだ程遠い状態です。しかし、彼らは...

...

人々は長い間、運転免許試験に悩まされてきました。自動運転は、その苦しみを緩和できるのでしょうか?

運転するには運転免許証を持っていることが前提条件であり、運転免許証を取得するには運転免許試験を受ける...

触覚がこんなにリアルになったのは初めてです!南カリフォルニア大学の2人の中国人博士が「触覚知覚」アルゴリズムを発明した

電子技術の発達により、私たちはいつでもどこでも「視聴覚の饗宴」を楽しめるようになり、人間の聴覚と視覚...

...

人工知能はすでに人間の減量を手助けするのに忙しい

今日はカロリーを消費しましたか?近年、生活水準の向上や生活習慣の変化に伴い、肥満は徐々に多くの人々を...

...

機械学習を使用したデータマッピング

[[278276]]中小企業から大企業まで、ほぼすべての企業が顧客の注目を集める機会を求めて競争して...

中山大学、AIGCの大規模応用を促進するためにソース拡散モデル統合コードフレームワークを公開

近年、拡散モデルに基づく画像生成モデルが次々と登場し、驚くべき生成効果を示しています。しかし、関連す...

AlphaFold2の最初の公開PyTorchバージョンが複製可能になりました。コロンビア大学のオープンソースで、1,000以上のスターが付いています。

ちょうど今、コロンビア大学のシステム生物学助教授であるモハメッド・アルクライシ氏が、AlphaFol...

LiDARとTexas Instrumentsチップを搭載した最新のL3自動運転アーキテクチャの分析

画像出典: インターネット来年発売されるヒュンダイG90とGV80は、ヒュンダイのL3自動運転モデル...

2018年に人工知能がビジネスに及ぼす10のインパクト

[[220065]]人工知能 (AI) と機械学習は多くの企業にとって流行語となっていますが、これら...

...

C# でのジョセフ リング アルゴリズムの簡単な分析

C# アルゴリズムを勉強しているときに、C# ジョセフ リング アルゴリズムに出会いました。ジョセフ...