Facebookは視覚障害者向けに写真の説明を改善するためにAIを活用

Facebookは視覚障害者向けに写真の説明を改善するためにAIを活用

[[377490]]

海外メディアの報道によると、フェイスブックは1月21日、視覚障害のあるユーザー向けにインスタグラムなどのプラットフォームに投稿された写真の説明文の生成を強化するため、人工知能(AI)技術の新たな改良を発表した。

Facebook は早くも 2016 年に、「自動代​​替テキスト」(AAT) と呼ばれる新しいテクノロジーを導入しました。これは、視覚障害のあるユーザー向けに、オブジェクト認識テクノロジーを使用して写真の説明をオンデマンドで生成するものです。

「それ以来、私たちは改良を続け、次世代のAATを発表できることを嬉しく思っています」と同社は火曜日の夕方の声明で述べた。ユーザーの写真体験を向上させる改良型AATは、2016年版の10倍以上となる1,200以上のコンセプトを確実に識別できる。つまり、説明のない写真が少なくなり、より詳細な説明が提供されることになります。また、アクティビティ、ランドマーク、動物の種類などを識別することもできます。

フェイスブックは、この進歩により、家族や友人が投稿した写真の内容を、より詳しい情報が提供され、視覚障害のあるユーザーがより理解しやすくなると述べた。

AAT の最新バージョンでは、数十億枚の Instagram 公開画像とラベル付けされたデータでトレーニングされたモデルが使用されています。これらのモデルが誰にとってもより使いやすくなるよう、同社はモデルを微調整し、あらゆる地理的場所の画像からデータを取り込み、ハッシュタグを複数の言語に翻訳できるようにしました。コンセプトは性別、肌の色、年齢に基づいて評価されました。結果として得られるモデルは、より正確で、文化的、人口統計的に包括的になります。

<<:  AI技術がデータセンターの省エネに向けた新たな戦いに参入

>>:  人工知能技術はCOVID-19の流行との戦いで重要な役割を果たしてきた

ブログ    
ブログ    
ブログ    

推薦する

...

黄仁訓氏の予測: AGI は 5 年以内に実現される可能性があります。米国は中国のニーズを完全に満たして「サプライチェーンの独立」を達成するまでにまだ10年ある

最近、ニューヨークタイムズの年次ディールブックサミットで、黄仁勲氏は、汎用人工知能(AGI)を「かな...

...

...

運転教習業界にも「AI」の波が吹き荒れる、普及規模に注目

[[422314]]近年、都市化と道路交通建設の加速により、自動車旅行の需要が継続的に増加しており、...

Googleの最新の「効率的なトランスフォーマー」では、トランスフォーマーの効率を向上させる方法を説明しています

トランスフォーマー モデルは現在、言語、視覚、強化学習などの分野での有効性から注目を集めています。た...

...

3400 コミ​​ットを統合します。バッチサイズの選択に役立つフレームワーク、PyTorch 1.10 がリリースされました

[[431318]] 10月21日の夜、ついにPyTorch 1.10がリリースされました!このアッ...

モノのインターネットにおけるAIの役割

[[380960]]私たちの周りのすべてのものが知的になることを考えたことはありますか?ガジェットは...

顔認識禁止が迫る:テクノロジー企業はどこへ向かうべきか?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

脳コンピューターインターフェースが人間とコンピューターの共生を実現 専門家:ハッカーにハイジャックされ記憶を消去される可能性も

[[336395]]海外メディアの報道によると、8月4日、サイバーセキュリティの専門家は、イーロン・...

ソフト制約とハード制約の下で軌道を生成する方法、理論とコードの詳細な説明!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

ドローンの墜落を防ぐにはどうすればいいですか?

「墜落」とは模型飛行機の用語です。簡単に言うと、模型飛行機が不適切な操作や機械の故障により異常に地...

ライフル銃で動くロボット犬の発明者が恐怖を巻き起こす:プログラミング制御は恐れる必要はない

[[429985]]先週、米国陸軍協会(AUSA)の会議がワシントンで開催されました。アメリカのロボ...

...