Facebookは視覚障害者向けに写真の説明を改善するためにAIを活用

Facebookは視覚障害者向けに写真の説明を改善するためにAIを活用

[[377490]]

海外メディアの報道によると、フェイスブックは1月21日、視覚障害のあるユーザー向けにインスタグラムなどのプラットフォームに投稿された写真の説明文の生成を強化するため、人工知能（AI）技術の新たな改良を発表した。

Facebook は早くも 2016 年に、「自動代替テキスト」(AAT) と呼ばれる新しいテクノロジーを導入しました。これは、視覚障害のあるユーザー向けに、オブジェクト認識テクノロジーを使用して写真の説明をオンデマンドで生成するものです。

「それ以来、私たちは改良を続け、次世代のAATを発表できることを嬉しく思っています」と同社は火曜日の夕方の声明で述べた。ユーザーの写真体験を向上させる改良型AATは、2016年版の10倍以上となる1,200以上のコンセプトを確実に識別できる。つまり、説明のない写真が少なくなり、より詳細な説明が提供されることになります。また、アクティビティ、ランドマーク、動物の種類などを識別することもできます。

フェイスブックは、この進歩により、家族や友人が投稿した写真の内容を、より詳しい情報が提供され、視覚障害のあるユーザーがより理解しやすくなると述べた。

AAT の最新バージョンでは、数十億枚の Instagram 公開画像とラベル付けされたデータでトレーニングされたモデルが使用されています。これらのモデルが誰にとってもより使いやすくなるよう、同社はモデルを微調整し、あらゆる地理的場所の画像からデータを取り込み、ハッシュタグを複数の言語に翻訳できるようにしました。コンセプトは性別、肌の色、年齢に基づいて評価されました。結果として得られるモデルは、より正確で、文化的、人口統計的に包括的になります。

<<: AI技術がデータセンターの省エネに向けた新たな戦いに参入

>>: 人工知能技術はCOVID-19の流行との戦いで重要な役割を果たしてきた

自動化の方程式: 現代の職場における AI、ロボット工学、人間のスキルのバランス

自動化の方程式: 現代の職場における AI、ロボット工学、人間のスキルのバランス

ブログ

APICloud CEO 劉欣: モバイルアプリケーションは人工知能の実装にとって最も直接的な媒体である

APICloud CEO 劉欣: モバイルアプリケーションは人工知能の実装にとって最も直接的な媒体である

ブログ

ブログ

ブログ

初心者ガイド: アルゴリズムとは何ですか? 11行の擬似コードで説明します

初心者ガイド: アルゴリズムとは何ですか? 11行の擬似コードで説明します

ブログ

AIはDevOpsエクスペリエンスに目に見える以上の変化をもたらす

AIはDevOpsエクスペリエンスに目に見える以上の変化をもたらす

ブログ

Kornia オープンソースの微分可能コンピュータビジョンライブラリ、Pytorch ベース、GitHub 3000 スター

Kornia オープンソースの微分可能コンピュータビジョンライブラリ、Pytorch ベース、GitHub 3000 スター

ブログ

ブログ

中国と米国の間で技術冷戦が勃発するだろうか？人工知能は「引き金」

中国と米国の間で技術冷戦が勃発するだろうか？人工知能は「引き金」

ブログ

セマンティックAIとデータ管理の5つのトレンド

セマンティックAIとデータ管理の5つのトレンド

ブログ

推薦する

...

黄仁訓氏の予測: AGI は 5 年以内に実現される可能性があります。米国は中国のニーズを完全に満たして「サプライチェーンの独立」を達成するまでにまだ10年ある

最近、ニューヨークタイムズの年次ディールブックサミットで、黄仁勲氏は、汎用人工知能（AGI）を「かな...

...

...

運転教習業界にも「AI」の波が吹き荒れる、普及規模に注目

[[422314]]近年、都市化と道路交通建設の加速により、自動車旅行の需要が継続的に増加しており、...

Googleの最新の「効率的なトランスフォーマー」では、トランスフォーマーの効率を向上させる方法を説明しています

トランスフォーマーモデルは現在、言語、視覚、強化学習などの分野での有効性から注目を集めています。た...

...

3400 コミットを統合します。バッチサイズの選択に役立つフレームワーク、PyTorch 1.10 がリリースされました

[[431318]] 10月21日の夜、ついにPyTorch 1.10がリリースされました！このアッ...

モノのインターネットにおけるAIの役割

[[380960]]私たちの周りのすべてのものが知的になることを考えたことはありますか?ガジェットは...

顔認識禁止が迫る：テクノロジー企業はどこへ向かうべきか？

この記事は公開アカウント「Reading Core Technique」（ID: AI_Discov...

脳コンピューターインターフェースが人間とコンピューターの共生を実現専門家：ハッカーにハイジャックされ記憶を消去される可能性も

[[336395]]海外メディアの報道によると、8月4日、サイバーセキュリティの専門家は、イーロン・...

ソフト制約とハード制約の下で軌道を生成する方法、理論とコードの詳細な説明！

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

ドローンの墜落を防ぐにはどうすればいいですか?

「墜落」とは模型飛行機の用語です。簡単に言うと、模型飛行機が不適切な操作や機械の故障により異常に地...

ライフル銃で動くロボット犬の発明者が恐怖を巻き起こす：プログラミング制御は恐れる必要はない

[[429985]]先週、米国陸軍協会（AUSA）の会議がワシントンで開催されました。アメリカのロボ...

...