この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 わずかな変更でも AI モデルの堅牢性に影響を及ぼします。 AIの目から見ると、次の2つの写真は互いに何の関係もないように見えるかもしれません。 現在、 Facebook AI はデータ拡張用の新しい Python ライブラリAugLy をオープンソース化しました。 オーディオ、画像、ビデオ、テキストの4 つのモダリティをサポートし、入力コンテンツに対してさまざまな処理を実行できる100を超えるデータ拡張機能を提供します。 たとえば、テキストの大文字、フォント、エンコード方法を変更したり、テキストに句読点を追加したり、文字の位置を調整したり、タイプミスをシミュレートしたりします。 このプロジェクトは1.8k 個のスターを獲得し、GitHub のホット リストに掲載されています。 「スクリーンショット転送」をAIに認識させるAugLy は、実際のネットワークにおける特定のデータ拡張をカバーし、モデルのトレーニングとテスト用のサンプルを作成することを目的としています。 AugLy は、Facebook や Instagram などのプラットフォームからの実際の画像や動画に基づいて、プロジェクトのすべてのデータを統合ライブラリと API で変換し、100 を超えるデータ拡張方法を提供します。 オーディオ、画像、ビデオ、テキストの 4 つのモダリティに対応する 4 つのサブライブラリが含まれています。 これらのサブライブラリには、関数ベースおよびクラスベースの変換、組み合わせ、適用されるメタデータとその強度を選択する機能が含まれます。 画像処理を例にとると、AugLy はトリミング、回転、ノイズの追加、ぼかし、グレースケールなどを行うことができます。 このような: 一部のネットユーザーは、「テキストモジュールは英語のみをサポートしていますか?」という疑問を提起しました。 AugLy の最大の特徴は、一般的な拡張機能を多数搭載していることに加え、 「インターネット ユーザー」型のデータ拡張機能を提供していることです。 たとえば、画像をスクリーンショットスタイルに変換すると、実際の生活で目にするものに近くなります。 AugLy データ拡張を使用して AI モデルをトレーニングします。内容は同じだが形式が異なるこの情報は、モデルの堅牢性を向上させるのに役立ちます。 コピー検出、音声検出、著作権侵害などのタスクでは、トレーニング後、AIはユーザーがアップロードしたコンテンツをより正確に識別できます。 さらに、AugLy は、モデルの堅牢性を評価するために Deepfake Detection Challenge で使用されています。 ネットユーザーの間で熱い議論この新しい Python ライブラリはネットユーザーの注目も集め、Reddit で350 件を超える「いいね!」を獲得しました。 一部のネットユーザーは、「テキストモジュールは英語のみをサポートしていますか?」という疑問を提起しました。 熱狂的なネットユーザーはこう言った。
一部のネットユーザーからは、なぜそれを直接 PyTorch に追加しないのかという質問もありました。 それに応えて、ある人がこう返信しました。
AugLy には Python 3.6 以降が必要です。これは pip を使用してインストールできます。ただし、仮想環境とシステム環境では、conda と sudo apt-get を使用して python-magic を別途インストールする必要もあります。 残念ながら、AugLyは現在バッチ画像の入力をサポートしていませんが、開発者は将来この機能が改善される予定であると述べています。 |
<<: 動物や人間には学習の臨界期があり、ディープニューラルネットワークにも臨界期がある。
>>: これでブリッジで腹筋運動ができるようになりました!中国初の3Dプリント橋が上海で公開
ビジネス ワークフローに AI ツールを導入すると、ハッカーにとってより価値が高く、防御が困難になる...
教育評価は、教育の質の継続的な向上を促進する「牛の鼻」として、確立された教育目標に基づき、一定の教育...
[51CTO.com クイック翻訳]人工知能が情報技術 (IT) 業界とオーディオビジュアル (AV...
異常検出タスクは、通常のデータ分布から大きく逸脱した外れ値を識別することを目的としており、産業検査、...
イーロン・マスクによるツイッター買収のドラマもついにこの回まで来た。ツイッターは現地時間4月15日、...
[[393588]]まとめファームウェア/ソフトウェアのセキュリティ脆弱性はグリッド セキュリティに...
ロイター通信は10月12日、事情に詳しい関係者の話として、人工知能企業OpenAIが来月、同社の人工...
OpenAIは米国時間9月26日月曜日、チャットボット「ChatGPT」に音声会話機能を追加したと発...
[[151327]]決定木分類アルゴリズム決定木誘導は古典的な分類アルゴリズムです。これは、トップダ...
医用画像診断における人工知能(AI)の応用は大きな進歩を遂げました。しかし、厳密なテストがなければ、...