データ拡張のための 10 個の Python ライブラリ

データ拡張のための 10 個の Python ライブラリ

データ拡張は、人工知能と機械学習の分野における重要な技術です。モデルのパフォーマンスと一般化を向上させるために、既存のデータセットのバリエーションを作成します。 Python は、いくつかの強力なデータ拡張ライブラリを提供する人気の AI および ML 言語です。この記事では、データ拡張用の 10 個の Python ライブラリを紹介し、各ライブラリのコード スニペットと説明を示します。

オーグメンター

Augmentor は、画像拡張用の汎用 Python ライブラリです。回転、反転、色の操作など、さまざまな操作を画像に簡単に適用できます。以下は、Augmentor を使用して画像拡張を行う方法の簡単な例です。

 import Augmentor p = Augmentor.Pipeline("path/to/your/images") p.rotate(probability=0.7, max_left_rotatinotallow=25, max_right_rotatinotallow=25) p.flip_left_right(probability=0.5) p.sample(100)

アルバムメンテーション

Albumentations Master は、ランダム回転、反転、明るさ調整などのさまざまな機能強化をサポートしています。これは私が最もよく使用する拡張ライブラリです。

 import albumentations as A transform = A.Compose([ A.RandomRotate90(), A.HorizontalFlip(), A.RandomBrightnessContrast(), ]) augmented_image = transform(image=image)["image"]

イムガウグ

Imgaug は画像やビデオを強化するためのライブラリです。幾何学的変換や色空間の変更など、幅広い拡張機能を提供します。 Imgaug の使用例を次に示します。

 import imgaug.augmenters as iaa augmenter = iaa.Sequential([ iaa.Fliplr(0.5), iaa.Sometimes(0.5, iaa.GaussianBlur(sigma=(0, 2.0))), iaa.ContrastNormalization((0.5, 2.0)), ]) augmented_image = augmenter.augment_image(image)

nlpaug

nlpaaug は、テキスト データの拡張専用に設計されたライブラリです。同義語の置換や文字レベルの置換など、テキストのバリエーションを生成するためのさまざまな手法を提供します。

 import nlpaug.augmenter.word as naw aug = naw.ContextualWordEmbsAug(model_path='bert-base-uncased', actinotallow="insert") augmented_text = aug.augment("This is a sample text.")

画像拡大

imgauge は、画像の強化に重点を置いた軽量ライブラリです。使いやすく、回転、反転、色調整などの操作が可能です。

 from imgaug import augmenters as iaa seq = iaa.Sequential([ iaa.Fliplr(0.5), iaa.Sometimes(0.5, iaa.GaussianBlur(sigma=(0, 2.0))), iaa.ContrastNormalization((0.5, 2.0)), ]) augmented_image = seq(image=image)

テキストアタック

TextAttack は、自然言語処理 (NLP) モデルを拡張および攻撃するための Python ライブラリです。 NLP タスクの敵対的サンプルを生成するためのさまざまな変換を提供します。使い方は次のとおりです:

 from textattack.augmentation import WordNetAugmenter augmenter = WordNetAugmenter() augmented_text = augmenter.augment("The quick brown fox")

TAAE

Text Augmentation and Adversarial Examples (TAAE) ライブラリは、テキスト拡張の​​ためのもう 1 つのツールです。同義語の置換や文のシャッフルなどのテクニックが含まれます。

 from taae import SynonymAugmenter augmenter = SynonymAugmenter() augmented_text = augmenter.augment("This is a test sentence.")

オーディオメンテーション

Audiomentations はオーディオ データの強化に重点を置いています。サウンド処理を伴うタスクに不可欠なライブラリです。

 import audiomentations as A augmenter = A.Compose([ A.PitchShift(), A.TimeStretch(), A.AddBackgroundNoise(), ]) augmented_audio = augmenter(samples=audio_data, sample_rate=sample_rate)

イメージデータオーグメンター

ImageDataAugmentor は画像データの拡張用に設計されており、一般的なディープラーニング フレームワークとうまく連携します。 TensorFlow での使用方法は次のとおりです。

 from ImageDataAugmentor.image_data_augmentor import * import tensorflow as tf datagen = ImageDataAugmentor( augment=augmentor, preprocess_input=None, ) train_generator = datagen.flow_from_directory("data/train", batch_size=32, class_mode="binary")

Keras イメージデータジェネレータ

Keras は、Keras と TensorFlow を使用する際の画像拡張のための組み込みソリューションである ImageDataGenerator クラスを提供します。

 from tensorflow.keras.preprocessing.image import ImageDataGenerator datagen = ImageDataGenerator( rotation_range=40, width_shift_range=0.2, height_shift_range=0.2, shear_range=0.2, zoom_range=0.2, horizontal_flip=True, fill_mode="nearest", ) augmented_images = datagen.flow_from_directory("data/train", batch_size=32)

要約する

これらのライブラリは、画像やテキストデータに対する幅広いデータ拡張技術をカバーしており、皆さんのお役に立てば幸いです。

<<:  人工知能は将来の建築をどのように変えるのでしょうか?

>>:  大規模言語モデルの効率的なパラメータ微調整 - BitFit/Prefix/Prompt 微調整シリーズ

ブログ    
ブログ    
ブログ    

推薦する

AIが高度な数学の問題を生成し、新たな難易度に到達:MITは問題を生成し、質問に答え、採点できるアルゴリズムモデルを提案

少し前に、DeepMind による研究が Nature の表紙を飾り、直感を導くことで 2 つの主要...

...

給料の心配はやめましょう。これは今後 10 年間で最も収益性の高い業界であり、横になっているときでもお金を稼ぐことができます。

小米創始者の雷軍はかつて「風の吹き口に立てば豚でも飛べる」と言った。事実は往々にしてこの通りだ。人の...

ドローンのパフォーマンスはどんどん標準化されつつありますが、この4つの点はまだ改善が必要です。

近年、飛行制御、ナビゲーション、通信などの技術が継続的に進歩し、私たちの生産や生活におけるドローンの...

...

Nvidiaが自動運転AIアルゴリズムをオープンソース化、チップ性能をXavierの7倍にアップグレード

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AIに人間のように計画を立てることを教えるにはどうすればよいでしょうか?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

本当に良いものです!機械学習技術と市場の最強評価ガイド

【51CTO.comオリジナル記事】機械学習の特許は、2013 年から 2017 年の間に 34% ...

人工知能の時代において、テクノロジーは中立ではない

インターネットや人工知能に代表される情報技術の台頭により、社会は第三次科学技術革命の時代を迎えていま...

データサイエンティストが最もよく使用するデータマイニングアルゴリズム10選

[[192829]]図1: データサイエンティストが最もよく使用するアルゴリズムトップ10すべてのア...

Redis に基づく分散ロックと Redlock アルゴリズム

[[414221]]この記事はWeChatの公開アカウント「UP Technology Contro...

...

対話 | QingCloud CTO: AI が到来し、基本的なクラウド サービス プロバイダーもそれに備える必要があります。

[51CTO記者の李玲玲が北京からレポート] 真夏が到来し、人工知能も北京の天気のように、より暑い...

AIガバナンスがトップに躍り出るには

人工知能(AI)技術は現在、広く利用されています。 AI ガバナンスが重要なのは、AI はより大きな...

...