【cutoutを使ったAugmentation】ディープラーニングの精度を向上させるテクニック

cutout の概要

本記事では画像データを用いて機械学習モデルを学習させる際に一般的に用いられるデータ拡張（Augmentation）の手法について紹介します。

cutout の手法

cutout は、モデルの汎化能力を向上させるための効果的なデータ拡張手法の一つです。データ拡張手法は、限られたトレーニングデータをより多様化させることで、モデルの性能や頑健性を向上させるために使用されます。また、cutout は、画像処理のコンテキストでよく使用され、他のデータ拡張手法に比べて、オクルージョン問題やノイズに対するモデルの頑健性を向上させる点が特徴的です。

具体的には、cutout は画像中の一部をランダムにマスクすることによってデータを変換します。このマスクされた領域は、画像の一部を切り取ったようになります。この操作により、モデルは欠損した情報やノイズが存在する状況に対しても頑健になるように学習することが期待されます。

cutout の利点

オクルージョン問題においては、物体が一部隠れている状況をシミュレートするために cutout を使用することができます。これにより、モデルは一部の情報が欠落している場合でも正確に物体を検出したり分類したりする能力を獲得することができます。また、ノイズに対する頑健性を向上させるためにも、cutout が有効です。ノイズの存在により画像が劣化する状況を模倣することで、モデルがノイズに対しても安定した予測を行うことができるようになります。

cutout による精度改善効果

画像分類タスク（CIFAR-10, 100）において、ベースライン手法よりも精度が向上しています。横軸は正方形領域の大きさ（Patch Length）であり、縦軸は正解率（Accuracy）を表します。横軸のパラメータは特に重要で、同じ画像サイズ（32 x 32）でも、より詳細な情報が必要なタスクでは、パッチの長さを短く設定するなどの調整が必要です。

cutout の実装方法

今回は別記事の画像データのデータ拡張ツールについてでも紹介したデータ拡張ツールの albumentation を使用した実装例を紹介します。

import albumentations as A
from albumentations.pytorch import ToTensorV2

transforms_cutout = A.Compose([
    A.Resize(256, 256),
    A.CoarseDropout(max_holes = 1, # Maximum number of regions to zero out. (default: 8)
                    max_height = 128, # Maximum height of the hole. (default: 8)
                    max_width = 128, # Maximum width of the hole. (default: 8)
                    min_holes=None, # Maximum number of regions to zero out. (default: None, which equals max_holes)
                    min_height=None, # Maximum height of the hole. (default: None, which equals max_height)
                    min_width=None, # Maximum width of the hole. (default: None, which equals max_width)
                    fill_value=0, # value for dropped pixels.
                    mask_fill_value=None, # fill value for dropped pixels in mask.
                    always_apply=False,
                    p=0.5
                   ),
    ToTensorV2(),
])

まとめ

cutout は、ディープラーニングの画像分類や物体検出などのタスクにおいて広く利用されており、性能向上に効果的な手法として注目されています。モデルの汎化能力を高めるために、データ拡張手法の一環として cutout を採用することは、実世界のさまざまな状況に対してモデルをより頑健にするうえで有益な方法です。

参考

Improved Regularization of Convolutional Neural Networks with Cutout

備考

Hakky ではエンジニアを募集中です！「まずは話を聞いてみたい」という方も是非お気軽に採用ページからお問い合わせくださいませ。