業界・業務から探す
導入目的・課題から探す
データ・AIについて学ぶ
News
Hakkyについて
ウェビナーコラム
◆トップ【AI・機械学習】
プロセスの全体像前処理・特徴量生成Fine Tuning手法まとめ機械学習モデルの選び方モデル評価手法プロトタイピング探索的分析(EDA)
ドミナントカラー検出セグメンテーション技術の基礎と実装局所特徴量抽出Grad-CAMまとめ画像の二値化とその手法モルフォロジー演算とその手法【Vision AI】Painterの紹介pix2structの紹介
AI

執筆者:Handbook編集部

画像データのデータ拡張手法について

概要

本記事では画像データを用いて機械学習モデルを学習させる際に一般的に用いられるデータ拡張(Augmentation)の手法について紹介します。

データ拡張とは

データ拡張とは機械学習における学習用の画像データに対して何らかの「変換」を施すことでデータを水増しする手法です。変換の処理は扱うデータの種類やタスクによって様々な方法が存在しています。例えば、画像では、縦横で画像を反転させたり、回転させたりします。

前述の通り、データ拡張は学習データをにある変換を加えることで似ているけど少し異なるデータを生成します。データ拡張を行うことで、サンプル数が少ないデータセットに対してDeep Learningなどのデータ量が必要なモデルを学習できるようになるほか、モデルの過学習(あるデータに対して過剰に適合してしまうこと)を防ぐことができます。

データ拡張手法

本セクションでは画像データに対する代表的なデータ拡張の手法を紹介します。

1. 回転

画像をランダムに回転させる手法です。同じ回転でも回転させる角度をランダムにとることで多くのバリエーションを生成できます。

2. シフト

ランダムに画像を左右上下にスライドさせます。シフトを行うことで、画像に写っている物体の位置に対してロバストなモデルを獲得することが期待できます。

3. 反転

上下左右で画像を反転させます。

4. 明るさの調整

明るさを変更します。この拡張では、写真に対してよく用いられ、室内と屋外など異なる状況下で撮影した場合にもモデルを適合することが期待できます。

6. 色味の調整

元画像の色味を変更することで拡張を行う手法です。変換にはRGBの他HSVなどタスクによって異なる色空間を使います。

7. クロップ

クロップは画像の一部を切り抜くような変換になります。

8. リスケール

スケールの変換を行うことでデータ拡張を行う手法です。画像を横(もしくは縦)に引き伸ばしたような画像をランダムに生成します。

データ拡張における注意点

データ拡張はタスクにあった手法を用いないと逆効果になってしまうためその点注意が必要です。例えば、過度な色味の変換などはモデルの精度を低下させる原因になります。

2025年06月13日に最終更新
読み込み中...