この記事では、Kaggle で行われた ASHRAE - Great Energy Predictor III の概要についてまとめます。
概要
ASHRAE - Great Energy Predictor IIIは Kaggle の"Featured Prediction Competition"(メダル、レート対象の一般的なコンペティション)の一つです。このコンペは期間中にデータのリークが発覚し、トラブルが起きたことで大変有名です。コンペの内容自体の特徴としては使用できる特徴量がそれほど多くない一方で、目的変数にノイズが大きく含まれていることがあげられます。そのため目的変数のノイズの前処理方法やアンサンブル学習を勉強するのに最適です。
課題
過去 3 年分のデータから将来のビルごとの電気、水道などの使用量(メーターの値)を予測
参加人数
計 3,614 チーム参加
コンペティション実施期間
コンペティションオープン: 2019/10/16
提出締め切り: 2019/12/20
指標
予測精度は Root Mean Squared Logarithmic Error(RMSLE)で評価されます。具体的な式は以下の通りです。