前処理

前処理とは、生のデータセットを機械学習しやすいデータに加工することです。 世の中のデータセットは機械学習のモデルには学習しにくいデータであることがほとんどなので、それを学習しやすいデータに加工する必要があります。

例えば以下のような処理を行います

  • 欠測値を削除、補填する

  • 数値を標準化する

  • 文字列を対応する数値に置き換える

詳しくはPyQのクエスト 前処理[第2版]Python機械学習プログラミング 達人データサイエンティストによる理論と実践 の4章を参考にしてください。