今日初めて聞いた単語だったので、備忘もかねて記事に。
CRISP-DMとは「CRoss-Industry Standard Process for Data Mining」の略でデータ分析のプロセスモデルのようです。
なんか仰々しいものなのかなと恐る恐る調べてみると、至って当たり前のことで拍子抜けしました。
構成要素はこちらです。(フロー図があるのですが、そちらは他の方の記事を見ていただければ)
- ビジネス課題の理解
- データの理解
- データの準備
- モデル作成
- 評価
- 展開
個人的な印象としては、開発プロセスをデータ分析に当てはめたものな気がします。
そしてこの構成要素を見ていて思ったのは、データ分析においてモデル作成に注目しがちだけど、モデル作成は一部分でしかなく、モデル作成以外の部分もきちんとやらないと成功しないよなぁと。
最新のモデルを追うのも大事ですが、ビジネス課題の理解を正しくできることの方が大事かもしれません(あくまでも個人的な考え)。