最近は投稿した論文の査読を返信するために、追加のデータを収集する作業に追われています。
その投稿論文は記述的ゲームパフォーマンス分析を用いてデータをとっています。
簡単に手順を説明すると、映像を見る→自分で作った測定項目に沿って記録していく
といった非常にシンプルかつ地道な方法です。
(今は分析ソフトを使わず直接Excelに打ち込んでいます。)
今はデータが多くの媒体で公表されていたり、各リーグ公式にデータ会社と提携していることが多いです。
そのようなデータを利用した論文や分析も多く見られます。
しかし、論文や実際の指導現場などにおいて、自分でデータをとることにはメリットもあります。
そこで今回はサッカーのデータのとり方・自分でデータをとるメリット・デメリットについてまとめました。
目次
サッカーにおけるデータ
データのとり方
データのとり方は大別すると「データ会社にとってもらう」と「自分でとる」になります。
データ会社にとってもらう
現在は多くのデータ会社があります。
有名なところだとOpta、Instat、Wyscoutなどがあります。
日本だとデータスタジアムが有名です。
これらのデータ会社は独自に定義した測定項目において試合映像等からデータを取得し、一部無料公表したり、データを売ったり、リーグと提携したりしています。
データの取得には、AIを用いて自動で収集している会社もあれば、人海戦術をとっている会社もあります。
これらのデータ会社は主にトップカテゴリーの試合に関するデータを扱っています。
データ会社を利用してデータを取得するメリットとデメリット
このようなデータ会社を利用してデータを取得することのメリットは
- 時間がかからない
- 大量のデータを取得できる
デメリットは
- お金がかかる
- 測定項目の定義を自分で決められない
などがあげられます。
これらのことから、データ会社のデータを利用した方が良い人は
- 対象となるトップカテゴリーに所属している人
- トップカテゴリーのデータを分析・考察したい人
に限られてくるのかなと思います。
そのため、例えば私が自チームのデータを活用したいといった場合は、自分でとることが最も現実的になります。
自分でデータをとる
自分でデータをとる方法は大きく分けて
- 分析ソフトを利用する
- 紙やエクセルで直接とる
があります。
分析ソフトには、Dart fishやHudlのSports code等があります。
このような分析ソフトは、プレーを分類するためのタグ付けや数値の記録もできるため、実践現場や研究現場でも使っている方は多いです。
Hudlでは、撮った映像を送ることで、タグ付けをするサービス(Hudl Assist)を展開しています。(こちらはデータ提供ではなくタグ付けサービスなので少し話はズレますが。)
紙やエクセル等で直接書き込む方法は、「記述的ゲームパフォーマンス分析」と呼称される手法です。
手軽に行うことができ、データ量によっては分析ソフトを利用するよりも早い場合もあります。
データを自分でとるメリット・デメリット
データを自分でとるデメリットで最も大きいことは間違いなく
- 時間がかかる
です。
逆にメリットは
- お金がかからない
- 測定項目の定義を自分で決められる
- 数値の意味を考える機会になる
があげられます。
特に今回はメリットの中の「数値の意味を考える機会になる」について深堀していきます。
サッカーのデータを解釈する難しさ
サッカーは流動的で複雑なスポーツである(西内,2012)ため、同じ数値でも全く違う意味合いを持つことも珍しくありません。
例えば、自チームのシュート数が5本、相手チームも5本だったとしても、攻撃を同じ評価にすることは難しいです。
なぜなら、シュートを打った状況がそれぞれ違う可能性が高いからです。
今はゴール期待値(xG)によって得点がどれだけ期待されたかを数値で得ることができるので、攻撃の評価は、多くの要素を含んで行うことができます。
しかし、xGにおいてもシュート数と同様のことが言えて、同じ数値だからと言って全く同じ評価をすることはできません。
そのため、シュート数やxGのみで考察するのではなく、他の様々なデータと掛け合わせることで、より正確な評価を行うことができるようになります。
このようなデータの掛け合わせによる考察を行う際に、提供されたデータや公表されているデータを用いると、自分でとったデータと比べて難しくなる可能性があります。
なぜなら、提供・公表されたデータは、すでに多くの要素を含んでいて、その数値の背景は推察するほか方法が無いからです。
逆に自分でデータをとる場合は、実際の状況を見ることができているため、考察のためのヒントを得ることができます。
また、データを取りながら仮説が正しそうかどうかを検討したり、予定していなかった項目を追加することができます。
研究でも測定項目が決まりきらない時、ひとまずデータをとってみると解決することもあります。
まとめ
以上サッカーのデータ収集法、方法別メリット・デメリットでした。
まとめると
データの収集法
- データ会社を利用する
メリット:時間がかからない、大量のデータを簡易に得られる
デメリット:お金がかかる、自分で測定項目を定義できない
- 自分でデータをとる(分析ソフト、紙、エクセルの利用)
メリット:お金がかからない、測定項目を定義できる、数値の意味を考える機会になる
デメリット:時間がかかる
となります。
それぞれのメリットやデメリット、自身の環境から最適なデータ収集法を選択することが大事です。
参考文献
こちらの本はデータスタジアムが公表しているデータを様々な観点から考察しています。
シーズンを通したプレーの傾向をみる方法として参考になります。