今は多くのデータ会社があり、サッカーでも放送中にデータが映し出されることもよく見るようになりました。
JリーグではJ STATSという公式データ(スタッツ)を公開しています。
「J STATS(ジェイスタッツ)はJリーグが認める、試合に関わる様々な競技データの総称。メンバー表や得点者、警告/退場といった試合記録に関わるものから、選手ごとのパスやドリブル、ボール支配率といったプレーに関するデータ、試合中の走行距離や選手のポジショニングなどの位置情報(トラッキングデータ)など、競技記録系データからパフォーマンス系データまでを含む。
J.LEAGUE公式サイト
同サイトでは項目と定義についても記載しています。
シュート | ゴールを目的としたプレー |
枠内シュート | フィールドプレーヤーにブロックされることなくゴールの枠内へ向かって放たれたシュート |
アシスト | ゴールを決めた味方選手へのパス。稀にパス以外でもボールキープを味方に譲ったものや、シュートなどの攻撃的プレーも含む |
ラストパス | シュート(ゴールとなった場合も含む)を打った味方選手へのパス |
パス | 味方選手にボールをつなぐことを目的としたプレー |
クロス | アタッキングサードのサイドからのパスで敵陣ペナルティエリア内の味方選手にシュートを打たせる狙いがあるもの。セットプレーで蹴られたものは対象外 |
スルーパス | 味方が相手最終ラインの裏に走り込むスペースを狙ったパス |
前方パス | 前90度方向へのパス |
ロングパス | 30m以上のパス |
敵陣パス | 敵陣から出したパス |
自陣パス | 自陣から出したパス |
ドリブル | 守備側選手と対じし、その選手を抜こうとする、横にかわしてシュートを打とうとするなどの仕掛けるプレー |
ペナルティエリア進入 | ペナルティエリア外から敵陣側のペナルティエリアにボールが入ってエリア内で味方選手がプレーしたもの |
プレー | トラップやパス、クリアなどのボールタッチアクションの回数 |
タックル | 相手選手がコントロールしているボールを、身体あるいはボールへの接触によって足下から離すプレー |
クリア | 外に蹴り出し陣地を回復させるなど、味方につなぐ意図がなく危険な状態の回避を目的として行ったプレー |
ブロック | 相手のシュートやパスなどを身体に当てて受動的に防いだプレー |
インターセプト | 相手のパスに対して能動的に動いてそのパスをカットし、自ら保持もしくは味方につなげたプレー |
アクチュアルタイム | 試合開始から終了までに実際にプレーされた時間(試合時間からファウルやボールアウトから再開プレーまでの時間を除いた時間) |
ボール支配率 | 両チームのボール保持時間の合計(アクチュアルタイム)に対する自チームの保持時間の割合 |
キャッチ | GKがキャッチしたプレー |
ハンドクリア | GKがパンチングで危険を回避したプレー |
セーブ | 相手に打たれた枠内シュートに対し、GKが触れて失点を防いだプレー。セーブ率はセーブ数÷(セーブ数+失点)で算出。 |
シュートキャッチ率 | 相手に打たれた枠内シュートのうち、GKがキャッチでセーブした割合 |
シュートパンチング率 | 相手に打たれた枠内シュートのうち、GKがハンチングでセーブした割合 |
クロスキャッチ率 | 相手のクロスのうち、GKがキャッチした割合 |
クロスパンチング率 | 相手のクロスのうち、GKがパンチングした割合 |
走行距離 | 試合中の選手の移動距離 |
スプリント回数 | 時速25km以上のスピードで1秒以上走った回数 |
ボール保持時の走行距離 | 自チームがボール保持している時の移動距離 |
ボール非保持時の走行距離 | 相手チームがボール保持している時の移動距離 |
ボール保持時のスプリント回数 | 自チームがボール保持している時のスプリント回数 |
ボール非保持時のスプリント回数 | 相手チームがボール保持している時のスプリント回数 |
トップスピード | 試合中に選手が最も速く移動した速度 |
平均ポジション | 選手がボールタッチをした位置の平均 |
アタッキングサイド | アタッキングサードでのボールタッチ位置の割合 |
プレーエリア | ボールタッチ位置の割合 |
ヒートマップ | 選手が移動したエリアの分布を色で表したもの |
このように、トップリーグとなるとそこそこの項目数が公開されますし、データ会社によってはもっと項目数が多かったりします。
すごいなーと思う一方で、どう解釈すればいいの?と思う人もきっといると思います。
また、自チームでもこのようなデータを取ったほうが良いのか?と悩んでいる人、データを取ってはいるけどどう解釈すれば良いのかと悩んでいる人もいるかもしれません。
そこで今回の記事では
スタッツ(データ)の解釈
について解説していきます。
スタッツの解釈の仕方がわかると、データが試合内容をどの程度表しているのかがわかります。
結論としては
スタッツは試合内容を的確に表しているとは言い難いけど、ちゃんと見れば分析の観点を提供してくれる
というものです。
目次
そもそもデータは抽象的
データ、数字と言えば具体的なものであるという見方も考え方によってはできるのですが、根本的に数字は抽象的な概念です。
例えば人間と冷蔵庫は多くの差異がありますが、個数として数字でまとめることはできます。
多数の差異という情報を低減して、数字に変換する(抽象化する)ことで計算をしたり、解釈の難易度を下げたりしています。
これは人間を数える時でも同じです。
人間同士であっても具体的に見ると多数の差異がありますが、数字として抽象化しているということです。
サッカー的なことでいうと、シュートを例にとれます。
例えばシュートを10本打ったというデータがあったとしても、1本1本は状況が大きく異なる(差異が多い)でしょう。
しかし、そういった状況はひとまず置いておいて、何本シュート打ったという抽象的な情報に変換しているのです。
なので、シュート数だけでは攻撃がうまくいっていたかどうかや、どちらが優勢だったかを推察することは難しいのです。
つまり、簡易なスタッツでは試合内容をかなり大まかにしか把握することはできないことになります。
では、どうすればより試合内容を反映したデータにすることができるのでしょうか。
これは、いわゆる
データの解像度を上げる
という作業が必要になります。
先ほどのシュートの例で言えば、シュートを打った本数だけでなく、
シュートを打った場所、シュートに至るまでの攻撃種類、シュート時の相手DFとの距離や角度、シュート部位
などのように詳細に記録することで、シュート状況を詳細に記述することができるようになります。
これが解像度が上がるということです。
画素数が増えると映像が綺麗になるという感じですね。
そのため、測定項目が多くとることができれば試合内容を反映しやすいと言えます。
ゴール期待値(xG)は良い例です。
ただし、当然ながら項目数を多くするとデータ量も増えるので、データの取得や処理が非常に大変な作業になります。
データ会社や研究者でないとなかなか手が出せないのも事実です。
さらに言えば、データをどれだけ詳細に取ったとしても試合内容を完璧に表すことはできません。
世界はアナログなのでデジタルにする時点で多くの情報を削ぐことになるからです。
データの射程を理解していれば分析のとっかかりになる
では、データをとることは意味のない作業なのかというと、そんなことはありません。
上述したような、データ(スタッツ)の限界をきちんと理解していれば、推察の精度は上がります。
データが粗ければ粗いほど(項目数が少なければ少ないほど)、モザイクが強くかかったような状態になりますが、その状態でも気になる部分を見つけてアナログで見直せば良いのです。
つまり、
シュート数が多いのに勝てなかった
という場合には、シュートシーンを全て見て、なぜ入らなかったかを主観的に考えれば良いということです。
最終的には主観(質的)分析が必要になる
先ほど書いたように、データをどれだけ詳細に取ったところで試合内容を完璧に反映させることはできません。
また、現実的に考えて、予算や時間・人が潤沢にない限りはデータを詳細にとることは難しいです。
そこで重要になるのは主観的(質的)な分析になります。
数字のような量的データと主観的分析は補完関係にあります。
量的データが多くとれない場合は、主観的分析の割合を高めれば良いのです。
ただ、量的データが主観的分析では見つけにくい分析観点を提供してくれることもあるので、個人的には量的データも出来うる限り取ったほうが良いと思っています。
量的データに関しては下記のようにいくつか記事を書いているので、興味のある方はぜひご一読ください。
まとめ
はじめに書いたように、スタッツ(データ)はどの程度試合内容を表しているのか?という疑問に対する結論としては
スタッツは試合内容を的確に表しているとは言い難いけど、ちゃんと見れば分析の観点を提供してくれる
というものです。
主観的(質的)分析の精度と量的データに関する理解を高めていくことが
総合的な分析の質を高めてくれます。