Tag Archives: Volleyball Statistics

Check Your Data Volley Files

Now that the season is under way a lot of people are spending far more hours than is healthy sitting in front  of their computers frantically working away entering their matches into Data Volley.  I am personally a big fan of the software and can proudly say I have been using it for twenty years now.  As much as I have used and loved and won countless matches because of it, there is one small flaw in the program that is continually annoying.  The ‘Validate File’ command is woefully inadequate and finds only the very biggest errors in a scouted file.

For those who have similar feelings, Ben Raymond (my ‘Timeouts’ co-conspirator) has developed a simple validation tool that have saved me countless hours of trolling through dvw files trying to find out why my statistics don’t add up.  It is a web based app, online now at the url https://untangl.shinyapps.io/dvalidate/

Simply upload your file onto the front page and within seconds you will have a report that identifies all (so far) of the common errors that ‘CTRL V’ does not.  For example, it will spot substitution errors, false scores, backrow players spiking in the frontrow, rotation errors and many other.  Below are screenshots of the uploading page and an example of an error report.

Enjoy and hopefully you’ll get more time to spend with your families 🙂

 

Advertisements

Zagrywać czy nie zagrywać? – Oto jest pytanie

Artykuł przetłumaczony na język polski przez Zuzannę Dulnik.  Originalne tutaj.

Na początku chciałbym szczerze przeprosić Williama Szekspira. To było nie na miejscu. Przejdźmy dalej.

Każdy wie, że kiedy wygrywasz losowanie na początku meczu siatkówki, powinieneś wybrać tak, aby zacząć od przyjęcia. To jest tak samo jasne jak moja aluzja do Szekspira była idiotyczna. Dla tych, którzy nie znają powodów tego wyboru, aby wygrać seta zagrywająca drużyna musi uzyskać przewagę o jeden raz więcej niż drużyna przyjmująca. Biorąc pod uwagę to jak trudno jest uzyskać kolejny punkt przewagi, przyjmująca drużyna może czerpać z tego korzyści w każdym secie. Istnieje jednak sugestia, że skoro serwująca drużyna może faktycznie uzyskać tę dodatkową przewagę, to opisany efekt będzie zanegowany.

W przerwie między sezonami wziąłem udział w projekcie badawczym z Benem Raymondem (tzn. Ja mu dałem pewne dane a on je zbadał), który zasugerował (lekko konstrowersyjnie), że przerwy taktyczne nie były aż tak efektywne aż mogło nam się wydawać (wszystkie linki znajdują się tutaj). Kiedy skończyliśmy to badanie, zaczęliśmy patrzeć na inne aspekty gry. Pytanie “wybrać zagrywkę czy przyjęcie na początku gry” wydało nam się dobrym do rozpatrzenia. Jeśli chcesz przejrzeć wszystkie dane, kliknij w ten link. Jeśli chcesz podsumowanie, czytaj dalej.

W pierwszym przypadku wzięliśmy procentową średnią przyjęcia w Pluslidze i przeprowadziliśmy symulację komputerową 10 tysięcy setów. Symulacja pokazała, że drużyna, która zaczynała set od przyjęcia wygrała ich 4.4% więcej niż drużyna, która rozpoczynała od zagrywki – 52.2% v 47.8%. Wyraźnie widać, że rozpoczynanie meczu od przyjęcia powinno wyjść na korzyść pomiędzy drużynami o podobnym poziomie. Podobne wyniki, w różnym stopniu, zostały uzyskanie przy przyjęciu powyżej 50%. Ten rezultat wydaje się sugerować, że pomiędzy drużynami o zbliżonym poziomie, wartość posiadania dodatkowej szansy na uzyskanie przewagi niekoniecznie wyrównuje tę niekorzyść wynikającą z rozpoczęcia seta od serwisu.

Wiedząc, czego się spodziewać, spojrzeliśmy później na faktyczne wydarzenia z ligi polskiej i włoskiej. Te wyniki były interesujące. Przyjmująca drużyna wygrała:

Plus Liga – 50.1% setów

Włoska SuperLega – 46.8%

To znaczy, we włoskiej lidze przyjmowanie na początku seta wydaje się być niekorzystne. Dlaczego te wyniki tak się różnią? Wpadliśmy na dwie możliwości. Po pierwsze, wielkość próbki aktualnych danych to ok 500 setów, o wiele mniej niż 10 tysięcy z symulacji komputerowej. Po drugie w rzeczywistości drużyny nie mają równego procenta przyjęcia, jedna drużyna jest lepsza niż druga.

Spróbowaliśmy zagłębić się trochę dalej, by zobaczyć czy możemy znaleźć inne przyczyny. Na przykład czy różnicę robił fakt, że różnica punktowa w secie była mała (trzy i mniej punktów). Jak sie okazało tak i nie. W Polsce, drużyna przyjmująca wygrywała 54.1% setów (jak się spodziewaliśmy), ale we Włoszech tylko 43% setów (odwrotnie do spodziewanych wyników). Włoska liga jest najwyraźniej bardzo dziwna.

Kiedy poszliśmy jeszcze głębiej, odkryliśmy, że we włoskiej lidze pomiędzy drużynami o podobnym poziomie (drużyny z miejsc 1-4 i 5-8 grające między sobą), przewaga drużyny przyjmującej przy wygrywaniu setów była znacząca (56.9% oraz 54.3%). Jednak ten związek nie wystąpił w Pluslidze. Jest to bardzo dezorientujące i zaskakujące biorąc pod uwagę wyniki symulacji komputerowej.

Co możemy powiedzieć na koniec? Przyjmująca drużyna powinna mieć wyraźną przewagę z biegiem czasu, jeśli nie zawsze w okresie krótkoterminowym. Możemy się spodziewać, że przewaga będzie jeszcze większa w wyrównanych setach i pomiędzy wyrównanymi drużynami. Życie nie zawsze toczy się tak jak byśmy się tego spodziewali.

Kilka innych wskaźników, które wyłapaliśmy z aktualnych danych, a które mogą wydać się interesujące.

  • Drużyna, która zdobyła pierwszy punkt miała około 57% szans na wygranie seta
  • Jeśli drużyna rozpoczynała seta od zagrywki i wygrała pierwszy punkt, ich szansa na wygranie seta wynosiła ponad 60% (Plus Liga 60%, Superlega 66%)
  • Drużyna, która jako pierwsza uzyskała ósmy punkt, miała 70% szans na wygranie seta. Ten procent wzrastał do 83%, jeśli przewaga przy ósmym punkcie wynosiła trzy lub więcej.
  • Drużyna, która jako pierwsza uzyskała 16-ty punkt miała 83% szans na wygranie seta. Ta wartość wzrastała do 92%, jeśli przewaga wynosiła trzy lub więcej punktów.
  • Jesli sety były wyrównane (trzy lub mniej punktów), wszystkie powyżej wymienione wskaźniki miały mniejszą rację bytu.

To Serve Or Not To Serve? – That Is The Question

Firstly, my sincerest apologies to William Shakespeare. That was uncalled for. Let’s move on.

Everyone knows that when you win the toss in volleyball you should choose to receive. That is as clear as my Shakespeare allusion was idiotic. For those who don’t know the reasoning behind it, the serving team must win one break point more than the receiving team in order to win a set. Given that it is very difficult to win a break point the receiving team has an advantage in any / every given set. There is, however, some suggestion that as the serving team has an extra opportunity to win that break point, the effect is negated.

During the off season, I was involved in a research project with Ben Raymond (i.e. I gave him some raw data and he researched it) that suggested (somewhat controversially) that timeouts were not as effective as we might think (all the links are here). When we were finished with that we started looking at some other things. The ‘serve or receive first’ question seemed like a pretty good question to investigate. If you want to go through all the data, click on this link. If you just want the executive summary, read on.

In the first instance, we took the average sideout percentage  for the Polish Plus Liga and ran a computer simulation of 10,000 sets. The simulation showed that the team receiving first won 4.4% more sets than the team serving first, 52.2% v 47.8%. Clearly it should be an advantage to receive first between closely matched teams.  The same holds, to varying degrees for any sideout percentage above 50%. This result seems to suggest that the between closely matched teams the value of having an extra chance for a break point does not (completely) even out the disadvantage

Knowing what we expected to happen, we then looked at actual events from the Polish and Italian leagues. Those results were interesting. The team receiving first won:

Polish Plus Liga – 50.1%

Italian Superlega – 46.8%

That is, in the Italian League it seems to actually be a disadvantage to receive first.  Why are the results different.  We came up with two possibilities.  Firstly, the sample size in each league was about 500 sets, a lot less than the 10,000 in the simulation. Secondly, in real life the teams do not have equal sideout percentages, one team is better than the other.

We tried to dig down a little bit deeper to see if we could find other factors. For example, did it make a difference if the set was close (three points or less).  Yes and no.  In Poland, the team receiving first won 54.1% of the time (as expected). But in Italy, they won only 43% of the time (the opposite of expected). That Italian league is apparently very strange.

When we dug down even deeper, we found that in the Italian League among similarly matched teams (teams 1-4 and 5-8 playing against each other) in close sets there was a strong advantage in receiving first (56.9%, 54.3%).  But this relationship didn’t hold in the Polish league. It is all very confusing, and surprising in the context of our simulation results.

So what can we say in the end? The receiving team should have a clear advantage over time, if not always in the short term. We can expect that the advantage is even greater in close sets and between evenly matched teams. Life doesn’t always happen as we expect.

A couple of other indicators we picked out of the actual data that could be interesting.

  • The team winning the first point had a roughly 57% chance of winning the set
  • If the team serving first won the first point, their chance of winning the set was over 60%. (Plus Liga 60%, Superlega 66%)
  • The team reaching 8 points first, had a 70% chance of winning the set. This increased to 85% if the margin was 3 or more points.
  • The team reaching 16 points first, had an 83% chance of winning the set. This increased to 92% if the margin was 3 or more points.
  • The team reaching 20 points first, with a margin of 3 or more points, had a 95% chance of winning the set.
  • If the sets were close (three points or less), all of the above indicators were less likely.

The legendary Platonov, now on iTunes.

https://itun.es/au/SNTxV.l

Timeout Study – The Collected Links

During the off season, I undertook a study of data from the Polish and Italian Leagues with the very great help of Ben Raymond.  In a series of posts we looked at various aspects of timeouts and whether the data supported the theory that timeouts are effective.

The five articles and the Polish translations are linked below.

English version

1.The Truth About Timeouts

2. The Truth About Timeouts – Part Two

3. The Truth About Timeouts – Part Three

4. Timeout Studies – Full Data

5. Timeout Studies – Loose Ends

Polish version

1.PRAWDA O KORZYSTANIU Z CZASÓW*

2. PRAWDA O KORZYSTANIU Z CZASÓW* – CZĘŚĆ DRUGA

3. PRAWDA O KORZYSTANIU Z CZASÓW* – CZĘŚĆ TRZECIA

4. ANALIZA KORZYSTANIA Z CZASÓW – PEŁNE DANE

5. BADANIA KORZYSTANIA Z CZASÓW – LUŹNE WĄTKI

 

Blocking And Serving Effectiveness – The Answer?

Thanks for all comments and suggestions.  They were all thoughtful and helpful.

I did a poor job of explaining the situation so a few people misinterpreted the information and thought I was referring to sideout percentage.  The problem is that I never directly refer to serve quality, I only ever relate a serve to reception quality.  I understand that is a complicated way of thinking about it.

To rephrase my point, after a positive (+) serve, the team in question was much more likely to win a point if the serve was a jump serve than if it was a float serve.  For the record these are the actual figures.

opp rec pts total  ratio jump ratio float ratio
R- 187 396 0.4722 98 197 0.4975 88 197 0.4467

The ‘winning’ suggestion was the observation that the float servers are most often middle blockers who then must defend.  That is, the libero is not on court.  Breaking down the above situation by whether or not the middle blocker is defending, we get the following figures for the float serve.

Middle in defence 48 119 0.4034
Libero in defence 40 78 0.5128

The sample isn’t really big, but it seems to show that there is a fairly large ‘libero effect’, at least with this team.

Oddly, for the ‘2’ reception, the ‘libero effect’ is much smaller and doesn’t explain the differences so well, but for the moment I am satisfied.

Blocking And Serving Effectiveness

I have an observation that does not make sense to me, for which I can think of no explanation.  Perhaps you can help.

I have found over the years that reception from jump serves and reception from jump float serves is not the same.  I don’t mean that the quality of reception is different, I mean that given a particular quality of reception, the likelihood of winning a point is different.  In some cases vastly different.

For example, studying a team recently, I discovered that if the jump servers can force a negative reception, (i.e. only one possible attacker, basically a high ball attack) that team wins the point roughly 50% of the time.  However, if the jump float servers can the same negative reception, the team wins the point only 45% of the time.  The difference is even more stark with good reception without first tempo (i.e. both the outside can still attack a fast ball, a classic ‘2’ pass).  In that case the jump servers won 43% of the time, but the float servers only 26%.

In each case the definitions are the same, the scoutman/recorder is the same, the team is the same, the figures are based on a whole season’s worth of data.  The best I can come up with is that there is a difference somehow in blocking the two situations, but that is the best I can come up with.

To quote a popular figure from my childhood, “Why is it so?”

 

 

BADANIA KORZYSTANIA Z CZASÓW – LUŹNE WĄTKI

Artykuł przetłumaczony na język polski przez Zuzannę Dulnik. Originalne po Angielsku jest tutaj.

Cztery posty o badaniu korzystania z czasów w siatkówce, wykonanym przez Bena Raymonda i przeze mnie (tutaj, tutaj, tutaj i tutaj) wzbudziły, bez zaskoczenia, pewne dyskusyje i argumenty. Wielu czytelników pozostało przekonanych, że wzięcie czasu pozytywne wpływa na ich drużynę. Użyta logika była czasem zawiła i trudno było za nią nadążyć. Niektórzy czytelnicy byli w stanie przyznać, że nie istnieje dowód, który – jeśli byłby dostarczony – mogłby zmienić ich zdanie. Zastanawiałem się dlaczego ci ludzie zdecydowaliby się na wzięcie udział w seminariach dla trenerów, ale to odrębna kwestia.

Najpopularniejszy argument był taki, że skoro badanie pokazało procent przyjęcia powracający do normy po wzięciu taktycznej przerwy, to udowadnia efektywność czasów. To twierdzenie starannie pominęło inne stwierdzenie, które pokazało, że w przypadku gdy czas nie był wzięty, procent przyjęcia również powrócił do normy. Zatem cokolwiek to badanie ‘udowodniło’ to to, że korzystanie z czasu jak i nie korzystanie z czasu działały RÓWNIE efektywnie i miały krótkoterminowy wpływ na odsetek dobrego przyjęcia. Jeżeli masz skłonność do działania, to wykorzystasz tę informację do tego by brać czas. Jeśli twoja skłonność balansuje pomiędzy działaniem i brakiem działania, to być może wykorzystasz tę informację aby nie brać czasu.

Drugim najczęstszym argumentem było to, że celem trenera nie było wygranie pojedynczej akcji, więc bardziej trafne byłoby zanalizowanie serii punktów przed i po wzięciu czasu. Myślę, że to jest sensowny argument. Proponowałbym by trenerzy brali czasy by wygrać pojedynczą akcję i dla pewnego długoterminowego celu. Jestem pewien, że analiza pokazałaby, że odsetek przyjęcia podczas trzech, czterech zdobytych punktów przed wzięciem czasu jest mniejszy niż podczas trzech, czterech punktów zdobytych po wziętych czasie. To byłoby całkowicie zgodne z danymi, które mamy oraz z odkrytymi zależnościami. To znaczy, różnica pomiędzy wzięciem i nie wzięciem czasu byłaby statystycznie nieznacząca (*sprawdź moje obliczenia poniżej).

Co ciekawe, nikt nie podjął tematu innych sytuacji, które zdarzają się podczas gry, które mogą wpłynąć na efekt wzięcia czasu. Zmiana zawodników zajmuje prawie tyle samo czasu ile przerwa taktyczna, a w zarówno polskiej jak i włoskiej lidze Video Challenge zajmuje nawet więcej czasu. W każdym secie może być nawet do 20 oficjalnych przerw w grze, z których my spojrzeliśmy na reptem pięć lub sześć. Nie mamy pojęcia co dzieje się z całą resztą i jak różne przerwy w grze współgrają z innymi. Ostatecznie być może natłok tych wszystkich przerw w grze neguje efekt pojedynczej przerwy. Może siatkówka jest grana tak niesystematycznie, że żadna z tych przerw może zrobić jakąkolwiek różnicę.

To, co ja wynoszę z tego badania, jest proste. My trenerzy przeceniamy nasz indywidualny wpływ. Być może w większej ilości przypadków, niż ten jeden.


*Scenariusz – Drużyna traci dwa punkty z rzędu przy zagrywce przeciwnika i bierze czas. Jak zmienia się odsetek przyjęcia w ciągu trzech akcji przed i po wziętym czasie? (Dane wizęte z polskiej ligi)

Wskaźnik przyjęcia przed wziętą przerwą – jedno dobre przyjęcie z trzech podejść = 0.33

Wskaźnik przyjęcia po wziętym czasie (spodziewany) – 0.668 + 0.666 + 0.666 = 0.666

W związku z tym wzięty czas był efektywny w średnim wymiarze.

ALE…

Jeśli czas nie był wzięty, spodziewany wskaźnik dobrego przyjęcia po tej serii to 0.666 + 0.666 + 0.666 = 0.666

Zatem średni wymiar wskaźnika dobrego przyjęcia jest dokładnie taki sam z wziętym lub bez wziętego czasu.

_________________________________________________________________________________________________

Read about the great new Vyacheslav Platonov coaching book here.

Cover v2