Kwartet Anscombe’a – „By zrozumieć, trzeba zobaczyć”

Frank Anscombe był angielskim statystykiem, zainteresowanym analizą i wizualizacją danych. Gdy zaczął pracować na pierwszych komputerach, szybko zauważył, że „(…) powinien zarówno wykonywać obliczenia, jak i prezentować wyniki graficznie„. Większość swojej kariery spędził na uniwersytetach: Cambridge, Yale i Princeton. Zasłynął jednak kwartetem…

Kwartet Anscombe’a jak przykład macierzy korelacji

Anscombe przykładał wielką wagę do graficznej prezentacji danych, podobnie jak jego szwagier i wynalazca wykresu pudełkowego John Tukey.  Aby jego przesłanie, że aby zrozumieć zbiór danych, trzeba go najpierw zobaczyć, lepiej zapadło studentom w pamięć, przygotował 4 zestawy danych opisane punktami x i y. Dla każdego z nich wyliczył podstawowe statystyki:

  • Liczność = 11
  • Średnia x = 9
  • Wariancja x = 10
  • Średnia y = 7,5
  • Wariancja y = 3,75
  • Korelacja p = 0,816
  • Regresja liniowa y=0,5 x + 3

Wielu statystyków uznałoby, że zbiory są identyczne lub bardzo podobne, jednak Anscombe przygotował dla nich niespodziankę – każdy z czterech wykresów punktowych w tym kwartecie wygląda zupełnie inaczej, co dostrzeże nawet dziecko.

Kwartet Anscombe'a

Udostępnij ten wpis:

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *