Frank Anscombe był angielskim statystykiem, zainteresowanym analizą i wizualizacją danych. Gdy zaczął pracować na pierwszych komputerach, szybko zauważył, że „(…) powinien zarówno wykonywać obliczenia, jak i prezentować wyniki graficznie„. Większość swojej kariery spędził na uniwersytetach: Cambridge, Yale i Princeton. Zasłynął jednak kwartetem…
Kwartet Anscombe’a jak przykład macierzy korelacji
Anscombe przykładał wielką wagę do graficznej prezentacji danych, podobnie jak jego szwagier i wynalazca wykresu pudełkowego John Tukey. Aby jego przesłanie, że aby zrozumieć zbiór danych, trzeba go najpierw zobaczyć, lepiej zapadło studentom w pamięć, przygotował 4 zestawy danych opisane punktami x i y. Dla każdego z nich wyliczył podstawowe statystyki:
- Liczność = 11
- Średnia x = 9
- Wariancja x = 10
- Średnia y = 7,5
- Wariancja y = 3,75
- Korelacja p = 0,816
- Regresja liniowa y=0,5 x + 3
Wielu statystyków uznałoby, że zbiory są identyczne lub bardzo podobne, jednak Anscombe przygotował dla nich niespodziankę – każdy z czterech wykresów punktowych w tym kwartecie wygląda zupełnie inaczej, co dostrzeże nawet dziecko.