Macierz korelacji w Excelu

Macierz korelacji to zaawansowane narzędzie do oceny dużej ilości korelacji liniowych pomiędzy danymi. Jest to ocena przybliżona, ponieważ osie danych nie zawsze są identyczne i widoczne, dane również bywają nie do końca czytelne, ale macierz nie ma za zadanie pokazywania dokładnych wartości serii czy pojedynczego punktu danych, a jedynie to, czy zachodzą między danymi jakieś zależności. Tak jak w wykresie panelowym, chodzi o to, żeby zobaczyć na raz dużo zależności, nawet kosztem dokładności.

Przykład macierzy korelacji

Poniższa macierz pokazuje korelację między parami zmiennych (wymienionymi po prawej i na dole) dla różnych dzielnic dużego miasta. Jedna kropka = jedna dzielnica, osie oznaczają wynik (0-100) w danej kategorii, im wyżej tym lepiej. Przykładowo Transit na poziomie 90 oznacza najlepiej skomunikowaną dzielnicę miasta. Różowy obszar zawiera 75% środkowych obserwacji – jego kształt pozwala zorientować się, czy dwie zmienne są skorelowane (dodatnio lub ujemnie) czy nie. Zaznaczone na macierzy wnioski pozwalają określić zależności, np. im gorszy dojazd tym tańsze domy.

macierz korelacji

Źródło: http://junkcharts.typepad.com/junk_charts/2010/06/the-scatterplot-matrix-a-great-tool.html

Jak utworzyć macierz korelacji w Excelu?

Excel nie posiada wbudowanego wykresu macierz korelacji, możemy więc posłużyć się płatnym dodatkiem lub przygotować taką macierz ręcznie na podstawie kilku wykresów punktowych. Poniżej przybliżam proces tworzenia takiej macierzy krok po kroku. Pierwszym krokiem jest utworzenie w Excelu poniższych trzech pól. Wielkość pól dostosujmy do oczekiwanej wielkości wykresów, które będą składały się na macierz. Nazwy pól staną się legendą dla wykresów – osiami poziomą lub pionową.

Macierz korelacji w Excelu 1

Macierz zostanie przygotowana na podstawie poniższej tabeli z danymi: wielkość zamówienia, wartość sprzedaży oraz suma zysku.

Macierz korelacji w Excelu 2

Zaznaczmy Wielkość zamówienia oraz Sprzedaż i wstawmy wykres punktowy.

Macierz korelacji w Excelu 3

Domyślny wykres wygląda jak poniżej:

Macierz korelacji w Excelu 4

Usuńmy linie siatki, tytuł wykresu oraz oś X.

Macierz korelacji w Excelu 5

Następnie sformatujemy kolor serii: obramowanie ciemnoszare, brak wypełnienia.

Macierz korelacji w Excelu 6

Kolejnym krokiem będzie obramowanie samego obszaru wykresu na ciemnoszaro…

Macierz korelacji w Excelu 7

…oraz usunięcie obramowania oraz wypełnienia obszaru kreślenia. Dopasujmy również skalę, tak aby etykiety osi Y były w miarę czytelne.

Macierz korelacji w Excelu 8

Gotowy wykres dopasowujemy rozmiarem do przygotowanych wcześniej pół oraz umieszczamy jak poniżej. Pole Wielkość zamówienia oraz Sprzedaż są nazwami osi – wielkość zamówienia dotyczy osi poziomej, sprzedaż dotyczy osi pionowej.

Macierz korelacji w Excelu 9

 

Na podstawie powyższych kroków przygotowujemy kolejne wykresy punktowy do macierzy. Starajmy się, żeby skalę osi były w miarę spójne, ponieważ część wykresów nie będzie ich mieć i możemy wtedy korzystać z osi wykresu sąsiadującego.

Macierz korelacji w Excelu 10 

Gotowa macierz wygląda jak poniżej. Zestawione są ze sobą wykresy, na których widzimy zestawienie dwóch zmiennych w różnych konfiguracjach. Pola z nazwami mają nam ułatwić czytanie owych konfiguracji.

Macierz korelacji w Excelu 11Plik Excel do pobrania

Tu możesz pobrać szablon macierzy korelacji w Excelu.

Udostępnij ten wpis:

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *