Drugi rok z rzędu stopa bezrobocia rejestrowanego osiąga historyczne minimum. Z tej okazji pokusiłem się o próbę przedstawienia go w niestandardowy sposób – jako zmiany w czasie w poszczególnych powiatach. W ten sposób powstała wizualizacja w postaci kartogramów ułożonych w na wykresie panelowym.
Bezrobocie w Polsce w latach 2004-2017
Wizualizację można przeglądać na 2 sposoby:
1. Jako statyczny obraz (kliknij, aby powiększyć):
2. Jako zmiany w czasie na zmieniającym się GIF-ie:
Jak powstawała wizualizacja?
Przygotowanie wizualizacji zajęło sporo czasu z uwagi na standard znalezionych danych i testy przedziałów kartogramu.
Krok 1. Pobranie danych z GUS
Dane pochodzą z 2 źródeł ze strony GUS. Oddzielnie pobrałem plik z danymi dla powiatów dla lat 2004-2016.
Oddzielnie też dane dla aktualnego roku, które dla całego kraju są już kompletne, natomiast dla powiatów były w momencie tworzenia wizualizacji na koniec III kwartału 2017 r.
I tu pojawiły się pierwsze schody, gdyż nazwy powiatów w obu zbiorach były różne i w inny sposób przechowywane. Jeśli dodać do tego fakt, że w Polsce mamy powiaty o tych samych nazwach, potrzebny był proces uporządkowania danych.
Krok 2. Przygotowanie danych w Excel Power Query
Najlepszym narzędziem do przygotowania danych jest dla użytkowników Excel Power Query (Pobieranie i przekształcanie / Get & Transform). W Power Query:
- pobrałem 3 tabele źródłowe (2014-2016, 2017, słownik powiatów z Mapy Polski Excel Powiaty)
- dokonałem sprawdzenia słowników (poprzez operację Scalanie)
- scaliłem je w 1 źródło danych
- poprawiłem błędy i różne nazwy powiatów
- usunąłem niepotrzebne kolumny
- odpivotowałem tabelę, aby móc później pracować na tabeli przestawnej
Każdy, kto uczestniczył w kursie online Power Query lub szkoleniu stacjonarnym Excel BI w pracy analityka – Power Query, Power Pivot, Power View, Power Map, Power BI, spokojnie poradziłby sobie z tymi zadaniami.
Na końcu otrzymałem płaską tabelę, którą wkleiłem do Mapy Polski Excel.
Krok 3. Wizualizacja danych na Mapie Polski Excel z fragmentatorami
Aby sprawnie zmieniać lata na mapie, zastosowałem połączenie Mapy Polski Excel Powiaty z fragmentatorem tabeli przestawnej. Dodałem też dodatkową tabelę przestawną z odfiltrowanymi latami, którą połączyłem z komórką pod mapą. Musiałem tylko pamiętać, aby fragmentator podłączyć do wszystkich tabel przestawnych.
Dobór przedziałów i liczby klas w kartogramie jest zawsze kwestią dyskusyjną. Ponieważ wizualizacja ma na celu podkreślenie powiatów skrajnych, zastosowałem wbudowaną w mapę paletę zielono-czerwoną z przedziałami o niestandardowej rozpiętości.
Krok 4. Stworzenie wykresu typu sparklines
Wykres typu sparklines powstał w komórce Excel dla pełnych danych za wszystkie lata 2014-2017.
Krok 5. Zbudowanie wykresu panelowego
Całość umieściłem na jednym obrazie, dodając oznaczenia legend. Z wykorzystaniem programu Camtasia byłem też w stanie nagrać ruchomy obraz graficzny w formacie GIF.
Interpretacja wykresu
Choć nie jestem ekspertem merytorycznym od bezrobocia, udało mi się wychwycić kilka ciekawostek związanych z mapą:
- aktualnie prawie całe województwa wielkopolskie, łódzkie, śląskie i małopolskie zeszły poniżej poziomu 10%
- na drugim biegunie znajdują się północne powiaty województwa warmińsko-mazurskiego i zachodniopomorskie
- znacznie niższe stopy bezrobocia są w dużych miastach – już dla 2004 na stałe na zielono odcinają się takie miasta jak: Warszawa, Poznań, Kraków, Katowice
- stopniowo poprawiającą się sytuację na rynku pracy pogorszył znacznie kryzys rozpoczęty w 2008 r.
Jeśli Tobie udało wychwycić się coś ciekawego, podziel się w komentarzu.
wiem czemu bezrobocie w Polsce się zmniejszyło, albo inaczej, czemu bezrobotnych ubyło, wyjechali do pracy za granice, wiem to po sobie
Pewnie tak. A z drugiej strony mieliśmy też spory napływ w ostatnich latach. Ciekawe, jak to będzie wyglądało za rok…