Budowanie wykresów w tradycyjny sposób polega na jego wstawieniu już w pierwszym kroku. Poniższe kroki prezentują logiczną kolejność decyzji podczas projektowania, które nie są sztywną zasadą, ale mogą nam w tym procesie pomóc. W rzeczywistości bowiem, kiedy przejdzie się przez ten proces kilka razy, zakorzeni się on jako naturalne i półświadome podejście do tworzenia wykresu.
Określ komunikat i zidentyfikuj dane
Mimo że może się to wydać oczywiste, należy przypomnieć, że pierwszym i najważniejszym krokiem projektowania wykresu jest ustalenie co chcemy powiedzieć. Należy to przypomnieć, bo krok ten bardzo często jest pomijany. Nie wystarczy wziąć dane, których zaprezentowanie zostało nam zlecone, i przekształcić je w wykres. Kiedy mówimy, przesiewamy dostępną treść, potem dobieramy słowa i układamy w sposób, który umożliwi osiągnięcie celu komunikacji. Jeśli mówimy wszystko, co nam ślina na język przyniesie, ludzie kwestionują nasze zdroworozsądkowe podejście do tematu. Tak samo jest z komunikacją danych ilościowych.
Zatem przed rozpoczęciem komunikowania trzeba wiedzieć, co dane oznaczają i co jest ważne dla odbiorców komunikatu. Tylko wtedy można pozbyć się tego, co niepotrzebne, wybrać najlepszy środek przekazu i wyróżnić to, co najważniejsze.
Ustal, czy tabela, wykres czy może obie te formy są potrzebne do komunikowania przekazu
Czy dane będą użyte, aby wyszukać i porównać pojedyncze wartości lub czy dane muszą być precyzyjne? Jeśli tak, zastosowanie ma tabela. Jeśli komunikat zawiera się w kształcie danych – trendach, wzorcach, wyjątkach lub porównaniach, które uwzględniają więcej niż kilka wartości, zastosowanie ma wykres. Jeśli komunikat wymaga pewnych elementów z obu rozwiązań, można je zastosować równolegle: w tabeli i na wykresie.
Ustal najlepsze środki prezentacji wartości
Poniżej znajduje się siedem głównych związków między ilościowymi danymi biznesowymi. Wiedza o tym, który z nich najlepiej wspiera komunikat, może przybliżyć do prawidłowego wyboru typu wykresu.
Porównanie nominalne
– kolumny (pionowe lub poziome),
– punkty (jeśli skala nie zawiera zera).
Szereg czasowy
– linie, aby podkreślić ogólny kształt danych,
– kolumny, aby podkreślić i ułatwić porównania między poszczególnymi wartościami,
– punkty połączone linią, aby delikatnie podkreślić pojedyncze wartości, uwidaczniając nadal ogólny kształt danych.
Ranking
– kolumny (pionowe lub poziome),
– punkty (jeśli skala nie zawiera zera).
Część całości
– kolumny (pionowe lub poziome). Uwaga: wykres kołowy jest często stosowany w celu przedstawienia części całości, ale nie działa tak dokładnie jak wykres kolumnowy, ponieważ o wiele trudniej jest porównać wielkość wycinków niż długość kolumn.
Odchylenie
– linie, aby podkreślić ogólny kształt danych (tylko jeśli odchylenie przedstawiane jest razem z szeregiem czasowym),
– punkty połączone linią, aby delikatnie podkreślić pojedyncze wartości, uwidaczniając nadal ogólny kształt danych,
– kolumny, aby podkreślić i ułatwić porównania między poszczególnymi wartościami.
Rozkład
– kolumny (tylko pionowo), aby podkreślić indywidualne wartości. Uwaga: taki rodzaj wykresu nazywa się histogram,
– linie, aby podkreślić ogólny kształt danych. Uwaga: taki rodzaj wykresu zwany jest wielobokiem liczebności.
Korelacja
– punkty i linia trendu w formie wykresu punktowego.
Określ, gdzie przedstawić każdą zmienną
Jeśli wykres pokazuje pojedynczą kategorię zmiennych, krok ten jest prosty – wystarczy powiązać ją z jedną z osi. Dla wykresu liniowego i każdego, na którym występuje skala interwałowa, należy zawsze umieszczać skalę kategorii na osi X (osi poziomej) a skalę ilościową na osi Y (osi pionowej). Jest to szczególnie ważne, gdy skala interwałowa zawiera szereg czasowy, ponieważ intuicyjnie przedstawia się oś w poziomie, rosnąco od lewej do prawej, a nie w pionie.
Kiedy w celu prezentacji danych stosowane są kolumny, a szereg czasowy nie jest wykorzystywany, mamy wybór między zorientowaniem kolumn pionowo, ze skalą kategorii na osi X, lub poziomo, ze skalą kategorii na osi Y. Kolumny poziome mają zastosowanie w szczególności w jednym z poniższych przypadków:
– etykiety tekstowe powiązane z kolumnami są długie
– jest wiele kolumn.
W każdej z tych sytuacji użycie kolumn pionowych powoduje ściśnięcie etykiet na osi poziomej, które może być trudne. Zastosowanie kolumn poziomych rozwiązuje ten problem, sprawiając, że, jak na poniższym rysunku, kolumny układają się jedna na drugiej.
Jeśli wykres dotyczy trzech zmiennych, trzeba zdecydować, którą zaprezentować na osiach, a którą przy pomocy innego wizualnego atrybutu, jakim jest kolor. Na wykresie liniowym należy umieścić najważniejszą dla komunikatu zmienną wzdłuż osi X. Na wykresie kolumnowym należy natomiast zaprezentować zmienną, której elementy chcemy porównywać, innym sposobem niż porównanie z osią, jak na poniższym rysunku. Znacznie łatwiej jest porównać rezerwacje z rachunkami niż regiony, ponieważ są umieszczone obok siebie. Zwykle najlepiej jest przedstawić trzecią zmienną używając odrębnego koloru, a nie innych metod, np. innej linii lub deseniu wypełnienia. Należy zwrócić uwagę na to, aby kolor był odmienny nawet po wydruku w odcieniach szarości, co zagwarantuje, że także daltoniści będą w stanie dostrzec rozróżnienie.
Najczęściej pojedynczy wykres wystarczy, aby przekazać pojedynczy komunikat ilościowy, ale w niektórych przypadkach kilka zmiennych, które muszą zostać przedstawione, nie zmieszczą się na pojedynczym wykresie. Każda z dwóch osi na wykresie może zostać wykorzystana w celu prezentacji jednej zmiennej, co w sumie daje dwie. Można także umieścić kolejną zmienną dodając dodatkową linię, zestaw kolumn lub punktów, obrazowanych w odmienny sposób, np. poprzez zastosowanie odrębnego koloru. Daje to już trzy zmienne. Ale co jeśli chcemy przedstawić cztery zmienne? Można zastosować wykres 3D, dodając trzecią oś (oś Z), ale wykres taki będzie trudny do odczytania. Jest jednak rozwiązanie, które sprawdza się całkiem nieźle – wykres panelowy, który uwzględnia to, co ekspert wizualizacji danych Edward Tufte nazywa małą wielokrotnością (ang. small multiple).
Rozwiązanie to wymaga serii kilku wykresów, ułożonych razem w sposób umożliwiający jednoczesne ich widzenie. Każdy wykres jest podobny do siebie, włącznie z jednolitą skalą, różniąc się jedynie tym, że każdy pokazuje inny element na skali kategorii. Poniższy wykres objaśnia ten pomysł. Przedstawia on trzy wykresy ułożone poziomo, każdy pokazując rezerwacje i rachunki w rozbiciu na regiony, co daje trzy zmienne, natomiast każdy wykres różni się w zależności od czwartej zmiennej, czyli kanału sprzedaży. Zapewnienie spójności skali ilościowej gwarantuje łatwość porównania trzech kanałów.
Stosowanie małej wielokrotności w celu wsparcia dodatkowej zmiennej jest wartościową techniką. Wykresy mogą być organizowane pionowo, poziomo lub nawet w matryce kolumn i wierszy. Jeśli sytuacja wymaga dodania jeszcze jednej zmiennej do pojedynczego wykresu, najlepiej wybrać właśnie to rozwiązanie.
Dobierz najlepszy projekt dla pozostałych obiektów
Teraz przyszedł czas na kilka pozostałych wyborów w projekcie, w tym skali i tekstu. Decyzje te dotyczą położenia i wizualnej prezentacji tychże obiektów.
Określ zakres skali ilościowej
Należy pamiętać, że kolumny stosowane do prezentacji wartości muszą zaczynać się od zera na skali ilościowej, ale jeśli korzystamy z linii, punktów lub ich kombinacji, możemy skalę zawęzić. Gdy wykres jest używany w celach analitycznych i wymaga widzenia różnic pomiędzy wartościami z maksymalną dokładnością, zwężenie skali może być pomocne, co pokazuje poniższy wykres. Ogólnie rzecz biorąc, powinno się dopasować skalę, tak aby zaczynała się lekko poniżej najniższej wartości danych i kończyła nieznacznie powyżej najwyższej wartości.
Należy jednak zachować ostrożność, kiedy następuje zwężanie skali, aby było jasne dla odbiorcy, że ma to miejsce i nie powiąże on błędnie dużych różnic między liniami i punktami na wykresie z dużymi różnicami w ich wartościach.
Jeśli używasz kolumn do prezentacji danych, ale komunikat byłby lepiej widzialny przy zawężonej skali, po prostu zastosuj punkty zamiast kolumn. Punkty nie rzucają się może w oczy tak jak kolumny i nie podkreślają tak dobrze indywidualnych wartości, ale są świetnym substytutem dla kolumn, kiedy, analogicznie jak na poniższym rysunku, chcemy zawęzić skalę.
Jeśli legenda jest wymagana, określ, gdzie ją umieścić
Im bardziej bezpośrednio można nadać etykiety danym tym lepiej. Przykładowo, jeżeli na wykresie liniowym z wieloma liniami da się umieścić etykiety bezpośrednio na wykresie (np. na końcu linii), będzie on łatwiejszy do czytania. Na wykresie kolumnowym z kilkoma seriami danych zwykle potrzebna jest legenda, ale będzie ją można łatwiej odczytać, porządkując etykiety zgodnie z kolejnością kolumn. Znacznie łatwiej jest powiązać etykiety z kolumnami, jeśli są przedstawione jak na wykresie po prawej stronie poniżej, a nie tak jak po lewej. Warto także zauważyć, że legenda po prawej stronie nie ma obramowania, które jest niepotrzebne.
Dla każdej osi zdecyduj, czy znacznik kategorii jest potrzebny i w jakiej liczbie
Znacznik osi jest potrzebny tylko na skali ilościowej, zaś na skali kategorii nie służy niczemu. Nawet na skali ilościowej niezbędne są tylko główne znaczniki, z niewielkimi wyjątkami. Najlepiej sprawdza się liczba od 5 do 10 znaczników. Zbyt wiele rozdrabnia zbytnio wykres, a zbyt mało nie zapewnia odpowiedniego poziomu szczegółowości dla interpretacji wartości.
Określ najlepszą pozycję skali liczbowej
Kiedy skala ilościowa dotyczy osi Y, może zostać umieszczona po stronie lewej, prawej lub po obu jednocześnie. Zwykle wystarcza umieszczenie jej w jednym miejscu, ale jeżeli wykres jest tak duży, że niektóre wartości umieszczone są z dala od skali i trudno jest określić adekwatnie ich wartość, umieszczenie skali po obu stronach rozwiąże problem.
Jeżeli wystarczy, aby skala była tylko w jednym miejscu, najlepszym wyborem będzie umieszczenie jej tam, gdzie chcemy podkreślić wartości lub ułatwić ich czytanie. Należy jednak unikać lokalizowania skali po prawej stronie i zarezerwować tę ewentualność tylko dla wyjątkowych przypadków, ponieważ skala tak rzadko umieszczana jest po prawej stronie, że może to wprowadzać dezorientację.
Jeśli skala ilościowa waha się między wartościami pozytywnymi i negatywnymi, linia osi powinna być zlokalizowana w zerze, ale etykiety powinny być umieszczone w innym miejscu, aby nie nakładały się na dane. Przykładowo, kiedy skala ilościowa znajduje się na osi X, zwykle najlepiej jest umieścić etykiety tekstowe zaraz pod obszarem kreślenia.
Ustal, czy linie siatki są potrzebne
Linie siatki są najczęściej pozostałością starych czasów, kiedy wykresy musiały być rysowane ręcznie na kartkach w kratkę. Dziś, w czasach wykresów generowanych komputerowo, linie wykresu są użyteczne tylko w jednym z dwóch przypadków:
– wartości nie mogą być interpretowane z niezbędnym stopniem dokładności,
– podzbiór punktów na rozbudowanym wykresie punktowym musi zostać porównany.
Należy pamiętać, że celem wykresu nie jest komunikowanie danych z wysoką dokładnością, co jest zadaniem tabeli. Wykresy przedstawiają wzorce i związki. Jeśli minimalnie większa dokładność, która może zostać łatwo dostrzeżona, jest niezbędna, można włączyć linie siatki do wykresu, odróżniając je wizualnie, tak aby były widoczne tylko na tyle, na ile jest to niezbędne.
Kiedy stosujemy wykresy punktowe i chcemy umożliwić porównanie tego samego podzbioru danych na dwóch lub więcej wykresach, subtelna macierz pionowych i poziomych linii siatki zgrabnie podzieli wykres na obszary, które ułatwią oddzielenie poszczególnych zakresów wartości.
Określ, jaki opis jest potrzebny
Pomimo że komunikat główny jest przekazywany za pomocą wykresu, tekst jest zawsze wymagany w jakimś stopniu, aby wyjaśnić znaczenie obrazu. Najczęściej potrzebne są:
– opisowy tytuł wykresu,
– tytuł osi (chyba że rodzaj skali i jednostka jej mierzenia są już znane).
Liczby w postaci tekstu wzdłuż skali ilościowej są zawsze potrzebne, legenda często także, co zostało już szerzej omówione. Poza tym celowe jest umieszczenie jednej lub kilku notatek, aby opisać co dzieje się na wykresie, na co zwrócić szczególną uwagę oraz jak wykres czytać, jeśli informacje te nie są oczywiste.
Określ, czy któraś z danych powinna być wyróżniona, a jeśli tak, to jak
Ostatnim etapem w procesie projektowania wykresu jest wyróżnienie szczególnego punktu danych, jeżeli jest ważniejszy niż inne. Być może chcemy pokazać porównanie udziału w rynku głównych konkurentów i wyróżnić na nim naszą firmę. Może chcemy wyróżnić maj na wykresie miesięcznych zysków, gdyż wtedy wydarzyło się coś szczególnego. Niezależnie od powodu, istnieje wiele różnych sposobów wyróżnienie punktu danych.
Jedną z najlepszych i najprostszych metod jest przedstawienie tego elementu w jasnym lub ciemnym kolorze, który będzie się wyróżniał, jeśli dla pozostałych danych zastosowany został kolor miękki. Inne sposoby:
– dla kolumn – umieść obramowanie tylko dla wyróżnionej kolumny (tak jak na poniższym rysunku),
– dla linii – pogrub wyróżnioną linię,
– dla punktów – powiększ punkt lub zastosuj tylko dla danego punktu wypełnienie.