Cztery typy obiektów nadają się najlepiej w celu przedstawienia wartości ilościowych na wykresie: punkty, linie, kolumny, pudełka. Z nich powstają 4 skuteczne wykresy, które powinniśmy stosować najczęściej – punktowy, liniowy, kolumnowy i pudełkowy.
Punkty
Punkty są najmniejszymi obiektami wykorzystywanymi do obrazowania wartości na wykresie. Mogą przyjąć postać kropek, kwadratów, trójkątów, iksów, myślników i innych prostych elementów. Punkty mają dwie zalety: mogą przedstawiać wartości ilościowe na dwóch skalach ilościowych jednocześnie, tak jak na wykresie punktowym, oraz mogą być wykorzystywane zamiast kolumn, kiedy skala ilościowa nie zaczyna się od zera. W przeciwieństwie do linii, punkty podkreślają wartości indywidualne, a nie kształt, który wartości te tworzą rosnąc lub malejąc.
Linie
Linie łączą indywidualne wartości w serie, podkreślając kształt danych zmieniający się od jednej wartości do drugiej. Są dzięki temu idealne do przedstawiania zmiany danych w czasie. Trendy, wzorce i wyjątki odstają wyraźnie na wykresie.
Linie powinno się stosować tylko w celu prezentacji danych na skali interwałowej. Na skali nominalnej i porządkowej poszczególne elementy nie są ze sobą na tyle powiązane, aby łączyć je linią, zamiast tego powinno się użyć kolumn lub punktów. Linie sugerują zmianę między jednym elementem a drugim, ale zmiana ta nie ma miejsca, gdy elementy nie są ze sobą ściśle powiązane jako kolejne jednostki ciągłego zakresu wartości. Przykładowo, właściwym jest użycie linii w celu prezentacji zmiany z dnia na dzień lub z jednego zakresu na drugi, ale nie z jednego regionu sprzedaży na drugi, jak ilustrują poniższe wykresy.
Stosując skalę interwałową nie jesteśmy zmuszeni do korzystania w każdym przypadku z linii; można także użyć kolumn i punktów. Jeśli jednak chcemy podkreślić indywidualne elementy, takie jak każdy miesiąc, lub wspomóc porównania między wieloma wartościami w tym samym miejscu skali interwałowej, jak np. zyski lub wydatki dla poszczególnych miesięcy, wtedy kolumny lub punkty działają najlepiej.
Kolumny
Kolumny przestawiają dane w sposób, który podkreśla pojedyncze wartości. Właściwość ta wynika z faktu, że kolumny ilustrują wartości ilościowe na dwa sposoby: poprzez pozycję 2D punktu końcowego kolumny w odniesieniu do skali oraz poprzez długość kolumny.
Te dwie właściwości odnoszą się bezpośrednio do wizualnych atrybutów, które mogą być stosowane w celu prezentacji danych na wykresach. Kiedy chcemy skupić czyjąś uwagę na indywidualnych wartościach lub wesprzeć porównanie między sobą pojedynczych wartości, kolumny są idealnym wyborem. Nie są one jednak tak dobre w ujawnianiu ogólnego kształtu danych. Kolumny mogą być ustawione pionowo lub poziomo.
Zawsze gdy używa się kolumn, skala ilościowa musi zawierać zero. Wynika to z faktu, że długość kolumny reprezentuje jej wartość, ale nie jest w stanie tego zrobić dokładnie, gdy wartości nie zaczynają się w zerze. Jeśli zawęzimy skalę ilościową i zastosujemy kolumny, jak na poniższym wykresie, rzeczywista sprzedaż w regionie północnym wydaje się być dużo niższa od planowanej, w rzeczywistości zaś wynosi 66%.
Chcąc zatem zawęzić skalę ilościową, aby uwypuklić różnice między wartościami, należy przestawić się z kolumn na punkty, ponieważ ilustrują one dane tylko jako pozycję 2D w odniesieniu do skali ilościowej, co eliminuje potrzebę zaczynania skali od zera.
Pudełka
Pudełka (ang. boxes) są w dużej mierze podobne do kolumn, z tym jednak wyjątkiem, że oba punkty końcowe prezentują wartości. Kiedy kolumny są stosowanie w ten sposób, są czasem zwane kolumnami zakresu. Używa się ich, aby przedstawić zakres danych, zwykle od najwyższych wartości do najniższych, a nie pojedynczych wartości. w 1970 r. John Tukey wymyślił metodę wykorzystywania prostokątów (kolumn z wypełnieniem lub bez) w kombinacji z indywidualnymi punktami danych i cienkimi kolumnami w celu prezentacji kilku faktów na temat dystrybucji wartości, w tym mediany (wartości środkowej). Nazwał swoje odkrycie wykresem pudełkowym. Wersja Tukeya została zaprojektowana na potrzeby statystyków i wymagała niewiele czasu, aby nauczyć się ją stosować, ale każdy może szybko nauczyć się łatwiejszej wersji jak na rysunku poniżej.
„Jeśli zawęzimy skalę ilościową i zastosujemy kolumny, jak na poniższym wykresie, rzeczywista sprzedaż w regionie północnym wydaje się być o połowę niższa od planowanej, w rzeczywistości zaś wynosi 90%”.
Ja tego tak nie widzę. Na skali bez zera ja widzę raczej relacje 20% niż 50% (połowa).
Hej Damian, dzięki za wychwycenie nieścisłości. Patrzyłem chyba na inny wykres. Poprawiłem już treść artykułu.