Profesor Edward Tufte, znany ze zgłębiania tajemnic wizualizacji danych (lub nieskrytych faktów, na które zwykły człowiek nie zwraca uwagi), w swoich publikacjach stworzył między innymi pojęcia „chartjunk” oraz „lie-factor”. Jest on zwolennikiem jasnego przekazu, tłumaczy jak przedstawić maksimum informacji w minimalistycznej, przejrzystej formie, czego dobrym przykładem jest wspomniany wcześniej współczynnik dane/atrament, stosowanie sparklines, czyli miniwykresów, czy wykresu panelowego.
Co to jest chartjunk?
Wykres śmieciowy to taki, w którym informacja ginie wśród nadmiaru rozpraszających elementów, bądź po prostu ładnie wygląda, a nie przekazuje nic istotnego. Głównym celem tworzenia wykresu jest dotarcie z czytelnym komunikatem do odbiorcy. Dlatego żadne niepotrzebne elementy nie powinny zaburzać obrazu, a co za tym idzie także przekazu. Przy tworzeniu raportu warto jest spojrzeć obiektywnie i określić, czy raport jest skuteczny. Dla przykładu zwróćmy uwagę na ostatnią z dziewięciu zasad skutecznego użycia koloru, dotyczącą stosowania efektów wizualnych. Zdecydowanie niepotrzebne jest tutaj nachylenie wykresu, czy cieniowane wypełnienie słupków. Typowy chartjunk, chcąc „upiększyć” wykres, niepotrzebnie zaburza przekaz informacji.
Przykłady chartjunk
Lie-factor
W książce pt. “The Visual Display of Quantitative Information” prof. Tufte zdefiniował współczynnik kłamstwa jako stosunek efektu widocznego na grafice do efektu wykazywanego przez dane, na podstawie których zbudowana została grafika. Powyższa grafika pochodzi z The New York Times. Zwróćmy uwagę na proporcje. Wzrost wartości z 18 do 27,5 to wzrost o około 53%. Natomiast z grafiki wynika co innego – przedstawia ona wzrost długości odcinka o około 783%. Współczynnik kłamstwa wynosi zatem 14,8, co jest przerażająco wysokim wynikiem. Pewnego rodzaju zakłamanie występuje także przy wykorzystaniu wykresów „trójwymiarowych”.
Z dwóch niebieskich linii jedna wydaje się znacznie dłuższa, pomimo przedstawiania niższej wartości. Rzeczywiście, Dłuższa z dwóch niebieskich linii ma około 7,73cm, pomimo przedstawiania niższej wartości, natomiast krótsza 3,93cm. Zastosowanie tego rodzaju wykresu bez pomocy etykiet danych wprowadziłoby odbiorcę w błąd.
Jak tworzyć wykresy, aby nie stały się chartjunkiem i nie miały lie-factor?
Wizualizacja danych, choć wydaje się intuicyjna, wymaga znajomości kilku podstawowych zasad. Jeżeli chcesz uniknąć podstawowych błędów i tworzyć wykresy i raporty zgodne z zasadami percpecji, zapoznaj się z pierwszymi artykułami na blogu: 7 zasad wizualizacji danych, zasady użycia koloru, współczynnik dane/atrament, wykresy, których należy unikać. Zasady te poznasz także na jedynym w Polsce szkoleniu poświęconym wizualizacji danych: „Skuteczna komunikacja liczb”.