Jak sprawdzić w Power Query, czy ostatni plik w folderze ma te same kolumny co pierwszy?

Ostatni webinar nt. pobierania plików z folderu z Power Query dla Excela i Power BI rozpoczął ciekawą dyskusję. Jeden z uczestników zadał pytanie: Skąd możemy mieć pewność, że kolumny w nowym pliku są identyczne jak w pierwszym? Oto odpowiedź.

Przypomnienie: Pobieranie danych z folderu poprzez Power Query

Zbudowanie zapytania do folderu wygląda tak:

  • Utworzyć folder na dysku lokalnym, dysku sieciowym lub online
  • Zbudować zapytanie do folderu i połączyć wszystkie dane (odpowiednik ręcznej operacji Dołączanie)
  • Dodawać kolejne pliki do folderu i aktualizować dane poprzez kliknięcie Odśwież

Oto przykład działającego zapytania:

Co się stanie, jeśli nie wychwycimy błędów?

Standardowy proces pobierania danych bazuje na przykładowym pliku. Jeśli w nowym pliku dojdzie nowa kolumna lub stara ulegnie zmianie, raport będzie niekompletny.

W naszym scenariuszu:

  • zmianie ulega kolumna Numer zamówienia na Numer faktury
  • dochodzi nam nowa kolumna Marża.

Po dodaniu nowego pliku do folderu i odświeżeniu zapytania, otrzymamy puste numery zamówienia i zgubimy nową kolumnę.

Pamiętaj: Power Query to też narzędzie do sprawdzania jakości danych

Power Query jest nie tylko programem do przygotowania procesu pobierania i transformacji danych, ale też świetnym miejscem na wychwycenie błędów. Błędy można zbierać w dodatkowych arkuszach lub raportach błędów i weryfikować prze udostępnieniem raportu.

Sprawdzanie błędów może odbywać się na wiele różnych sposobów, ale zwykle jako dodatkowe zapytania zatytułowane: Błędy. Dodatkowe zapytania tworzymy poprzez Scalanie, Duplikuj lub Odwołanie.

Krok 1: Zbuduj zapytanie z listą kolumn dla pierwszego pliku

Tworzymy odwołanie do zapytania Przekształć przykładowy plik.

Teraz czas na opuszczenie nagłówków do pierwszego wiersza.

Na koniec zostawiamy tylko 1 wiersz i transponujemy.

Krok 2: Zbuduj zapytanie z listą kolumn ostatniego pliku

Zapytanie rozpocznij od zduplikowania zapytania głównego.

Następnie usuń z niego niepotrzebne kroki, zostawiając tylko dwa pierwsze (1) > Posortuj pliki (2) tak, aby ostatni plik był na końcu (tu przydaje się odpowiednie nazewnictwo plików) > Zachowaj ostatni 1 wiersz (3).

Dodaj kolumnę niestandardową z poleceniem Excel.Workbook (1), a w kolejnym kroku wejdź do środka arkusza, klikając Table (2) x 2.

Następnie zachowaj 1 wiersz.

Na koniec Transponuj.

Krok 3: Scal zapytania jako Pełne zewnętrzne

Zapytania scalamy, wybierając jako rodzaj sprzężenia Pełne zewnętrzne.

Dzięki temu po rozpakowaniu dostaniemy wszystkie kolumny z obu plików.

Pamiętajmy, że kolejność kolumny przy pobieraniu plików z folderu nie ma znaczenia – liczy się nazwa kolumny.

Na koniec możemy dodać np. kolumnę warunkową.

Krok 4: Przygotuj raport w Excelu lub w Power BI

Do Excela (lub modelu danych Power BI) ładujemy tylko ostatnie zapytanie sprawdzające, a następnie tworzymy dowolny raport. Może być on pełną listą kolumn lub tylko raportem błędów.

Krok 5: Testujemy błędny plik

Co się wydarzy, gdy dodamy do folderu plik o innych kolumnach? Dodając dodatkowo Indeks kolumny możemy szybko zobaczyć, które kolumny się zmieniły.

Pobierz plik z zapytaniem i zerknij do środka Power Query

Tu możesz pobrać plik Excel z gotowym raportem.

Udostępnij ten wpis:

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *