Rozdział 2 Typologia bankowych modeli scoringowych

Modele scoringowe stosowane w bankach mogą różnić się między sobą na przykład:

  1. zmienną celu,

  2. momentem lub etapem, w którym obliczana jest ocena punktowa,

  3. typami zastosowanych predyktorów i wykorzystanych źródeł danych,

  4. metodą wykorzystaną do stworzenia modelu scoringowego,

  5. obiektem oceny,

  6. dostawcą modelu.

2.1 Typologia ze względu na zmienną celu

Zmienna celu to najczęściej zmienna dychotomiczna (zero-jedynkowa) określająca, czy zdarzenie, które nas interesuje nastąpiło czy nie.

Zmienna celu (ang. target) może być nazywana również zmienną odpowiedzi (response), zmienną objaśnianą (explained variable), zmienną wyjściową (output), wynikową (outcome) czy etykietą (label).

  • Credit scoring, scoring kredytowy to model scoringowy, w przypadku którego zmienną celu jest to czy klient spłaci czy nie spłaci kredytu (mówi się wtedy o dobrych/złych klientach lub obserwacjach, ang. good/bad, albo o zaniechaniu spłaty, ang. default). Zmienną celu w modelach scoringowych może być tzw. wczesna szkodowość (ang. early delinquency), czyli brak spłaty jednej z kilku pierwszych rat nowego zobowiązania lub szkodowość dojrzała (mature delinquency). Brak spłaty może dotyczyć konkretnego produktu (np. kredytu hipotecznego) lub generalnie klienta (brak spłaty dowolnego posiadanego zobowiązania bankowego).

  • W przypadku scoringu antywyłudzeniowego (ang. fraud scoring) zmienną celu jest nadużycie, np. oszukańcza transakcja kartowa albo wyłudzenie, względnie próba wyłudzenia, kredytu.

  • Scoring oceniający ryzyko nadmiernego zadłużenia, ang. over-indebtedness scoring może być narzędziem wspomagającym, uzupełniającym scoring kredytowy. Nadmierne zadłużenie klienta może się wiązać z wpadnięciem w spiralę zadłużenia i w dłuższej perspektywie skutkować zaprzestaniem spłat kredytów. Zmienną celu w przypadku takiego scoringu może być stopień zadłużenia przekraczający jakiś limit (np. 80% dochodu).

  • W marketingu bankowym, a dokładniej w zarządzaniu relacjami z klientami (ang. CRM) stosuje się modele attrition scoring. Termin attrition, inaczej churn, to angielskie określenie odpływu klientów. Odpływ (odejście) klienta może przejawiać się na przykład wcześniejszą spłatą kredytu (ang. prepayment) albo rezygnacją z karty kredytowej. Zmienną celu w takich modelach jest odejście lub pozostanie klienta, względnie rezygnacja lub kontynuacja korzystania z konkretnego produktu.

  • Oferowanie produktów może być wspomagane przez response scoring – modele przewidujące, czy klient skorzysta z kredytu lub innego produktu bankowego albo czy na przykład byłby skłonny do podwyższenia limitu na karcie kredytowej, gdyby otrzymał taką ofertę.

  • W modelu przewidującym odzyski, recovery scoring, zmienną celą jest „odzysk”, czyli spłata kredytu przez osobę, która zaprzestała spłat (i w konsekwencji tego faktu była objęta windykacją).

  • W modelu promise scoring zmienną celu jest spłacenie zaległego zadłużenia po złożeniu obietnicy w procesie monitoringu spłat / windykacji.

  • W modelu contactability scoring zmienną celu jest dodzwonienie się do klienta przy próbie kontaktu. Taki model może być stosowany np. w windykacji telefonicznej lub telemarketingu.

2.2 Typologia ze względu na moment zastosowania

  • Scoring aplikacyjny – to model służący do oceny potencjalnego wniosku / klienta na etapie ubiegania się o produkt bankowy, na przykład kredyt

  • Scoring związany z zarządzaniem rachunkiem (ang. account management) – model umożliwiający monitorowanie istniejących klientów lub ocenę ich pod kątem nowych produktów.

  • Scoring windykacyjny – model stosowany wobec klientów, którzy zaprzestali spłat zobowiązań lub opóźniają się z nimi.

  • Scoring transakcyjny – model uruchamiany w trakcie konkretnej transakcji (np. kartowej).

2.3 Typologia ze względu na zastosowane dane

Zmienne objaśniające w modelu scoringowym – nazywane również zmiennymi niezależnymi (ang. independent variables), zmiennymi wejściowymi (inputs) czy predyktorami (predictors) – mogą pochodzić z różnych źródeł. Ze względu na źródło danych możemy wyróżnić:

  • scoring zbudowany na danych podanych przez klienta przy okazji wniosku kredytowego (na danych aplikacyjnych),

  • scoring zbudowany na danych behawioralnych, czyli zgromadzonych przez bank danych o relacji z klientem, np. historii spłaty kredytów, danych transakcyjnych, wykorzystaniu produktów bankowych,

  • scoring zbudowany na podstawie danych pochodzących z biur kredytowych (takich jak BIK) lub innych zewnętrznych baz danych,

  • scoring zbudowany na podstawie danych o kliencie dostępnych w internecie, w mediach społecznościowych itp.,

  • scoring zbudowany na aktywności w aplikacji mobilnej, bankowości internetowej, danych geolokalizacyjnych,

  • scoring zbudowany na podstawie danych psychometrycznych.

W praktyce oczywiście dość często modele scoringowe łączą dane z różnych źródeł.

2.4 Typologia ze względu na zastosowane narzędzie

Modele scoringowe można budować na różne sposoby. Wyróżniamy:

  • karty scoringowe (modele mające postać wynikową w formie tabeli scoringowej) zbudowane z wykorzystaniem

    • regresji logistycznej opartej na WoE (weight of evidence),

    • regresji logistycznej opartej na zmiennych sztucznych (dummy variables),

    • naiwnego klasyfikatora bayesowskiego,

    • innych, również dedykowanych metod;

  • modele wykorzystujące drzewa decyzyjne (klasyfikacyjne),

  • modele wykorzystujące sieci neuronowe,

  • modele zbudowane na bazie innych narzędzi.

Oprócz modeli statystycznych, zbudowanych na podstawie danych historycznych z wykorzystaniem algorytmów uczenia maszynowego i metod statystycznych, można wyróżnić równiez modele eksperckie. Modele eksperckie bazują na doświadczeniu, intuicji i znajomości rynku przez analityków, a nie na danych historycznych. Możliwe jest również połączenie modeli eksperckich i statystycznych.

2.5 Typologia ze względu na obiekt oceny punktowej

Model scoringowy może oceniać pojedynczą transakcję albo pojedynczy wniosek o produkt (np. o konkretny kredyt), może również oceniać w całościowy profil klienta. Gdy istnieje wystarczająca ilość danych, nie ma przeszkód, żeby ocena punktowa była również tworzona i wyliczana dla innych podmiotów, np. sprzedawców, pracodawców klientów, placówek bankowych czy pośredników kredytowych.

2.6 Typologia ze względu na dostawcę

Scoring jest najczęściej budowany wewnątrz banku (przez jego pracowników lub podwykonawców), jednak może być również budowany, obliczany i dostarczany bankom przez podmioty zewnętrzne, przede wszystkim biura kredytowe (takie jak polski BIK), ale także inne przedsiębiorstwa (np. dostawców modeli opartych na danych internetowych lub psychometrycznych).

2.7 Generyczne, ogólne i dedykowane modele scoringowe

Modele scoringowe zbudowane przez podmioty zewnętrzne na podstawie danych pochodzących z wielu instytucji nazywane są generycznymi modelami scoringowymi (ang. generic scoring). Ponieważ często dostawcami takich modeli są biura kredytowe, po angielsku mówi się także bureau scoring (scoring biurowy)2. W przeciwieństwie do modeli dostosowanych do konkretnego pożyczkodawcy, scoring generyczny jest pomyślany tak, aby był szeroko stosowany przez różnych pożyczkodawców i dla różnych produktów. Nie jest dostosowany do konkretnego segmentu klientów.

Modele dostosowane do konkretnej instytucji (a często i konkretnego produktu) można nazwać modelami „szytymi na miarę (ang. custom scoring). .

Podobnym podziałem jest podział na modele ogólne i modele dedykowane. Model ogólny dotyczy większej liczby produktów (np. wszystkich kredytów dla osób prywatnych), model dedykowany może być dostosowany do konkretnego typu produktu. Jest to, jak zaznaczono, podział podobny, ale nie tożsamy: model generyczny może być modelem dedykowanym (np. generyczny model scoringowy budowany przez biuro kredytowe dla kredytów hipotecznych).

2.8 Nazewnictwo w dalszej części skryptu

Uwaga! W kolejnych rozdziałach w wielu przypadkach stosowane będzie nazewnictwo typowe dla modeli scoringu kredytowego. W scoringu kredytowym obserwacje (klienci, kredyty) są nazywane złymi lub dobrymi w zależności od statusu spłaty kredytu. Co za tym idzie, mówi się na przykład o prawdopodobieństwie złego czy logarytmie szansy złego, itp. Jednak w większości przypadków można tak opisane przykłady „przetłumaczyć” na inne zastosowania.

Mimo różnic w etykietach, metody matematyczne i statystyczne pozostają takie same. Na przykład:

  • Model regresji logistycznej lub naiwny klasyfikator bayesowski prognozuje prawdopodobieństwo zajścia zdarzenia oznaczonego jako 1 (niekoniecznie „prawdopodobieństwo złego”).

  • Przekształcenia takie jak szanse (odds) i logarytm szans (log-odds) są niezależne od semantyki etykiet i działają identycznie.

2.9 Zadania

Zadanie 2.1 Na stronie internetowej polskiego Biura Informacji Kredytowej sprawdź, jakie typy modeli są oferowane bankom i innym przedsiębiorstwom przez BIK.


  1. Należy zaznaczyć, że określenie model generyczny stosowane jest czasem w odniesieniu do modelu, który został zbudowany wewnątrz banku lub firmy pożyczkowej na danych pochodzących z jednego produktu kredytowego (np. kredytów ratalnych) i jest stosowany w odniesieniu do innego produktu (np. kredytów gotówkowych). ↩︎