Dane z Facebooka jako podstawa oceny zdolności kredytowej? Jak sztuczna inteligencja i nowe dane mogą pomóc nieubankowionym

Tradycyjny scoring kredytowy (pożyczkowy) opiera się na danych ustrukturyzowanych (dochody versus zobowiązania) i często uproszczonej projekcji płynności w danym okresie kredytowania. Dane te pochodzą nie tylko od innych instytucji kredytowych, ale takich podmiotów jak Biuro Informacji Kredytowej, ale rzadko z innych źródeł. Co jednak w przypadku, kiedy tego typu informacje są bardzo skąpe, bo dotyczą przykładowo osób młodych (ale perspektywicznych) czy znajdujących się chwilowo w trudnej sytuacji finansowej? Można oczywiście odmówić im kredytu lub pożyczki i skłonić do szukania alternatywnych źródeł finansowania lub pójść w innym kierunku – wykorzystania bardziej „wyszukanych” danych, jak położenie geograficzne czy informacje z mediów społecznościowych. I o tym chciałbym dzisiaj „porozmawiać”, czyli jak „inne” dane połączone z uczeniem maszynowym (sztuczną inteligencją) mogą pomóc instytucjom kredytowym i przyczynić się do financial inclusion.

Ocena zdolności kredytowej, o której pisałem m.in. tutaj, to jedno z kluczowych zagadnień dla sektora finansowego (bankowego, pożyczkowego), ale i szerzej – rozwoju gospodarczego. Według różnych danych więcej niż 1/3 społeczeństwa (globalnie) nadal nie ma (lub utrudniony) dostęp do finansowania. W Polsce te dane są nieco bardziej optymistyczne, ale bez wątpienia problem tzw. financial exclusion, czyli finansowego wyłączenia, to zagadnienie, na którym trzeba się pochylić.

Zautomatyzowany i bardziej „zaawansowany” systemu oceny zdolności już dzisiaj wykazuje większą skuteczność niż tradycyjne metody (warto spojrzeć na ten raport Banku Rozliczeń Międzynarodowych). W dzisiejszym artykule nie będę zbytnio skupiał się na aspektach prawno-regulacyjnych, które poruszę przy innej okazji.

Dane, dane i jeszcze raz dane

W jednym z raportów na temat Big Data oraz analityki finansowej opracowanym przez Europejski Urząd Nadzoru Bankowego (klik) poruszone zostało zagadnienie dostępu do danych jako wiarygodnego punktu odniesienia do predykcji różnych aspektów związanych z działalnością sektora bankowego.

Wykorzystanie uczenia maszynowego do automatyzacji procesu decyzyjnego przy udzielaniu kredytów czy pożyczek wymaga dość znacznego zbioru danych i to zarówno po stronie wnioskodawcy, jak i samej instytucji (np. zanonimizowane dane), aby model mógł w sposób w miarę dokładny określić do jakiej kategorii kredytobiorców zaliczyć taką osobę i jakie ryzyko może generować przyznanie kredytu. Tutaj jednak uwaga na kwestię zakazu dyskryminacji, o której pisałem w tym artykule.

Dla oceny zdolności kredytowej można przykładowo, korzystając dajmy na to z możliwości jakie daje usługa dostępu do informacji o rachunku (więcej tutaj), wykorzystać dane dot. rachunków za elektryczność czy inne media, aby ocenić rzetelność potencjalnego kredytobiorcy.

Żeby jednak mówić o „dobrym” wykorzystaniu machine learningu dla oceny zdolności kredytowej nie zawsze wystarczą nam dane ustrukturyzowane (skategoryzowane) dostępne w łatwej do przetworzenia dla algorytmu postaci.

I tutaj pojawia się smartfon… media społecznościowe i nocne kluby

Pisząc o przyszłości płatności nawiązywałem już do smartfonów jako centrów danych o nas samych. W istocie jest to skarbnica wiedzy o tym gdzie bywamy, co robimy i z kim się spotykamy. To także coraz częściej nasze centrum finansowe, gdzie aplikacje transakcyjne gromadzą (lub nie) informacje o naszych zwyczajach zakupowych czy niestandardowych zachowaniach.

Część z tych danych można łatwo skatalogować i przypisać im określone etykiety, co ułatwia wykorzystanie ich przez algorytm. Mowa tutaj przede wszystkim o wspomnianych już przeze mnie danych odnośnie tego jak często, na jaką kwotę i w jakich miejscach robimy zakupy. Jeżeli przykładowo w stosunkowo równych odstępach czasu robimy zakupy na „regularne” kwoty, to pewnie jesteśmy osobą, która w miarę dobrze zarządza swoim budżetem i dajemy większą rękojmię spłaty. Te dane można pobierać wprost z systemów transakcyjnych (np. poprzez usługę AIS lub za zgodą użytkownika w samym procesie „własnym” kredytowym).

Innym przykładem może być nasze położenie geograficzne. Z tą koncepcją spotkałem się czytając AI Book, gdzie jeden z autorów podał sensowny przykład na to jak smartfon z GPS może wspomóc proces oceny zdolności kredytowej. Zakładając, że dana osoba regularnie wychodzi z domu ok. godz. 8 i wraca ok. godz. 18 można założyć, że ma stałą pracę i regularne dochody, nawet jeżeli nie posiada wpływów z tego tytułu na konto bankowe. W Polsce to raczej rzadkość, ale w mniej ubankowionych społeczeństwach to nadal pewien problem. A jeżeli student często przebywa w bibliotece, zamiast w klubie nocnym, to może jest bardziej „reliable”? Jest to jakaś informacja odnośnie „stabilności” potencjalnego kredytobiorcy, prawda?

I wreszcie trzecie źródło danych, czyli media społecznościowe. Na pierwszy rzut oka wydaje się, że nie jest to specjalnie wiarygodne i sensowne źródło informacji dla banków. W praktyce jednak na podstawie takich informacji możemy wiele dowiedzieć się o wnioskodawcy. Stworzenie pewnych modeli osobowości i przypisanie ich do konkretnych zachowań „eksponowanych” np. na Facebook’u, może zwiększyć skuteczność oceny zdolności kredytowej, nawet jeżeli nie dysponujemy „twardymi” danymi finansowymi, np. w przypadku studentów.

Modele

Komisja Europejska pracuje już nad rozwiązaniami prawnymi, które mają uwolnić dane. Będziemy mieli więc więcej lepszych danych, co pozwoli na tworzenie bardziej efektywnych modeli, które będą lepiej wytrenowane, co pozwoli na zwiększenie ich skuteczności przy znacznie krótszym czasie oczekiwania.

To jest jednak zarazem największe wyzwanie dla tworzących takie rozwiązania. Powyższe dane to dane nieustrukturyzowane, często w formie języka naturalnego, które wymagają uczenia algorytmów w inny sposób niż w przypadku danych uporządkowanych i „podpisanych” z których łatwo wywieść określone zależności. Mamy też przecież zdjęcia w mediach społecznościowych, które można wykorzystać do lepszego „poznania” człowieka. Nie jest więc zadanie łatwe. Zawsze istnieje też ryzyko, że pojawią się „fejkowe” profile skrojone na oszustwa (fraudy).

Do tego dochodzą inne wyzwania

Jestem przekonany, że takie podejście do oceny zdolności kredytowej nie przekona znacznej części czytelników. Trudno bowiem wyobrazić sobie, że ludzie ochoczo będą udostępniać swoje prywatne informacje z mediów społecznościowych czy dane odnośnie wydatków „na piwo”. I większości przypadków tak pewnie będzie.

Społeczeństwo się jednak zmienia i coraz chętniej dzielimy się „nami” z innymi, często obcymi osobami. Dla wielu grup społecznych, które nie mogą sobie pozwolić na „tradycyjny” kredyt czy pożyczkę, może to być jedyna szansa. A może zastosować to także do początkujących przedsiębiorców niemających jeszcze „wyrobionej” zdolności kredytowej?

To jedna z alternatyw. Wymaga ona jednak istotnych zmian w przepisach odnośnie ochrony danych osobowych (i nieosobowych), w zakresie cyberbezpieczeństwa czy regulacji sektorowych, jak np. prawo bankowe. Jest to też kwestia edukacji i szerzenia „kaganka oświaty” jak nasza aktywność w internecie może wpływać na naszą przyszłość finansową. Może to odległa przyszłość, ale kto wie… Kiedyś marzyliśmy o autonomicznych samochodach, a dzisiaj mamy Teslę. Może podobnie będzie z bankowością?

Flash News

Europejski Urząd Nadzoru Bankowego o platformach w sektorze finansowym. Idzie nowe, a chyba nie wszyscy są gotowi

Etyka i uprzedzenie, czyli algorytmy korporacji przewozowych w praktyce

Zmiany do Rozporządzenia 2015/847 w sprawie transferu środków są znaczące. Szczególnie dla fanów kryptoaktywów

Open Banking “pod” PSD2 nadal sprawia trudności. EBA publikuje kolejne wyjaśnienia

Projekt ustawy o zmianie niektórych ustaw w związku z zapewnieniem rozwoju rynku finansowego oraz ochrony inwestorów na tym rynku

Wytyczne BaFin w sprawie sztucznej inteligencji dla sektora finansowego. Dobry przykład, dobre praktyki

Z kim pójdziesz na randkę? Czy algorytm zadecyduje za Ciebie?

To instytucje finansowe i dostawcy RegTech muszą “popracować nad sobą”, czyli raport EBA w sprawie rozwiązań RegTech. Są i rekomendacje

Emitent kryptoaktywów jest administratorem danych. Europejski Inspektor Ochrony Danych o projekcie w sprawie kryptoaktów (MICA)

EBA bierze się za obniżenie kosztów nadzorczych. Duży nacisk na technologię RegTech oraz SupTech

Dane z Facebooka jako podstawa oceny zdolności kredytowej? Jak sztuczna inteligencja i nowe dane mogą pomóc nieubankowionym

Dane, dane i jeszcze raz dane

I tutaj pojawia się smartfon… media społecznościowe i nocne kluby

Modele

Do tego dochodzą inne wyzwania

Dodaj komentarz Anuluj pisanie odpowiedzi