[aleBank.pl] Raport Specjalny ANALYTICS w Biznesie Bankowym: Pęd do wiedzy

Pęd do wiedzy - aleBank.pl

Serdecznie zapraszam do zapoznania się z "Raportem Specjalnym ANALYTICS w Biznesie Bankowym: Pęd do wiedzy" przygotowanym przez Miesięcznik Finansowy Bank, gdzie miałem przyjemność podzielenia się kilkoma spostrzeżeniami z zakresu Business Intelligence.

"Człowiek i maszyna

[...] Business Intelligence to znacznie więcej niż możliwość raportowania wyników/faktów z przeszłości, dziś to przede wszystkim przewidywanie, prognozowanie i wspieranie działań przyszłych. W czasach gdy sukces biznesowy jest coraz bardziej zależny od szybkości i elastyczności w dostosowywaniu się do zmian, istotnym aspektem jest trafne identyfikowanie i wykorzystywanie/mitygowanie pojawiających się szans i ryzyk. Jest to szczególnie prawdziwe w odniesieniu do bankowości, gdzie procesy decyzyjne niemal w całości opierają się na pogłębionej analizie danych. Business Intelligence to zaawansowane narzędzia i technologie, ale również utalentowani ludzie z wielką pasją – taka kombinacja to klucz, to gwarant, że wydobycie praktycznych informacji z dużych wolumenów danych wewnętrznych i zewnętrznych, nieustannie wzrastających, stanie się osiągalne. Możliwości są nawet większe, obecnie wielką szansą staje się ekstrakcja wiedzy w czasie rzeczywistym, przy jednoczesnym wsparciu ogromnej liczby różnych formatów danych. Obecne rozwiązania technologiczne sprawiają, że jest to wykonalne i akceptowalne kosztowo. [...]"

Mariusz Gromada

 

Raport Specjalny ANALYTICS w Biznesie Bankowym: Pęd do wiedzy

Raport Specjalny ANALYTICS w Biznesie Bankowym: Pęd do wiedzy

Pozdrowienia,

Mariusz Gromada

 

 

 

Strategie doboru punktów odcięcia - czyli ocena jakości klasyfikacji (część 5)

Cut-off point

W części 4 cyklu "Ocena jakości klasyfikacji" przedstawiłem podstawowe statystyki prawdopodobieństwa oraz liftu (w wersji nieskumulowanej) służące do inspekcji modelu predykcyjnego w zakresie siły separacji klas. W części 3 skupiłem się na koncepcji punktu odcięcia (cut-off point), który model predykcyjny (z ciągłą zmienną odpowiedzi) transformuje w klasyfikator. Dziś przybliżę strategie doboru punktu odcięcia, celowo pomijając aspekty techniczne związane z analityką predykcyjną - tym zajmiemy się w kolejnym odcinku (opisując skumulowane prawdopodobieństwo, skumulowany lift, krzywą zysku aka Gain Curve lub Captured Response oraz krzywą ROC).

Dobór punktu odcięcia - strategie (z którymi miałem do czynienia w pracy zawodowej)

  • Całkowicie biznesowa - metoda najprostsza, nadal popularna, jednak coraz rzadziej stosowana.
  • Wyłącznie analityczna - rzadko stosowane w biznesie, częściej widoczna pracach / badaniach naukowych.
  • Hybryda powyższych - wariant dziś preferowany przez różne jednostki CRM.

Dobór całkowicie biznesowy

Nadal częsta praktyka, która przy wnikliwej analizie okazuje się nie być najbardziej optymalną. W strategii "całkowicie biznesowej" dobór punktu odcięcia jest pochodną zasobów (np. dostępność / pojemność kanałów komunikacji). Przykładowo - współpracujemy z call center, które miesięcznie może zadzwonić do 100 tys. Klientów. W takiej sytuacji dosyć naturalnie powstaje potrzeba wybrania "100 tys. najlepszych Klientów" (najlepszych do danej akcji). Model predykcyjny posłuży więc do "posortowania" Klientów, a punkt odcięcia będzie zależny od wskazanej oczekiwanej liczby 100 tys. Problem ze strategią całkowicie biznesową polega na tym, że "najlepszy" mylony jest z "dobry". Dodatkowo zdarza się, że siła modelu jest błędnie interpretowana jako zdolność do znalezienie większej liczby "dobrych" klientów - w rzeczywistości jest na odwrót - im lepszy model, tym mniejsze optymalne bazy. Równie istotna kwestia to skąd się właściwie wzięła liczba 100 tys?

Dobór wyłącznie analityczny

Dobór wyłącznie analityczny polega na optymalizacji błędów klasyfikacji - w nieco bardziej zgeneralizowanym podejściu optymalizuje się funkcję kosztu błędów (najczęściej jeśli koszty są mocno asymetryczne). Podejście analityczne jest zupełnie poprawna i uzasadnione, jednak w biznesie prawie nieobecne ze względu na brak uwzględnionego aspektu celu biznesowego, priorytetów, zasobów, itp.

Dobór analityczno-biznesowy

Dobór analityczno-biznesowy (jako połączenie powyższych strategii) najlepiej sprawdza się w sytuacji analizy szerszego portfela produktów (tzn. bazy i cut-off’y dobierane do różnych działań stanowią element realizacji szerszej polityki CRM). Zaczynamy od celów biznesowych, priorytetów, analizy zasobów, pojemności kanałów. Następnie weryfikujemy Klientów, ich potrzeby w kontekście możliwie wielu produktów. Ostatecznie - w wyniku kilku iteracji - dążymy do "zmapowania" segmentów Klientów na cele i zasoby, zawsze koniecznie modyfikując obie strony równania. Jest to trudne i wielowymiarowe zadanie, zadanie zawsze "niedokończone", coraz bardziej opierające się na różnego rodzaju eksperymentach ... ale o tym w kolejnych częściach cyklu ...

Pozdrowienia,

Mariusz Gromada

Matematyka w obrazkach #8 - równanie pi + e = Sudoku :-)

Dziś, w ramach cyklu "Matematyka w obrazkach"chciałbym Wam zaprezentować "autorskie równanie" 🙂

\pi + e = \text{Sudoku}

Zależność powyższą "wyprowadziłem" wykorzystując bibliotekę "Janet Sudoku"!

PI + e Sudoku

Dodatkowo załączam wersję tekstową - przydatną jeśli zechcecie przeanalizować / rozwiązać łamigłówkę samodzielnie  (np. przy wykorzystaniu Janet Sudoku Solver'a).

# Pi + e = Sudoku

+-------+-------+-------+
| . . 4 | 1 5 9 | 2 . . |
| . 1 . | . . . | . 6 . |
| 3 . . | . . . | . . 5 |
+-------+-------+-------+
| 4 . . | . 8 . | . . 3 |
| . 8 . | 2 . 1 | . 5 . |
| . . 3 | . 7 . | 8 . . |
+-------+-------+-------+
| . . 2 | . . . | 9 . . |
| . . . | 3 . 7 | . . . |
| 7 . . | . 9 . | . . 8 |
+-------+-------+-------+

# One line definition:
# ..41592...1.....6.3.......54...8...3.8.2.1.5...3.7.8....2...9.....3.7...7...9...8
# 004159200010000060300000005400080003080201050003070800002000900000307000700090008

# Janet-Sudoku-v.1.1.1, 2016-04-19 22:28:15

Janet Sudok

Pozdrowienia,
Mariusz Gromada

Janet Sudoku - Sudoku Solver i Sudoku Generator w jednym

Janet Sudoku

Janet Sudoku - elastyczna i wydajna biblioteka dostarczające metody generacji oraz rozwiązywania łamigłówek Sudoku 9x9 (platformy Java, Android, .NET, MONO).

Serdecznie zapraszam (link) do zapoznania się z moim nowym projektem "Janet Sudoku". Biblioteka została osobno przygotowana dla platform Java (od 1.5) oraz .NET (od 2.0 - język C#), w związku z tym "Janet" jest akronimem od Java Android, .NET. Główne funkcjonalności biblioteki

Janet Sudoku - icon

  • Sudoku Generator - generacja różnych kombinacji Sudoku przy wykorzystaniu wielu opcji / metod (np. łamigłówka zupełnie losowa, inna łamigłówka z tym samym rozwiązaniem, itp.).
  • Sudoku Solver - rozwiązywanie dowolnego Sudoku, weryfikacja czy rozwiązanie istnieje, poszukiwanie wszystkich rozwiązań jeśli rozwiązanie nie jest unikalne. Ocena trudności danego Sudoku.
  • Sudoku Store - analiza i transformacja Sudoku (np. obroty, permutacje, zamiana kolejności, transpozycje, odbicia, itp.  - są to przykłady transformacji nie wpływających na istnienie rozwiązania).
  • Janet Sudoku Demo App - aplikacja z prostym interfejsem tekstowym, jednak o bardzo rozbudowanych możliwościach. Jest to demo wykorzystujące jednie część funkcjonalności biblioteki Janet Sudoku.

Janet Sudoku - screenshot 1

Janet Sudoku - screenshot 2

Janet Sudoku - screenshot 3

Pozdrowienia

Mariusz Gromada