Generali Data Challenge: Churn Prediction
Il mancato rinnovo di una polizza da parte di un cliente (Customer Churn) è un problema classico per una compagnia assicurativa. Un problema a cui vanno incontro tutti i modelli di business basati su contratti a scadenza.
La previsione del Customer Churn è il tema di questa Challenge.
Un tema vitale: anticiparlo permette ad esempio di far leva su azioni di retention per mantenere il rapporto con il cliente.
Il team Advanced Analytics di Generali Italia mette a disposizione un dataset, estratto dai propri sistemi, sulla base del quale potrai sviluppare un modello predittivo del Customer Churn.
Cogli quest’opportunità per dimostrare il tuo talento e mettiti in gioco!
Partecipando alla Challenge promossa da Generali e BeeViva potrai mettere alla prova le tue abilità di Data Scientist provando a risolvere un business problem reale:
1. Registrati alla piattaforma Datachallenge.it, accettandone i termini e le condizioni d’uso
2. Iscriviti a Generali Data Challenge: Churn Prediction, sottoscrivendo i termini del regolamento
3. Mettiti in gioco: sviluppa il tuo algoritmo di machine learning per prevedere il rischio di Churn dei clienti.
Ai fini dell’ammissibilità ai premi, ai partecipanti è richiesto di inviare:
- un vettore di 1 (churn) e 0 (no churn) contenente le previsioni elaborate dal modello, relativamente al test set (Submission Tecnica, max 1.5 Mb);
- un breve documento di testo che descriva il ragionamento seguito nella risoluzione del problema, la scelta dell’algoritmo e la struttura logica dei processi con cui è stato costruito il modello predittivo (Descrizione della Soluzione, max 15 Mb).
L’accuratezza delle previsioni verrà valutata utilizzando l’F1 Score, cioè la media armonica di precisione e recupero (precision e recall) per la categoria target=1 (Churn):
F1=(Precision1*Recall1)/(Precision1+Recall1)
Uno score più alto rappresenta una previsione più accurata.
Durante tutta la competizione sarà possibile valutare la qualità delle proprie Submission attraverso una classifica parziale (Leaderboard Parziale) determinata sulla base di un sottoinsieme del test set (25%). La classifica finale sarà invece determinata dal F1 Score ottenuto sul restante 75% del test set.
• Non c’è un limite al numero di submission che ogni partecipante può fare.
• Al termine della competizione, solo l’ultima submission valida sarà considerata per il calcolo del punteggio finale (sottomettete quindi per ultima quella che reputate migliore!).
• Il punteggio finale è calcolato usando solo le predizioni che NON sono state usate nel calcolo del punteggio parziale.
• In caso di parità di punteggio finale prevale l’utente che ha fatto
per primo l’ultima submission (si noti che i risultati visualizzati
dalla piattaforma sono approssimati alla sesta cifra decimale, sarà
nostra cura certificare eventuali differenze di punteggio non
visualizzate dal sistema)
NOTA: Non è indispensabile che ogni submission abbia un documento di spiegazione del modello, basta che questo sia presente nelle submission definitiva (l’ultima fatta prima della chiusura della challenge).
…and the Winners are:
Classifica Assoluta :
asiabgml , plesco.victor (ex equo)
Classifica Tecnica :
clauser.giorgio
Classifica Qualitativa :
riccardo.cadei98
Other Top 10 (alphabetic order) :
Classifica Assoluta :
anghileridavide
dogancandemirbilek
igor.gdc
massimrubino96
piergiacomo.carlesi
s.silvestrelli
stefano.donges
WN_08
Classifica Tecnica :
alessandro.aere
Blanda Alessandro
davide.checchin
federico.barbieri.999
Giacomo Maugeri
gianvschiano
iadevito.alessandro
liso.davide
marcoedoardogeccherle
Classifica Qualitativa :
agnoletto.davide
apascariu32
benny.libera
cortivomatteo
daniele.davino
g.sferrazzo
jvit
lvito90
marco.alberto.grimaldi