Porto Seguro’s Safe Driver Prediction (Kaggle)

This competition was held on Kaggle from august to november 2017. Porto Seguro is a large brasilian insurance company that whishes to build a model that predicts the probability that a driver will initiate an auto insurance claim in the next year. The dataThe training data is a anonymized 113Mo .csv file with 59 features Read More …

Tensorflow classification example : Titanic competition

After having completed the first three lectures in Andrew Ng’s excellent deep learning lecture on coursera, I decided to practice my new skills using kaggle competitions.For a first example, I’ll use the Titanic dataset again.The data has already been analysed and processed (log, binning, etc.) in a previous article, so I’ll skip this part. import Read More …

House prices : nouvelle solution

Suite à mon précédent post, j’ai passé quelques jours à travailler sur le problème de prédiction des prix de l’immobilier. J’ai pu améliorer mon score (~0.125) et gagner plus de 100 places dans le classement.Le code complet et largement commenté est fourni sous forme de notebook (voir plus bas), vous pouvez également le consulter sur Read More …

Compétition Kaggle : House Prices

Pour pratiquer mes compétences en régression, je m’attaque à la compétition Kaggle : “House prices: advanced regression techniques“.Le jeu est une liste de 79 variables (surfaces, prix, voisinage, état général, etc.) décrivant près de 2000 maisons vendues dans l’Iowa.Le challenge consiste à construire un modèle permettant de  prédire le prix des maisons à partir de Read More …

Prédire les chances de survie au naufrage du Titanic

Cette compétition proposée sur kaggle, consiste à construire un modèle permettant de prédire les chances de survie lors du naufrage du Titanic.C’est un excellent premier exercice pour mettre en oeuvre ses talents de data scientist.Nous disposons d’une partie de la liste des passagers  et de certaines informations : a-t-il péri dans le naufrage, nom, age, Read More …