MLBox : a short regression tutorial

I have recently discovered MLBox, an automated machine learning python library.Its main author, Axel Aronio de Romblay, promises : Fast reading and distributed data preprocessing/cleaning/formatting. Highly robust feature selection and leak detection. Accurate hyper-parameter optimization in high-dimensional space. State-of-the art predictive models for classification and regression (Deep Learning, Stacking, LightGBM,…). Prediction with models interpretation. Quite Read More …

House prices : nouvelle solution

Suite à mon précédent post, j’ai passé quelques jours à travailler sur le problème de prédiction des prix de l’immobilier. J’ai pu améliorer mon score (~0.125) et gagner plus de 100 places dans le classement.Le code complet et largement commenté est fourni sous forme de notebook (voir plus bas), vous pouvez également le consulter sur Read More …

Prédire les chances de survie au naufrage du Titanic

Cette compétition proposée sur kaggle, consiste à construire un modèle permettant de prédire les chances de survie lors du naufrage du Titanic.C’est un excellent premier exercice pour mettre en oeuvre ses talents de data scientist.Nous disposons d’une partie de la liste des passagers  et de certaines informations : a-t-il péri dans le naufrage, nom, age, Read More …