Avec mon embauche en tant que data analyst chez CS depuis février 2018, le rythme des publications sur ce blog a fortement diminué, de même que mon temps libre pour me consacrer à des competitions kaggle.
Pyspark est désormais mon quotidien 🙂
Pour capitaliser l’expérience acquise, j’ai crée un git dans lequel je rajoute de temps à autre des petits bouts de code pour différentes operations avec Pyspark, que je vous livre tel quel, ça peut toujours servir 😉