Retour aux articles
  • 28.09.2015

Retour sur le DUG#6 avec Dataiku : Sport Analytics / Hadoop Step by Step

Retour sur le DUG#6 avec Dataiku : Sport Analytics / Hadoop Step by Step

Au programme du jour : Souvenir souvenir du dernier meetup DUG#6: Sport Analytics / Hadoop Step by Step ! Présenté par la team Dataiku et plus particulièrement par Louis Philippe, Matthieu, Maxime et Kenji, voici ce qu’il fallait retenir de ce talk…

  Dataiku, startup parisienne, édite un logiciel d’analyse de données et de machine learning, le Data Science Studio. La team organise régulièrement des meetups pour ses utilisateurs appelés Dataiku User Group. Ce DUG (Dataiku User Group) est une occasion en or pour discuter entre connaisseurs de la donnée et du Big Data, et pour présenter des cas réels, réalisés avec le logiciel. La présence des Data Scientists le 22/09 a notamment permis de répondre à des points techniques très précis. Le meetup permet aussi de rencontrer des utilisateurs et des clients dans un cadre décontracté, informel avec bières, pizzas et babyfoot !   Quelles ont été les problématiques principales soulevées ? Leur logiciel s’adresse à la fois à des profils très techniques mais aussi à des Business Analystes, des Marketeurs ou des Managers. L’éclectisme de la cible est intéressant car cela permet de réunir des profils très différents et des corps de métier variés. Lors du DUG, le sujet était donc plus éducatif pour parler à la fois à tous ces profils, y compris ceux qui ont un bagage technique moins important. Pendant le meetup du 22/09, la team a montré l’intégration de Hadoop dans Data Science Studio. Deux des Data Scientists ont ensuite présenté des projets personnels réalisés dans le logiciel sur le Sport Analytics pour mettre en avant ce qu’il était possible de faire avec un peu de Python et de travail ! :)   Une synthèse des réponses apportées ? Nous avons vu qu’il était facile de jongler entre différentes sources de données et technologies : fichiers, Hadoop, SQL, Pig, Hive… Mais aussi scripts Python pour le scrapping ou la récupération des données depuis une API. Un modèle prédictif sur la prévision de résultats sportifs a aussi été montré. Enfin, nous avons pu voir quelques visualisations dont le tracé de footing du très sportif Matthieu à Saint-Malo ;)   Quelle est la place de ce meetup parmi les autres (passés ou à venir) sur la même techno ? "C’est un User Group comme nous en avons déjà fait et comme nous espérons en refaire avec la team Mobiskill ! Plus d’espace veut aussi dire plus de monde donc on compte bien ne pas s’arrêter en si bon chemin ! Pour une fois, nous avions plusieurs interlocuteurs techniques de nos clients ; ils ont été contents d’échanger avec nos Data Scientists !"   Un retour sur l’avis du public, les grandes questions posées ou une anecdote ? "Les gens étaient très contents, on a eu des super retours ! C’est toujours sympa de rencontrer les personnes derrière l’écran et les mails échangés, de mettre un visage sur leur nom et de pouvoir discuter de manière informelle, en dehors des heures de boulot". La présentation du Data Scientist & très sportif Matthieu sur ses données personnelles de running a fait beaucoup rire… Il faut vraiment être Data Scientist pour vouloir démontrer que l’application a des biais de calcul qui faussent la mesure des performances et vouloir les ajuster ;) Le modèle de Maxime pour présenter les résultats de la coupe du monde de rugby a suscité beaucoup de questions. Les invités étaient clairement intéressés par l’idée de pouvoir faire leur propre modèle prédictif pour gagner des paris sportifs.   - La Team Mobiskill