×

Data Scientist

Les choses à savoir pour un poste de Data Scientist

QU’EST CE QU’UN / UNE DATA SCIENTIST ? 

 

La data science est une discipline relativement jeune née avec l‘apparition du Big Data et le développement de technologies récentes. 

Un data scientist est un ingénieur ayant réalisé une spécialisation en mathématiques appliquées, intelligence artificielle ou en machine learning. 

Les algorithmes de machine learning sont des algorithmes qui apprennent avec les données qu’on leur donne. Ce sont des algorithmes intelligents. 

Le rôle du data scientist est d’utiliser ces fameux modèles pour répondre à des problématiques posées. Il peut s’agir de problématiques business concrètes ou de sujets de R&D plus complexes.
Voici les use case les plus connus utilisant les techniques de machine learning : 

  • Système de recommandations / Moteur de recherche 
  • Connaissances clients (segmentation / Scoring )
  • Prédictions via les séries temporelles. (La prédiction de ventes par exemple)
  • NLP (analyse de sentiments, extraction de mots clés etc …)
  • Computer vision  (Détection d’objets, reconnaissance d’images, classification d’images etc ..) 

 

Tout comme le Data Analyst, le Data Scientist doit avoir une sensibilité et une compréhension business. En effet en premier lieu sa mission est de comprendre le problème business afin de choisir le meilleur modèle pour y répondre. 

 

Qu’est ce qu’une journée type ? 

 

Voici l’ensemble des missions possibles du Data Scientist :

  • Discuter avec les équipes métier pour comprendre et cadrer un besoin business
  • Effectuer une veille scientifique sur l’état de l’art. C’est à dire se renseigner sur les derniers algorithmes répondant le mieux aux problèmes 
  • Explorer la donnée pour la comprendre
  • Tester différents modèles pour identifier celui ou ceux qui marcheront le mieux. 
  • Travailler sur une stratégie de feature engineering. C’est à dire sélectionner les paramètres pour avoir un modèle optimal. 

Une fois que le modèle est codé correctement il y a deux options : 

  • Soit on s’arrête au stade de POC (proof of concept)  
  • Soit on choisit d’aller plus loin et de pousser le modèle en production en collaborant avec des data engineers et des développeurs. 

 

Nous distinguons aujourd’hui 2 types de Data Scientists. 

  • Les data scientists orientés développement et production. Ils vont plus loin que le POC et travaillent sur le déploiement de leurs modèles en production. Ils montent ainsi en compétences sur la partie développement et data engineering. 
  • Les Data Scientists orientés R&D. Ils travaillent sur des thématiques plus “early stage” notamment le deep learning et le reinforcment learning. Leur rôle est plus scientifique. Ils travaillent sur la création de nouveaux algorithmes pour des sujets toujours plus innovants. Leurs rôles est de lire des papiers de recherche, d’aller à des conférences, de publier leurs travaux. Ces types de profils travaillent plus dans le cadre de Lab de R&D. 

 

Ce qu’il te faut pour exceller dans ce domaine ?

 

Voici les compétences clés requises : (Pas de panique si ça fait beaucoup) 

 

  • Tu dois être issu d’une école d’ingénieur avec un fort background en mathématiques. 
  • Une bonne connaissance théorique des modèles classiques de machine learning : SVM, Random Forest, Gradient Boosting / XG Boost etc … 
  • Une excellente maîtrise de python. 
  • Une maitrise d’un framework de deep learning : Tensorflow ou Pytorch. 
  • Une connaissance des technologies de mise en production : Spark, Kubernettes, Docker etc… 
  • Une première expérience dans l’utilisation de ces technologies est un gros plus. (C’est à dire que tu as déjà participé au déploiement d’un modèle)
  • Une bonne compréhension business et une appétence produit
  • Enfin une capacité à vulgariser ce que tu fais sera un gros avantage 😉 

 

C’est de la magie ? Quelle formation on fait pour faire ça ? 

 

Le plus simple est de faire une école d’ingénieur  proposant un master spécialisé en intelligence artificielle ou mathématiques appliquées et Machine learning. Ces formations te permettront d’acquérir des connaissances solides en mathématiques pour comprendre les modèles et les utiliser correctement. 

Une reconversion est aussi possible grâce aux formations en ligne comme OpenClassrooms ou Udacity, cependant il te faudra muscler ton jeu avec des projets personnels et des stages pour palier à ton manque de connaissance dans l’informatique en général. 

 

C’est une bonne situation ça Data scientist ? 

 

Les profils de data scientist sont extrêmement demandés aujourd’hui. Rares sont les profils qui arrivent à combiner toutes ces compétences. Il s’agit donc d’une très bonne situation. Les entreprises ont des besoins toujours plus forts dans la maîtrise de leurs données et dans leur exploitation. Le machine learning devient de plus en plus une manière d’avoir un avantage concurrentiel par rapport à ses concurrents. C’est aujourd’hui une des clés de l’innovation. 

 

Quel salaire pour ce poste ? 

 

En tant que jeune diplômé tu peux gagner entre 40.000 et 50.000 euros bruts par an.

Avec deux ans d’expérience et un niveau confirmé tu peux prétendre à un salaire entre 51.000 et 55.000.

Au delà de 4 ans d’expérience les salaires peuvent atteindre et dépasser ensuite 60.000 euros pour des postes de lead data scientist, head of data science, chief data officer. 

 

Voir Les offres d'emploi Data Scientist

Data Engineer - business oriented ET star du développement backend en Python (H/F)


AdTech Consulting

Paris 50k-70k CDI
Data Engineer - business oriented ET star du développement backend en Python Tu en as ras le bol des ESN mauvais genre qui utilisent les termes "agilité" et "data driven" à mauvais escient ? Dans l'imaginaire commun, société de conseil est synonyme de mastodonte des années 90, milliers de consultants envoyés en missions sur des projets ad hocs et j'en passe. Voyons cette startup comme la nouvelle génération du consulting; boite tech dans un environnement agile avec missions courtes (2 à 3 mois max), des POC, de la mise en prod' et de la veille technologique permanente. Qu'allez-vous faire ? Collecte de données et traitement de ces datas à des fins pure business (il faut délivrer!) Modélisation algorithmiques liées à différents types de sujets Deux problématiques majeures : IA et automatisation / scalabilité de la solution  Client facing / Business Consulting Veille technologique sur des sujets de NLP et de détection de fraude, chatboats... Pourquoi eux ? Un projet déjà primé, et qui va exploser et être commercialisé sur les marchés européens et américains Tu travailleras au sein d’une équipe très solide techniquement Une startup data driven : TOUS les projets tournent autour de la data Des locaux très agréables à deux pas de Bonne Nouvelle (si vous aimez le théâtre et les petits bars cosy vous serez servis) Montée en compétence en 6 mois chez les juniors versus un an en moyenne partout ailleurs Place de Lead Data Engineer à prendre Réévaluation salariale tous les semestres / ans Alors, tu aimes ce que tu lis et tu veux me faire parvenir ton CV ? C'est ici que cela se passe ==> juiiette@mobiskill.fr  Si non, j'attends tout de même un mail de votre part pour me coopter vos amis et connaissances possiblement pertinents pour cette opportunité. Vous recevez une belle prime en guise de récompense.  À très vite,  Juliette Responsable pôle Data / Scala chez Mobiskill cabinet de recrutement spécialisé dans la tech Site : www.mobiskill.fr Twitter : @mobiskill ou @mobiskilljobs LinkedIn : Mobiskill (groupe)
Spark Scala Python
Juliette Responsable Pôle Scala / Data Engineer
Postuler

Head of Data - CDI - Startup - JobTech - Paris 17ème (H/F)


JobTech

Paris 70k-100k CDI
Head of Data - CDI - Startup - JobTech - Paris 17ème (H/F) Cette startup propose aux workers l'accès à une quantité exhaustive de jobs correspondants à leurs attentes (bienêtre, rémunération, avantages, flexibilité, ...). Comment ? Grâce à un algorithme de matching !  Le produit  Le produit est une plateforme web qui a pour mission de faciliter l'accès à des missions d'intérim pour les travailleurs et côté sociétés, le but est de proposer un choix écrémé de candidats sérieux et pertinents pour chaque besoin entreprise. C'est une véritable révolution dans le monde de l'intérim depuis toujours régit par les géants Manpower and co dont nous ne connaissons que trop bien le nom. Le secteur est historique et encore sous exploitée. Tout est à construire.  La startup qui me mandate s'est entouré des meilleurs (ComEx, Développeurs, Commerciaux ...) afin de digitaliser tout cela et devenir leader mondial d'ici quelques années. Ils sont d'ailleurs passés de 2 à 20 personnes en 3 mois. Ils ont des ambitions folles. En voici quelques lignes :   Créer une architecture BI / Big Data Mettre en place les KPIs pour une amélioration continue Recruter une équipe La stack :    Node.js React Redux TypeScript Kotlin Python  Et vous ?   Vous avez déjà plusieurs années d'expérience dans la Data et idéalement dans le management d'équipe  Vous souhaitez rejoindre un projet from scratch et ultra ambitieux  Vous souhaitez travailler dans un environnement international. Convaincu(e)? N'attendez plus et écrivez-moi à adam@mobiskill.fr Si ce poste ne vous convient pas, je dispose d'une vingtaine autres opportunités et je récompense la cooptation. À très vite ? Adam Responsable du Pôle Data / Scala chez Mobiskill https://mobiskill.fr/
AWS Scala Python
Juliette Responsable Pôle Scala / Data Engineer
Postuler

Data Engineer Python pour une startup phare de la publicité via géolocalisation (H/F)


AdTech Mobile

Paris 50k-70k CDI
Data Engineer Python pour une startup phare de la publicité via géolocalisation (H/F)   Le monde de la publicité t’a toujours attiré ? Tu souhaites réfléchir sur des problématiques business en lien avec des produits tech ?  Rejoins une des startups les plus connues et les plus prometteuses de la scène Tech Parisienne. Cet acteur spécialisé est le seul en France à faire de la publicité ciblée et géolocalisée. Et ils recherchent un profil comme toi : un Data Engineer compétent !   LE POSTE Tu seras en charge de : L’amélioration du ciblage et de la précision en terme de géolocalisation La collecte de la data et le traitement en temps réel des données (toutes les mili-secondes) Le maintien de la plateforme existante qui gère des milliards d'évènements par jour La vision stratégique sur toute la partie data   TON PROFIL Tu as déjà eu une expérience significative en Data Idéalement tu développe en Python  Dans un monde parfait, tu as également déjà fait face à des problématiques de montées de charges Tu connais la méthode agile Tu es product oriented, capable de comprendre les enjeux d’un produit technologique   POURQUOI POSTULER Des bureaux spacieux où la bonne ambiance n’est pas en option Une rémunération SUPER attractive (50K-70K environ selon profil), ainsi que des BSPCE. La promesse de participer à une belle aventure startup qui te fera évoluer techniquement Voyage d’équipe une fois par an   Tu t'identifies ? Envoie-moi ton CV à juliette@mobiskill.fr Juliette Responsable Pôle Data / Scala  Mobiskill, cabinet de recrutement spécialisé et leader dans le Web & le Mobile Site : www.mobiskill.fr
Docker Kafka AWS Scala Python
Juliette Responsable Pôle Scala / Data Engineer
Postuler

Data Engineer - Java and Cloud - Fintech - Startup - CDI - Paris (H/F)


Fintech

Paris 65k-85k CDI
Data Engineer - Java and Cloud - Fintech - Startup - CDI - Paris (H/F) Dans le monde de la fintech, j'appelle le Leader Européen de la gestion des comptes en BtoC. Objectif : vous aider à gérer votre argent efficacement. Nous avons tous vécu cette situation, fier comme un paon, on tend notre carte de crédit pour régler une transaction et mince "paiement refusé ? Ok, bon, bah merci, heuuu ... bonne journée, je vous laisse l'article alors du coup hein." #LOL. Grâce à cette startup, vous ne serez plus jamais Mister Looser. Enfin sauf si vous y tenez. Ça rend tout de suite plus humble, plus responsable, oui, oui cela éduque. :) Bref.  Les missions ? Développer et maintenir l'infrastructure data articulée autour d'AWS. Evoluer dans un environnement à très forte croissance et traiter un volume massif de données Être capable d'architecturer un datalake ainsi que des solutions prédictives de Machine Learning  Vous serez décisionnaire et responsable des sujets Data Ecrire du code qui aide plus de deux millions de personnes à mieux gérer leur argent Stack :   Micro Services Java Play! AWS Docker Salaire : 65K-85K€ environ - selon profil Localisation : Paris 11ème.   Qu'en dites-vous ? Si ce poste ne vous plait pas, cooptez-moi tous vos amis. Promis, vous serez récompensé généreusement (en chèques cadeaux Amazon). Où me joindre? = adam@mobiskill.fr À très vite! Adam Responsable Pôle Data chez Mobiskill https://mobiskill.fr/  
Docker AWS Scala Python Java
Juliette Responsable Pôle Scala / Data Engineer
Postuler

Data Engineer - société à l'origine de multiples innovations - CDI - Paris 8 (H/F)


Société à l'origine de multiples innovations

Paris 50k-60k CDI
- La société qui a tout compris - Cette start-up d’environ 50 collaborateurs travaille pour offrir à tous les français des produits et services avant-gardistes et accessibles au plus grand nombre. Leur goal : créer des produits innovants pour tous!   80% de l'équipe est tech, et chaque équipe projet est composé de 5 à 10 personnes.  Tu seras le 1er Data Engineer de la team!!!  Devenir un des pionniers? Créer une team? Go go go, c'est ici!    Ton rôle : Driver les choix Data et rendre la structure production-ready   Tes missions :  • Concevoir, développer et mettre en production des pipelines d'ingestion de données • Déployer et maintenir des environnements containérisés  • Choisir la persistance des données à adopter selon les besoins (ex : PostgreSql, SQLite, InfluxDB, Redis), • Mettre en place des outils de visualisation.   Stack : Java ou Scala + Python, Docker, Ansible, Kafka, Flink, Airflow, Nginx…  <<< Pas d'existentiel, tu as une main sur les orientations/choix des technos >>>   Salaire: 50-70k (en fonction de l'expérience)  Localisation : Paris 8   Pourquoi les rejoindre?  - Cadre de travail très agréable : choix du matériel, standing desk… - Showroom, salles de réunion, de repos, de TV & Jeux Vidéos... - Petit déjeuner, déjeuner et goûter tous les jours à l’étage! - Mutuelle & Prévoyance / Intéressement & Participation - Opensource (beaucoup utilisé / contributions) - Autonomie totale : très peu de micro-management, peu de hiérarchie   Allez, viens…    Envoyez-moi votre cv à juliette@mobiskill.fr !  Juliette / Responsable Data  Mobiskill, cabinet de recrutement spécialisé dans le web et le mobile   Site web : www.mobiskill.fr   Twitter : @mobiskill ou @mobiskilljobs   LinkedIn : Mobiskill (groupe)
Docker Kafka Scala Python Java
Juliette Responsable Pôle Scala / Data Engineer
Postuler
Voir toutes les offres