Un Data Engineer a un background tech. Il passe généralement par une école d’ingénieurs avec option Big Data / Data Mining. Il peut aussi s’agir d’un software engineer qui choisit d’évoluer plus tard dans un environnement Data, et découvre progressivement les technos de ce dernier. LA DATA. C’est bien joli, mais qu’est-ce qu’on en fait ? Sans les data engineers, rien. Nos chers amis créent l’infrastructure (ou “la maison”) qui va accueillir la donnée. Admettons que l’eau = la donnée. Le data engineer va mettre en place les tuyauteries, la baignoire, les robinets qui vont permettre à toute la famille de boire, se laver, vivre. Et bien, sans les solutions implémentées en amont par le data engineer, la donnée n’est pas prête à être utilisé par tous. Pas de données, pas d’insights, pas de prise de décisions. Pas de bras, pas de chocolat ! Data si, data ça. On peut profiler deux types de Data Engineer:
On ne peut pas résumer le quotidien d’un Data Engineer car ses tâches vont dépendre de multiples critères : la société et la maturité de son business, les volumétries de données à traiter, l’échelle de scalabilité etc. Mais si on le doit, un data engineer est avant tout un développeur qui code pour construire “la maison” et lier toutes les pièces entre elles. Il collabore au sein d’une équipe pluridisciplinaire (Développeurs back-end, Data Scientists, Data Analysts…) et évolue sur une stack propre à la Data. Il récupère des données de différentes natures, et diverses sources, et les transforment pour répondre à un certain format. Il va structurer toutes ses données pour garantir un self-service à tous, que chacun puisse accéder facilement et rapidement aux données / infos souhaitées. Il met en place des espaces de stockage (cloud or no cloud). C’est un garant de l’architecture qu’il conçoit, développe, teste et maintient (bases de données, systèmes de flux de données etc.).
Bref, un paquet de choses… c’est pour cela que les évolutions possibles sont belles.