On en parle, mais cela se précise ! Le « big data » est bien en train de bouleverser durablement l’économie et le fonctionnement des entreprises. En cause, les réseaux sociaux, le succès fulgurant des GAFA, mais aussi la croissance phénoménale de L’Internet des Objets connectés qui se déploie dans tous les secteurs, et concerne aussi bien le monde de l’industrie que les biens destinés aux particuliers.
Ces « big data » sont capables de prendre des initiatives en toute autonomie sans intervention humaine en communiquant les uns avec les autres, ils peuvent être aussi une aide à la décision pour l’Homme en lui adressant des données. Mais le big data ne crée pas d’intelligence, il ne produit que des informations brutes que l’entreprise qui en dispose doit savoir décrypter, à condition de disposer des compétences humaines pour le faire. Apparu dans le sillage du big data, il y a moins de dix ans, le Data Scientist est donc l’homme, ou la femme, qui sait tirer parti de ces informations, leur donner du sens et donc de la valeur.
Le big data bouscule le fonctionnement des entreprises, leur pratique du business, par la quantité énorme des données générées, leur rapidité de renouvellement dans un univers de plus en plus connecté et par la multiplicité des formats à gérer : numérique, texte et image. L’enjeu, qui est double, réside dans la qualité du stockage des données et de leur sécurisation ainsi que dans l’étude et l’analyse que l’on peut en faire pour en tirer des enseignements, et du coup prendre des décisions pertinentes. Dans un contexte économique chahuté, le big data bien utilisé serait le moyen d’acquérir ou de conserver un avantage concurrentiel, un nouveau carburant de la croissance mais aussi des futures innovations. Le défi pour les entreprises consiste donc à dénicher les profils talentueux pour transformer des données de plus en plus complexes et variées en futurs bénéfices.
Mais sur le marché, les profils adéquats sont rares. Dans un contexte d’innovation et d’évolution des technologies sans temps mort, le Data Scientist doit maîtriser des compétences très diverses. C’est un métier qui se situe « à la confluence de l’informatique et des techniques avancées de modélisation et qui requiert une connaissance approfondie du fonctionnement de l’entreprise et de son secteur d’activité », explique le consultant Alexandre Henry, Data Scientist au sein du cabinet Quantmetry1. Des prérequis qui nécessitent un bagage académique conséquent. À l’heure actuelle, « 46 % [des Data Scientists] sont titulaires d’un doctorat et […] 16 % proviennent d’écoles d’ingénieurs2 ».
On demande beaucoup au Data Scientist ! Son champ d’analyse des données en entreprise est très large, « on peut lui demander de répondre à des problématiques portant sur des données relatives à la production, l’analyse du marché et ses prédictions, la connaissance du comportement client… ».
La feuille de route du Data Scientist est conséquente, responsable de la gestion et du stockage, il est aussi en charge « de la récupération et du traitement des données en tenant compte de trois paramètres fondamentaux, le volume considérable, la grande variété d’informations et de sources, non structurées, organisées…, et la fréquence de création, c’est-à-dire leur fraîcheur, tout cela afin de faire parler les données pour les mettre au service de la direction d’une entreprise et créer, in fine, de la valeur ».
Le Data Scientist a un rôle décisif dans la création d’indicateurs et de modèles de prédiction. Des outils qui permettront d’accompagner les prises de décision, l’acquisition de nouvelles connaissances et, au bout du compte, d’optimiser les activités de l’organisation.
D’un point de vue pratique, les missions du Data Scientist se décomposent en quatre axes. Dans un premier temps, comprendre la problématique à laquelle il doit répondre, « c’est le cas d’usage, qui peut porter par exemple sur la fidélisation client, ou la prédiction de pannes d’une machine ». Ensuite, il convient de « déterminer un modèle statistique qui répondra à la question », puis de sélectionner les données pertinentes et nécessaires, « plus il y en a, mieux c’est », celles qui sont existantes et celles qu’il reste à chercher en sélectionnant la source adéquate. Enfin, vient le temps de l’analyse, « en prenant soin de vérifier la qualité et la quantité des données, et de les transformer pour les rendre accessibles à l’ordinateur ». C’est alors le moment de restituer les résultats, « et de porter un regard critique pour éviter des découvertes erronées ».
Les informations brutes ont parlé, elles racontent désormais une histoire, le big data est devenu « smart data », la donnée est lisible et exploitable par les managers.
On l’aura compris, pour réussir dans son métier, le Data Scientist doit démontrer de réelles et solides connaissances techniques, « en statistiques et en algorithmes, mais aussi en informatique et en gestion des bases de données ». Mais il doit aussi faire preuve de savoir-être, « curiosité et créativité, pour comprendre l’activité, le métier de son entreprise afin d’être en position d’identifier les enjeux essentiels ». Ce qui lui permettra notamment de proposer de nouveaux services et produits à partir de son analyse. Être fin communicateur, la digitalisation, enjeu crucial pour de nombreuses sociétés, est parfois accompagnée d’appréhensions, de doutes. Le Data Scientist , homme clé dans ce virage, doit donc être en mesure de résumer ses découvertes en récits convaincants pour faciliter leur déploiement dans l’entreprise.
Et l’avenir du Data Scientist ? Selon Pôle emploi, « l’Europe devrait avoir besoin de former trois millions de Data Scientists dans les années à venir ». On le croit aisément. Les chiffres témoignent, selon le cabinet Gartner, il y avait 20 milliards d’objets connectés dans le monde en 2017, il y en aurait 75 milliards d’ici 2025. Par ailleurs, selon International Data Corporation, le volume des données générées par l’IoT double tous les deux ans, il dépassera les 40 000 milliards de gigaoctets cette année dans le monde. Le calcul est vite fait ! Il y a du travail pour le Data Scientist, seule la pénurie de compétence en ce domaine sera un frein au développement des projets.
Olivier Durand
1 Quantmetry : cabinet spécialisé dans la transformation Data des organisations, de la conception à la mise en œuvre de solutions opérationnelles.
2 Source : LeBigdata