Contact : 06 71 12 81 23

  • Le blog
  • Métier du Datascientist et ses outils : IBM SPSS, python…

18 Oct 2021

Métier du Datascientist et ses outils : IBM SPSS, python…

Par INTIS

- Catégories : Tutos et info tech

Antoine Riguidel est consultant datascience IBM SPSS, il travaille pour la partie  digitale/expérience client au sein d’une agence de communication. Il accompagne ses clients dans la conception d’études d’identification de besoins marketing et dans la mise en place de stratégies visant à densifier leur activité. Dans cette interview il nous explique le métier datascientist et nous liste les outils qu’il utilise au quotidien.

Découvrir IBM SPSS

En quoi consiste le métier de Datascientist ? Pour quels usages la data science est employée ?

 

L’objectif de la Datascience est d’analyser les données afin d’en tirer le maximum d’informations utilisables. A partir du moment où les données peuvent être analysées et où on a la main sur l’activation, la datascience peut être intéressante pour communiquer avec les consommateurs d’un produit par exemple, et augmenter le chiffre d’affaires.

L’idée est d’identifier de l’information et de la transformer en potentiel. Par exemple, communiquer avec une cible ne consommant encore un produit mais qui a un fort potentiel de pouvoir le faire.

Le datascientist, must-have ou nice-to-have pour les entreprises en 2021 ?

 

Il y a encore quelques années, la datascience n’était pas considérée comme essentielle pour les entreprises. C’est aujourd’hui une activité beaucoup mieux comprise et beaucoup mieux prise en compte. De nos jours, tout le monde a en tête que la data est stratégique pour le développement d’un business, qu’elle permet de piloter des décisions, d’arbitrer, de faire des choix…

Avec quelles technologies travaillez-vous ?

 

Nous travaillons majoritairement sur des exports de données de nos clients, sur une base mensuelle. Une partie du métier de Datascientist consiste à se tenir au courant des différents outils et des solutions data disponibles sur le marché. J’utilise au quotidien 2 technologies : je code en python (langage de programmation) pour tout ce qui relève de l’automatisation : par exemple, le calcul d’une segmentation d’une campagne pour créer des ciblages automatisés. Je peux ensuite utiliser des outils de Datascience permettant de récolter des graphiques sur des arbres de décision par exemple. J’utilise énormément IBM SPSS, et ce depuis 15 ans. C’est l’un des outils avec lequel je suis le plus à l’aise, en particulier sur ce qui concerne la partie d’analyse exploratoire.

Pourquoi l’outil IBM SPSS particulièrement ?

 

IBM SPSS a plein d’avantages. C’est une solution sur laquelle on visualise facilement les données. Il propose un visuel au moment de l’import des fichiers permettant de voir à quoi ceux-ci ressemblent. Quand on reçoit les données du client et que l’on n’a pas de dictionnaire de données, on est obligé de tâtonner pour voir à quoi ressemble le fichier. SPSS a un module d’importation de fichiers qui permet de les visualiser de manière simplifiée.

J’utilise SPSS pour, dans un premier temps, découvrir les fichiers, découvrir la base et faire des tests de rapprochement entre les tables. C’est un outil qui retient la volumétrie, on peut travailler sur de gros fichiers.

J’utilise ensuite Python. Les scripts python permettent d’échanger avec d’autres personnes programmant également en python. On peut ainsi échanger notre travail : c’est ce que j’appelle la partie automatisation.

Le Datascientist est-il internalisé par les entreprises ou encore très externalisé ?

 

Cela dépend des clients. Tous n’ont pas ces besoins data. Cela dépend d’un niveau de connaissance du sujet et du budget alloué. Certains ont une cellule de marketing stratégique en interne et externalisent des besoins spécifiques avec des prestataires spécialisés. Mais toutes les entreprises ont une masse de données à exploiter, ce qui demande une structure, une architecture et une récolte de données.

Quel est le profil de quelqu’un qui pratique le métier de Datascientist ?

 

A la base, c’est un profil de data scientist est un statisticien. La compétence métier se construit avec l’expérience, en fonction des comptes et des personnes. Il arrive qu’il y ait dans les équipes marketing des réfractaires aux mathématiques et s’empêchent de demander des choses par blocage. D’autres, ont ce goût des chiffres et de l’analyse et peuvent faire la relation entre le client et le prestataire. Nous travaillons en général avec ce type d’intermédiaire. J’interviens en tant qu’expert data technique et nous trouvons des solutions ensemble.

Comment voyez-vous l’avenir du métier de datascientist ?

 

C’est un métier qui est dans l’air du temps. Les entreprises ont intérêt à automatiser les tâches récurrentes pour laisser place à l’analyse et trouver de nouvelles idées. Les outils de Datascience se perfectionnent de plus en plus et le sujet se démocratise. Ce qui était avant réservé à des gens avec une appétence mathématique est de plus en plus accessible à des gens sans background scientifique, grâce à la vulgarisation. Le grand public est de plus en plus au fait de cette existence et ces méthodes de travail. Les lois européennes sur le respect de la vie privée font que le grand public a entendu parler de ce travail des données. »

Data science et Marketing avec IBM SPSS