Dataiku : l’intelligence artificielle à la portée de toutes les entreprises !

Dataiku : l’intelligence artificielle à la portée de toutes les entreprises !

Table des matières

Dataiku DSS (Data Science Studio) — c’est son petit nom — est une plateforme logicielle collaborative de data science à destination des professionnels de la donnée : data scientists, data engineers, data analysts, data architects, équipes CRM et marketing. C’est un environnement de travail centralisé qui facilite la manipulation des données, l’exploration et le partage rapides des analyses, l’analyse prédictive et la création de modèles d’intelligence artificielle (IA).

La plateforme est également conçue pour simplifier l’automatisation et l’industrialisation des chaînes de traitement, c’est-à-dire la collecte et la préparation des données, l’entraînement, le test et le suivi des modèles d’IA et la phase de déploiement en production.

Dataiku est aussi utilisée pour un large éventail d’applications business telles que la segmentation client, la détection de fraude, le scoring client (calcul du churn, scores d’appétence, scores de risque, etc.), le deep learning et l’analyse du traitement du langage naturel (NLP).

 

Quelle est la genèse du projet Dataiku ?

Dataiku DSS est le nom éponyme de la plateforme d’IA développée par Dataiku, une start-up fondée en 2013, aujourd’hui basée aux États-Unis. Fondée à Paris par Florian Douetteau (actuel PDG), Clément Stenac, Thomas Cabrol et Marc Batty, l’entreprise connaît une croissance rapide depuis sa création. En 2015, Dataiku s’est installée à New York.

Après avoir levé plus de 500 millions de dollars depuis sa création, la start-up est aujourd’hui ce que l’on appelle une licorne valorisée à 4,6 milliards de dollars. Le 15 décembre 2022, Dataiku a annoncé une nouvelle levée de fonds de 200 millions de dollars pour poursuivre le développement de sa plateforme d’analyse des données en entreprise et ses outils d’intelligence artificielle.


Qui sont les clients de Dataiku ?

La licorne revendique plus de 500 clients, dont plus de 150 sont de grandes structures. Par exemple, l’OTAN a choisi cette plateforme d’analyse des données pour élaborer et déployer des projets d’intelligence artificielle sur le terrain. Elle compte aussi parmi ses clients des entreprises comme Showroomprivé, Sephora, GE Aviation, Unilever ou encore BNP Paribas.

 

Quelles sont les principales fonctionnalités de la plateforme Dataiku ?

Dataiku DSS possède plus de 90 fonctionnalités qui peuvent être classées selon les principaux thèmes suivants.


Intégration et compatibilité de Dataiku DSS avec d’autres infrastructures.

  • La plateforme s’intègre à Hadoop, Spark, SQL, Teradata et est disponible sur les marketplaces des plateformes AWS, Azure et Google Cloud.
  • La détection des schémas et formats de données est automatique. Ainsi, Dataiku est capable de reconnaître nativement une variable numérique, une chaîne de caractères, un âge, une date, ou encore un emplacement géographique.
  • De plus, il existe une décorrélation entre le stockage et le traitement des données : les données restent là où elles sont. L’accès aux données est donc instantané, sans qu’il soit nécessaire de les transférer pour les traiter.


MLOps

Dataiku DSS gère le déploiement des modèles au sein de son écosystème, mais aussi dans d’autres environnements tels que AWS, Azure, Google Cloud ou même Kubernetes.


Plugins

  • Dataiku DSS est livrée avec des modules de visualisation standard pour se connecter aux données, traiter et entraîner les modèles. Mais Dataiku offre également la possibilité d’implémenter des modules personnalisés, de les packager et de les partager avec les autres utilisateurs. Ces modules personnalisés sont disponibles sous forme de plugins. Chaque plugin est constitué à la fois d’une interface utilisateur graphique et d’un backend programmé par le développeur en R ou Python.
  • Il existe une galerie de plus de 100 plugins dans le Dataiku Plugin Store, fournissant des applications de données dans de nombreux domaines tels que la traduction de langues, la météo, les systèmes de recommandation, l’import/export de données et les interfaces graphiques prêtes à l’emploi.


Analyse et visualisation des données

Le Datalab de Dataiku fournit une interface pour la construction de tableaux de bord par de simples actions de glisser-déposer. La visualisation des données peut ainsi se faire sans code. Si vous êtes un codeur, vous pouvez bien sûr créer des graphiques personnalisés ou des applications web plus élaborées, car Dataiku permet d’intégrer des bibliothèques web comme JavaScript, d3.js, Leaflet ou plotly dans son écosystème.

 

Optimisation de la préparation des données

L’interface graphique de Dataiku DSS permet d’accélérer le traitement des données grâce à un nettoyage et un enrichissement interactifs de la data. Des adaptations contextuelles sont automatiquement suggérées par Dataiku en fonction du type de données.

Par exemple, à partir d’une date, Dataiku propose de calculer un âge. À partir d’une adresse, Dataiku est capable d’extraire le numéro et le nom de la rue, le code postal ou la ville. Il existe plus de 80 processeurs visuels qui peuvent être activés en quelques clics et sans code. Cette console graphique permet également, par simple clic, d’interagir avec les données pour des filtrages, des transformations ou des synthèses statistiques.


Apprentissage automatique et IA

La plateforme comprend une interface graphique complète (appelée Datalab) dédiée au développement de modèles de machine learning. Cette interface permet la configuration des modèles, la visualisation des performances des modèles et une lecture simplifiée des résultats produits par les algorithmes. Il existe également un module pour l’automatisation du machine learning (AutoML).


Dataflow et réconciliation intelligente de la data

Le mot « dataflow » est le terme utilisé pour décrire l’ensemble des données et des techniques de modélisation. Un dataflow peut être visualisé et réexécuté facilement. Dataiku DSS permet également un recalcul intelligent des données via un moteur de reconstruction qui permet de limiter les calculs à certains ensembles de données seulement.


Déploiement et industrialisation des workflows

La plateforme permet de packager des workflows en incluant à la fois les données et les modèles (c’est-à-dire tous les workflows).

Il existe deux types d’instance pour le déploiement : le nœud de conception (instance conçue pour le développement) et le nœud d’automatisation (instance d’automatisation du workflow). Une interface unique rassemble les modèles de déploiement, du développement aux tests et de la préproduction à la production.


Dataiku est-elle une solution d’analyse de la data pertinente pour votre entreprise ?

Dataiku est un outil intéressant pour votre entreprise si vous disposez déjà d’une équipe dédiée à la data qui souhaite fournir des analyses avancées en utilisant les dernières techniques à l’échelle du big data. Vous allez pouvoir ainsi faire levier sur vos datas et en révéler le plein potentiel. Pour les néophytes, on préférera un outil comme Alteryx.

Pour les responsables de la data d’entreprise, les principaux points d’intérêt seront les suivants :

  • consacrer plus de temps aux projets d’IA à fort impact ;
  • utiliser les mêmes langages et outils que les développeurs connaissent et apprécient déjà, avec une efficacité supplémentaire ;
  • faciliter les tâches répétitives en les automatisant pour se concentrer sur les projets à fort impact ;
  • obtenir l’adhésion de toutes les parties prenantes en partageant les résultats de son modèle visuellement, en un seul clic ;
  • déployer et surveiller les projets de data science sans dépendre d’autres équipes.


Pour les équipes business, ce sera plutôt :

  • générer plus rapidement des analyses plus approfondies grâce à un accès continu aux données, une préparation intelligente des données et une transformation des données fiable et transparente ;
  • améliorer ses compétences en machine learning et expérimenter avec AutoML ;
  • transmettre efficacement des informations avec des tableaux de bord et des applications personnalisables ;
  • collaborer avec des experts techniques pour exploiter au mieux les données recueillies sur le terrain.


Vous souhaitez affiner vos prévisions de ventes par rapport à vos marchés et atteindre un meilleur pricing de vos produits, maîtriser le cycle de vie de vos clients actifs et inactifs, anticiper précisément vos dépenses et achats, contrôler au mieux votre trésorerie, fidéliser vos ressources et prévoir l’évolution de votre masse salariale… ?

Atteignez vos objectifs business grâce à l’analyse prédictive et prescriptive : Contactez-nous !

 

CONTACTEZ-NOUS

Les informations recueillies sur ce formulaire sont nécessaires afin de vous répondre. Vous disposez d'un droit d'accès, de rectification et d'opposition aux données vous concernant, que vous pouvez exercer en contactant le délégué à la protection des données de Redstone Partners. Pour plus d’informations, consultez notre Politique de protection des données personnelles.

CONTACTEZ-NOUS

Les informations recueillies sur ce formulaire sont nécessaires afin de vous répondre. Vous disposez d'un droit d'accès, de rectification et d'opposition aux données vous concernant, que vous pouvez exercer en contactant le délégué à la protection des données de Redstone Partners. Pour plus d’informations, consultez notre Politique de protection des données personnelles.