Dataiku's Secret to Scaling AI in Global Enterprises | Florian Douetteau, CEO, Dataiku
Créé le 12/12/2024 · Dernière modification le 15/12/2024Épisode
Discussion sur les origines de Dataiku, son évolution en tant que leader de l'IA d'entreprise et sa mission de démocratiser la science des données.
Points clés
- 00:04Dataiku est une plateforme leader dans le déploiement du machine learning et de l'IA en entreprise.
- 00:11Dataiku est passée de ses modestes débuts en France il y a dix ans à son statut actuel de leader mondial de l'IA d'entreprise.
- 00:24L'objectif initial de Dataiku était de démocratiser la science des données et de la rendre accessible à tous.
- 00:30Dataiku compte plus de 700 entreprises clientes, dont Morgan Stanley, Michelin, Novartis et Purdue Farms, dans tous les secteurs d'activité.
- 02:28Florian Douetteau a commencé à programmer à l'âge de cinq ans.
- 03:51Florian a étudié les mathématiques et l'informatique à l'ENS, une école très sélective en France.
- 05:26Florian a travaillé chez Exalead, une entreprise française de logiciels d'entreprise qui a connu un grand succès.
- 06:50Dataiku a été fondée en 2013 par Florian Douetteau et trois autres cofondateurs.
- 08:24L'idée de Dataiku est née du besoin de démocratiser la science des données, car il n'y avait pas assez de data scientists pour répondre à la demande.
- 08:37Dataiku voulait simplifier la science des données grâce à des logiciels, en particulier à une époque où les entreprises mettaient en place leurs premiers clusters de données.
Exploration de la décision de Dataiku de se concentrer sur une plateforme collaborative dès le départ, en ciblant les entreprises plutôt que les entreprises technologiques, et l'impact de l'isolement relatif de la France sur leur approche non traditionnelle.
Points clés
- 09:15Le concept de Data Scientist commençait à peine à émerger en 2011.
- 09:40L'intuition principale était que pour démocratiser la data science, il fallait élargir les frontières afin que des personnes extérieures à la data science puissent également en faire.
- 09:59Il y avait un fossé de communication entre les équipes métiers et les data scientists, qui ne parlaient pas le même langage et avaient des attentes différentes.
- 10:42La solution n'était pas d'ajouter plus de data scientists, mais de trouver un moyen pour les équipes métiers et les data scientists de travailler ensemble en utilisant le même outil.
- 12:17Le nom Dataiku est né de la combinaison de "data" et de "haiku", un poème japonais qui exprime beaucoup en peu de mots, reflétant l'objectif de l'entreprise de rendre les données accessibles.
- 12:52Dataiku a eu une vision très précise du marché très tôt, en se concentrant sur une plateforme collaborative pour la data science alors que ce n'était pas encore une tendance forte.
- 17:50L'entreprise a choisi de cibler les grandes entreprises plutôt que les entreprises technologiques car ces dernières avaient une approche différente de la construction et de la maintenance de solutions de données.
- 19:08Dataiku a parié sur le fait que les entreprises non technologiques, qui représentent la majorité du marché, auraient besoin d'une plateforme pour démocratiser l'accès aux données et à la data science.
Exploration de l'évolution de la plateforme Dataiku, de ses fonctionnalités initiales à son statut actuel de couche d'orchestration pour les applications d'IA. Discussion sur la manière dont Dataiku intègre les nouvelles technologies, telles que l'IA générative, dans sa plateforme.
Points clés
- 20:02La plateforme Dataiku a évolué pour offrir une gamme de capacités d'IA, passant de quelques fonctions clés comme AutoML et Dataprep à plus de 15 ou 20 aujourd'hui.
- 20:22Dataiku sert de couche d'orchestration permettant aux entreprises de construire, de maintenir et de gérer tous types d'applications d'IA.
- 20:32La plateforme prend en charge les paradigmes sans code, low-code et full-code, favorisant la collaboration entre les utilisateurs.
- 20:45Dataiku permet de combiner l'analytique (construction de métriques), le ML prédictif (construction de modèles) et l'IA générative (construction d'agents et de workflows basés sur LLM).
- 21:12L'écosystème de l'IA est en constante évolution, avec de nouvelles technologies et de nouveaux modèles émergeant chaque année.
- 22:12L'innovation rapide dans l'IA peut être source de stress pour les entreprises, qui doivent constamment évaluer et intégrer les nouvelles technologies.
- 22:50Dataiku agit comme un amortisseur en intégrant et en rendant les nouvelles technologies d'IA prêtes pour l'entreprise.
- 24:10Dataiku suit le cycle de vie complet des données, de la préparation au déploiement et à la maintenance des modèles d'IA.
- 25:03L'accent est mis sur la création d'actifs d'IA réutilisables, tels que des métriques, des modèles et des agents, qui peuvent générer de la valeur à long terme pour l'entreprise.
- 25:46Dataiku permet de gérer le cycle de vie complet des actifs d'IA, de l'idéation au déploiement et à la surveillance, au sein d'une plateforme unique.
- 27:14Des capacités de préparation des données robustes sont essentielles au succès des projets d'IA en entreprise, car elles permettent de résoudre les problèmes liés aux données réelles.
- 28:42Dataiku LLM Mesh fournit un environnement pour la création d'agents d'IA générative, en mettant l'accent sur la fourniture des données appropriées et la gestion des cas particuliers.
Explication du maillage LLM de Dataiku, qui fournit un environnement permettant aux entreprises de créer et de gérer des agents d'IA. Discussion sur les défis liés à la gestion des agents d'IA, tels que le contrôle des coûts, la sécurité et la prévention des fuites de données.
Points clés
- 30:18Les entreprises auront besoin d'une plateforme centralisée pour gérer les centaines, voire les milliers d'agents conversationnels basés sur les LLM qu'elles utiliseront.
- 30:34La plateforme devra fournir des fonctionnalités de sécurité pour protéger les LLM contre les attaques et les fuites de données.
- 30:51Le contrôle des coûts sera crucial, car les LLM peuvent être coûteux à exécuter, en particulier à grande échelle.
- 32:51La gestion des données sera essentielle, notamment la mise à jour des données utilisées par les agents pour garantir la pertinence des réponses.
- 32:51La sécurité et la confidentialité des données seront primordiales, et les entreprises devront s'assurer que les LLM ne sont pas utilisés pour diffuser des informations sensibles.
Discussion sur la relation entre les modèles d'apprentissage automatique traditionnels et l'IA générative. Florian Duetto partage son point de vue sur la manière dont ces technologies fonctionneront ensemble à l'avenir, soulignant que l'IA générative ne remplacera pas complètement l'apprentissage automatique.
Points clés
- 36:27L'IA générative ne remplacera pas complètement l'apprentissage automatique traditionnel.
- 36:52L'IA générative excelle dans la création de contenu, mais ne peut pas prendre de décisions stratégiques basées sur des données comme le font les modèles d'apprentissage automatique.
- 39:32L'avenir réside dans l'intégration de l'IA générative et de l'apprentissage automatique au sein de plateformes capables de gérer l'analytique, la prédiction et la génération de contenu.
- 39:02Le contrôle et la gestion des données sont essentiels pour le développement de l'IA, car la qualité des données impacte la fiabilité des modèles.
Florian Duetto donne des exemples concrets de la manière dont les clients de Dataiku utilisent l'IA générative, en mettant l'accent sur les cas d'utilisation au-delà des applications courantes telles que les chatbots. Il souligne l'importance d'automatiser les tâches répétitives et difficiles, permettant aux équipes juridiques et aux opérateurs de gagner en efficacité.
Points clés
- 40:45L'invité travaille avec plus de 700 entreprises, dont Morgan Stanley, Michelin, Novartis et Purdue Farms, qui utilisent l'IA générative.
- 42:13L'engouement pour l'IA générative ne vient pas des applications simples comme les chatbots, mais plutôt des cas d'utilisation intermédiaires.
- 43:51Un exemple d'application réussie est l'utilisation de l'IA par des équipes juridiques pour analyser la brevetabilité et générer des documents, ce qui permet de gagner un temps considérable.
- 45:00Un autre exemple est l'automatisation de la création de rapports quotidiens pour les opérateurs d'usines, ce qui réduit considérablement le temps consacré à cette tâche.
- 46:02L'invité estime que les entreprises vont se transformer en multipliant ces agents d'IA qui automatiseront progressivement les tâches les plus répétitives, permettant aux humains de se concentrer sur des aspects plus créatifs et importants de leur travail.
Discussion sur la future combinaison de modèles d'IA, d'agents et de plateformes dans le paysage de l'IA. Florian Duetto partage sa vision de l'avenir, où les entreprises s'appuieront à la fois sur des solutions d'IA prêtes à l'emploi et sur des automatisations personnalisées. Il souligne le rôle de Dataiku pour aider les entreprises à gérer ce paysage complexe et à créer leurs propres agents d'IA.
Points clés
- 46:33Combinaison de différents types de modèles d'IA, y compris des modèles d'IA génératifs et des agents qui fonctionnent à la fois sur des modèles d'apprentissage automatique prédictifs et des modèles d'IA génératifs.
- 46:44Des fournisseurs proposeront l'IA dans des solutions packagées, à l'instar des entreprises SaaS, et il y aura beaucoup d'automatisation personnalisée développée en interne.
- 47:18Les entreprises devront créer leurs propres agents pour tout ce qui concerne l'assemblage des données d'un fournisseur à l'autre, ou le processus global, ou la chose qu'elles ont réellement construite, c'est-à-dire ce qui les rend différentes.
- 47:37De nombreux agents sont destinés à aider l'entreprise et à aider les gens à prendre les bonnes décisions ou à trouver les bonnes informations pour étayer la décision.
- 48:02Les agents qui pourraient aider une entreprise à être plus intelligente sont, je pense, ceux que de nombreuses entreprises voudront continuer à construire elles-mêmes.
- 48:12Dataiku peut aider tous ses clients à y parvenir.
Florian Duetto donne un aperçu des projets de Dataiku pour l'année à venir, notamment l'intégration de nouveaux modèles et paradigmes d'IA. Il souligne l'importance de rendre l'IA accessible aux entreprises et de les aider à passer de l'expérimentation à la mise en production à grande échelle. La conversation se termine par des réflexions sur le parcours de Dataiku et son impact sur la démocratisation de l'IA.
Points clés
- 48:46Dataiku se concentre sur l'intégration des nouvelles technologies d'IA générative pour les rendre accessibles aux entreprises.
- 49:12De nombreuses entreprises clientes de Dataiku cherchent maintenant à mettre à l'échelle et à maintenir leurs solutions d'IA générative.
- 49:20L'objectif de Dataiku est de rendre l'IA générative concrète et applicable à la vie quotidienne des utilisateurs.
- 49:54Le CEO compare la croissance de Dataiku à l'éducation d'un enfant, soulignant le temps nécessaire pour atteindre la maturité.
- 50:38L'entreprise compte aujourd'hui des centaines de millions de dollars de revenus annuels et 700 entreprises clientes.
- 51:32La croissance de Dataiku lui permet d'attirer les meilleurs talents, ce qui est essentiel pour son succès.
- 52:08Le CEO souligne l'importance d'avoir une équipe solide pour concrétiser la vision de l'entreprise.
Description
In this episode, we sit down with Florian Douetteau, co-founder and CEO of Dataiku, a global category leader in enterprise AI and a fixture on the Forbes Cloud 100 list and in the Gartner Leader Quadrant.
Florian shares his journey from a Parisian student fascinated by functional programming to leading a global enterprise software company. We discuss how Dataiku bridges the gap between technical and business teams to democratize AI in the enterprise, the challenges of selling to enterprise clients, and how Dataiku acts as an orchestration layer for Generative AI, helping businesses manage complex data processes and control AI, so they can build more with AI.
Collaborateur
Format
- Vidéo
Langue(s)
Ce contenu est lié à The MAD Podcast with Matt Turck
Data, machine learning and AI are profoundly transforming the world. Learn about this revolution from the best founders, executives, investors and researchers.
This channel is a series of conversations with leaders in technology hosted by Matt Turck, Partner at FirstMark, a leading early stage venture capital firm based in New York (find us at FirstMark.com).
* The MAD (Machine learning, AI and Data) Podcast is a weekly podcast series. Please subscribe on Apple Podcasts or Spotify, links are below.
* Data Driven NYC is a monthly in-person event, hosted at various locations across New York. If you'd like to attend in person, please follow FirstMark on Eventbrite (link below). Events are free and open to everyone.
