<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Archives des Data Management - Redstone Partners</title>
	<atom:link href="https://redstone-partners.com/category/data-management/feed/" rel="self" type="application/rss+xml" />
	<link>https://redstone-partners.com/category/data-management/</link>
	<description>Un site utilisant WordPress</description>
	<lastBuildDate>Mon, 20 Oct 2025 13:47:48 +0000</lastBuildDate>
	<language>fr-FR</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://redstone-partners.com/wp-content/uploads/2022/03/cropped-cropped-favicon-1-1-32x32.png</url>
	<title>Archives des Data Management - Redstone Partners</title>
	<link>https://redstone-partners.com/category/data-management/</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>Gouvernance des données, comment éviter le chaos?</title>
		<link>https://redstone-partners.com/gouvernance-des-donnees-comment-eviter-le-chaos/</link>
		
		<dc:creator><![CDATA[Armstrong_qp]]></dc:creator>
		<pubDate>Sun, 15 Jun 2025 10:17:00 +0000</pubDate>
				<category><![CDATA[Data Management]]></category>
		<category><![CDATA[data intelligence]]></category>
		<category><![CDATA[direction financière]]></category>
		<guid isPermaLink="false">https://redstone-partners.com/?p=1955</guid>

					<description><![CDATA[<p>La gouvernance des données est essentielle pour que les entreprises puissent tirer le meilleur parti de leurs données tout en assurant leur sécurité et leur conformité. Dans cet article, découvrez tout ce que vous devez savoir sur la data governance. Quel que soit le secteur d&#8217;activité, les données sont devenues essentielles pour les entreprises. Toutefois, [&#8230;]</p>
<p>L’article <a href="https://redstone-partners.com/gouvernance-des-donnees-comment-eviter-le-chaos/">Gouvernance des données, comment éviter le chaos?</a> est apparu en premier sur <a href="https://redstone-partners.com">Redstone Partners</a>.</p>
]]></description>
										<content:encoded><![CDATA[		<div data-elementor-type="wp-post" data-elementor-id="1955" class="elementor elementor-1955" data-elementor-post-type="post">
						<section class="elementor-section elementor-top-section elementor-element elementor-element-144382c elementor-section-boxed elementor-section-height-default elementor-section-height-default" data-id="144382c" data-element_type="section" data-e-type="section">
						<div class="elementor-container elementor-column-gap-default">
					<div class="elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-36827da" data-id="36827da" data-element_type="column" data-e-type="column">
			<div class="elementor-widget-wrap elementor-element-populated">
						<div class="elementor-element elementor-element-2897e80 elementor-widget elementor-widget-text-editor" data-id="2897e80" data-element_type="widget" data-e-type="widget" data-widget_type="text-editor.default">
				<div class="elementor-widget-container">
									<p>La gouvernance des données est essentielle pour que les entreprises puissent tirer le meilleur parti de leurs données tout en assurant leur sécurité et leur conformité. Dans cet article, découvrez tout ce que vous devez savoir sur la <em><strong>data governance</strong></em>.</p><p>Quel que soit le secteur d&rsquo;activité, <strong>les données sont devenues essentielles</strong> pour les entreprises. Toutefois, pour en tirer le meilleur parti, il est primordial de planifier la manière dont elles seront utilisées et de veiller à ce qu&rsquo;elles soient traitées de manière cohérente dans l&rsquo;ensemble de l&rsquo;entreprise.</p><p>Cette planification est essentielle pour garantir la <strong>sécurité et la conformité</strong> avec des réglementations telles que le <strong>RGPD</strong>, mais aussi pour extraire toute la valeur des données collectées et stockées par l&rsquo;entreprise.</p><p>C&rsquo;est d&rsquo;autant plus important à une époque où des technologies comme l<em><strong>&lsquo;IA ou le machine learning</strong> </em>dépendent entièrement de la qualité des données. La gouvernance des données est déjà l&rsquo;une des priorités en termes d&rsquo;initiatives stratégiques pour les organisations de tous les secteurs.</p><p> </p><h2>Qu’est-ce que la gouvernance des données ?</h2><p><br />En termes simples, la gouvernance des données est un ensemble de <strong>principes et de pratiques</strong> visant à garantir la haute qualité des données tout au long de leur cycle de vie.</p><p>Selon le <em>Data Governance Institute</em>, il s&rsquo;agit d&rsquo;un <strong>cadre de travail et de réflexion</strong> destiné à aider les différents gestionnaires de données d&rsquo;une entreprise à identifier et à répondre à leurs besoins en matière de data.</p><p>L&rsquo;institut souligne que les systèmes de gestion des données ne suffisent pas. La gouvernance des données repose sur un ensemble complet de<strong> règles, de processus et de procédures</strong> visant à garantir que ces règles sont suivies de manière cohérente et quotidienne.</p><p><br /><em>Une gouvernance des données efficace garantit que les données sont <strong>cohérentes</strong>, dignes de <strong>confiance</strong> et ne font pas l&rsquo;objet d&rsquo;une utilisation <strong>abusive</strong>. La gouvernance des données est de plus en plus déterminante, car les entreprises font sans cesse face à de nouvelles réglementations en matière de <strong>confidentialité</strong> des données et s&rsquo;appuient de plus en plus sur l&rsquo;analyse de la data pour optimiser leurs activités et prendre de meilleures décisions.</em></p><p> </p><h2>Comment est organisée la gouvernance des données ?</h2><p> </p><p>Un programme de gouvernance des données bien conçu comprend généralement une <strong>équipe de gouvernance</strong>, un comité de pilotage qui fait office d&rsquo;organe directeur et un groupe de personnes chargées de la gestion des données.</p><p>Ils travaillent ensemble pour créer les normes et les principes de gouvernance des données, ainsi que les procédures de mise en œuvre et d&rsquo;application qui sont principalement exécutées par les responsables des données. Idéalement, les <strong>managers</strong> et certains représentants des équipes métiers sont invités à y participer.</p><p> </p><h2>Pourquoi la data governance est-elle si importante?</h2><p> </p><p>Les données sont devenues le principal actif de l&rsquo;entreprise. C&rsquo;est désormais cette ressource qui détermine le<strong> succès ou l&rsquo;échec</strong> d&rsquo;une organisation. Toutes les entreprises ont entamé leur transformation numérique, mais pour exploiter les données, il est aujourd&rsquo;hui essentiel de bien les gérer.</p><p>Il est donc impératif de mettre en place un cadre de gouvernance des données qui soit compatible avec l&rsquo;organisation, ses objectifs et son modèle économique. Ce cadre doit déterminer les <strong>normes de données</strong> requises pour la transformation et répartir les rôles et les responsabilités entre l&rsquo;entreprise et son écosystème.</p><p>Un cadre de gouvernance des données doit soutenir la<strong> transformation digitale</strong> au sein des différents départements de l&rsquo;entreprise. Il doit d&rsquo;abord fournir à la direction un aperçu des données, de leur valeur et de leur impact sur l&rsquo;entreprise.</p><p>En ce qui concerne le <strong>département financier</strong>, la gouvernance des données garantit la cohérence et l&rsquo;exactitude des reportings. Les départements des ventes et du marketing, quant à eux, obtiennent des informations fiables sur les préférences et le comportement des clients.</p><p>En termes de <strong>logistique</strong>, la gouvernance des données permet de réduire les coûts et d&rsquo;améliorer les initiatives d&rsquo;efficacité opérationnelle grâce à l&rsquo;exploration des données et à la collaboration au niveau de l&rsquo;écosystème.</p><p>La gouvernance des données a également un impact direct sur la <strong>production</strong> en permettant le recours à l&rsquo;automatisation.</p><p>Enfin, d&rsquo;un point de vue <strong>juridique</strong>, c&rsquo;est le seul moyen de se conformer à des <strong>réglementations</strong> de plus en plus exigeantes.</p><p><br /><span style="text-decoration: underline;">Sans data governance, c’est le chaos</span></p><p>Sans une gouvernance des données efficace, les <strong>incohérences</strong> entre les différents systèmes d’exploitation d&rsquo;une organisation risquent de ne pas être résolues. Par exemple, les noms des clients peuvent être répertoriés de différentes manières dans le système de gestion des ventes, dans celui du service logistique et dans celui du service client. Les conséquences sont d&rsquo;énormes pertes de temps et des clients insatisfaits.</p><p>Cela va <strong>compliquer</strong> les efforts d&rsquo;intégration des données et créer des problèmes d&rsquo;intégrité des données qui affectent la précision des applications de <em>business intelligence (BI)</em>, de reporting d&rsquo;entreprise et d&rsquo;analyse. En outre, les erreurs de données peuvent ne pas être identifiées et corrigées, ce qui nuit encore à la précision de la BI et des analyses.</p><h2><br />Quel est l&rsquo;objectif de la gouvernance des données?</h2><p> </p><p>La gouvernance des données offre de nombreuses possibilités. Tout d&rsquo;abord, elle permet de prendre des <strong>décisions cohérentes</strong>, fondées sur des données fiables et conformes aux objectifs de l&rsquo;entreprise.</p><p>Cette gouvernance des données permet également de se <strong>conformer</strong> à des réglementations telles que le RGPD, et d&rsquo;éviter ainsi des amendes coûteuses. Il est notamment possible de documenter l&rsquo;origine des données et d&rsquo;en contrôler l&rsquo;accès.</p><p>D&rsquo;autre part, elle permet également d&rsquo;améliorer la <strong>sécurité</strong> des données en établissant la propriété des données et en donnant à chacun ses responsabilités. Les règles de distribution des données peuvent être définies et vérifiées, notamment celles relatives aux rôles des entités internes et externes.</p><p>En outre, la gouvernance des données permet d&rsquo;accroître le <strong>ROI des données</strong> quand celles-ci sont achetées à un acteur externe. Pour pouvoir tirer parti des données, il faut les stocker, les conserver, les classer et les rendre accessibles de manière optimale.</p><p>Les<strong> indicateurs clés de performance</strong> (KPI) liés à la qualité des données peuvent être mesurés par rapport à des indicateurs de performance de portée plus globale au sein de l&rsquo;entreprise.</p><p>Le fait que les données ne doivent pas être systématiquement nettoyées ou transformées permet également une meilleure planification des opérations. Des données fiables et standardisées peuvent également être utilisées, ce qui évite de répéter inutilement des tâches fastidieuses.</p><p>Grâce à des données de qualité, les équipes peuvent également travailler plus <strong>efficacement</strong>. Ce ne sont là que quelques exemples des possibilités offertes par la gouvernance des données.</p><h2><br />Protection des données, confidentialité et data governance</h2><p> </p><p>La protection et la confidentialité des données revêtent une importance croissante. Cela se traduit, par exemple, par l&rsquo;adoption du RGPD (règlement général sur la protection des données) dans l&rsquo;Union européenne.</p><p>Ce changement dans les mentalités a un <strong>impact majeur</strong> sur la gouvernance des données. La confidentialité et la protection des données « par défaut » doivent désormais être intégrées dans les normes et politiques relatives aux données.</p><p>Cela concerne les données des employés ainsi que les données des clients et des tiers. Le responsable des données d&rsquo;une entreprise doit également avoir <strong>une vue d&rsquo;ensemble</strong> sur la manière dont les données sont stockées, qui y a accès et pour quelles raisons.</p><p>Il est essentiel de savoir quand les données personnelles sont traitées et de ne le faire que pour des raisons légitimes et conformément à la législation locale. Cela s&rsquo;applique à l&rsquo;environnement de production et de développement.</p><p><br />Vous souhaitez révéler le vrai potentiel de vos données, mieux les organiser, mieux les exploiter ? Vous souhaitez affiner vos prévisions de ventes par rapport à vos marchés et atteindre un meilleur <em>pricing</em> de vos produits, maîtriser le cycle de vie de vos clients actifs et inactifs, anticiper précisément vos dépenses et achats, contrôler au mieux votre trésorerie, fidéliser vos ressources et prévoir l’évolution de votre masse salariale… ? Contactez-nous ! </p>								</div>
				</div>
					</div>
		</div>
					</div>
		</section>
				<section class="elementor-section elementor-top-section elementor-element elementor-element-01b76a8 elementor-section-boxed elementor-section-height-default elementor-section-height-default" data-id="01b76a8" data-element_type="section" data-e-type="section">
						<div class="elementor-container elementor-column-gap-default">
					<div class="elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-c12b1f1" data-id="c12b1f1" data-element_type="column" data-e-type="column">
			<div class="elementor-widget-wrap elementor-element-populated">
						<div class="elementor-element elementor-element-42d3f4d elementor-widget-divider--view-line elementor-widget elementor-widget-divider" data-id="42d3f4d" data-element_type="widget" data-e-type="widget" data-widget_type="divider.default">
				<div class="elementor-widget-container">
							<div class="elementor-divider">
			<span class="elementor-divider-separator">
						</span>
		</div>
						</div>
				</div>
					</div>
		</div>
					</div>
		</section>
				<section class="elementor-section elementor-top-section elementor-element elementor-element-55c2f33 elementor-section-boxed elementor-section-height-default elementor-section-height-default" data-id="55c2f33" data-element_type="section" data-e-type="section">
						<div class="elementor-container elementor-column-gap-default">
					<div class="elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-b29a20d" data-id="b29a20d" data-element_type="column" data-e-type="column">
			<div class="elementor-widget-wrap elementor-element-populated">
						<div class="elementor-element elementor-element-52682fd elementor-widget elementor-widget-text-editor" data-id="52682fd" data-element_type="widget" data-e-type="widget" data-widget_type="text-editor.default">
				<div class="elementor-widget-container">
									<p><em>Sponsored by IBM</em> </p>								</div>
				</div>
					</div>
		</div>
					</div>
		</section>
				</div>
		<p>L’article <a href="https://redstone-partners.com/gouvernance-des-donnees-comment-eviter-le-chaos/">Gouvernance des données, comment éviter le chaos?</a> est apparu en premier sur <a href="https://redstone-partners.com">Redstone Partners</a>.</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Pourquoi la data transformation est-elle importante pour votre business ?</title>
		<link>https://redstone-partners.com/pourquoi-la-data-transformation-est-elle-importante-pour-votre-business/</link>
		
		<dc:creator><![CDATA[Armstrong_qp]]></dc:creator>
		<pubDate>Fri, 16 Dec 2022 10:16:07 +0000</pubDate>
				<category><![CDATA[Data Management]]></category>
		<category><![CDATA[data intelligence]]></category>
		<category><![CDATA[smart data]]></category>
		<guid isPermaLink="false">https://redstone-partners.com/?p=1981</guid>

					<description><![CDATA[<p>Le volume des données générées et collectées par votre entreprise ne cesse de croître. Ce sont autant d’opportunités de mieux analyser votre environnement, de construire des avantages comparatifs, d&#8217;évaluer certains risques avant la concurrence ou de se projeter plus sereinement dans l’avenir. Mais lorsque les données proviennent de sources trop hétérogènes (applications, programmes, appareils, capteurs…), [&#8230;]</p>
<p>L’article <a href="https://redstone-partners.com/pourquoi-la-data-transformation-est-elle-importante-pour-votre-business/">Pourquoi la data transformation est-elle importante pour votre business ?</a> est apparu en premier sur <a href="https://redstone-partners.com">Redstone Partners</a>.</p>
]]></description>
										<content:encoded><![CDATA[		<div data-elementor-type="wp-post" data-elementor-id="1981" class="elementor elementor-1981" data-elementor-post-type="post">
						<section class="elementor-section elementor-top-section elementor-element elementor-element-a7bc27e elementor-section-boxed elementor-section-height-default elementor-section-height-default" data-id="a7bc27e" data-element_type="section" data-e-type="section">
						<div class="elementor-container elementor-column-gap-default">
					<div class="elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-e40acc5" data-id="e40acc5" data-element_type="column" data-e-type="column">
			<div class="elementor-widget-wrap elementor-element-populated">
						<div class="elementor-element elementor-element-30e9fdc elementor-widget elementor-widget-text-editor" data-id="30e9fdc" data-element_type="widget" data-e-type="widget" data-widget_type="text-editor.default">
				<div class="elementor-widget-container">
									<p>Le volume des <strong>données</strong> générées et collectées par votre entreprise ne cesse de croître. Ce sont autant d’opportunités de mieux analyser votre environnement, de construire des avantages comparatifs, d&rsquo;évaluer certains risques avant la <strong>concurrence</strong> ou de se projeter plus sereinement dans <strong>l’avenir</strong>.</p><p>Mais lorsque les données proviennent de sources <strong>trop hétérogènes</strong> (applications, programmes, appareils, capteurs…), il faut les <strong>transformer</strong>, car le risque d’incompatibilité entre les informations qu’elles contiennent devient trop grand et celles-ci s’avèrent inutiles.</p><p>La <em>data transformation</em> entre alors en jeu. La<strong> transformation des données</strong> permet de rendre plus efficaces les processus d&rsquo;analyse de la data avec pour objectifs ultimes l’atteinte d’un plus haut niveau d’<strong>excellence opérationnelle</strong> et un meilleur <strong>processus de décision</strong> à tous les niveaux de l’entreprise.</p><h2>Qu’est-ce que la data transformation ?</h2><p>La transformation des données est le processus de <strong>modification ou de conversion</strong> des données pour les faire passer d’un format spécifique — tel qu&rsquo;un fichier de base de données, un document XML ou une feuille de calcul Excel — à un autre.</p><p>L&rsquo;un des processus de transformation des données les plus courants consiste à convertir des <strong>données brutes</strong> en une information plus propre, plus épurée dans un format <strong>prêt à l&#8217;emploi</strong> ou compatible avec le système de destination.</p><p>À son niveau le plus élémentaire, le processus de transformation des données convertit les données brutes en supprimant les doublons, en convertissant les types de données et en enrichissant l&rsquo;ensemble des données.</p><p>La data transformation est aussi souvent associée aux processus d’ETL (<em>Extract, Transform, Load</em>) ou ELT <em>(Extract, Load, Transform)</em> pour les environnements Cloud). Pour être précis, la data transformation fait référence à la phase centrale — <em>Transform</em> —- de ces mécanismes avec lesquels vous êtes peut-être déjà familiers :</p><ul><li>la phase d&rsquo;extraction (<em><strong>Extract</strong></em>) consiste à identifier et à extraire les données des différents systèmes sources qui les créent, puis à les déplacer vers un référentiel unique. Ensuite, les données brutes sont nettoyées si nécessaire ;</li><li>elles sont alors converties (<strong><em>Transform</em></strong>) au format cible ;</li><li>puis, ces données sont introduites (<strong><em>Load</em></strong>) dans les systèmes opérationnels dans un data warehouse, un data lake ou un autre référentiel pour être utilisées dans des applications de business intelligence et d&rsquo;analyse.</li></ul><p>NB : Dans le cloud, la phase de transformation intervient au moment de l’utilisation des données, c’est-à-dire en dernier.</p><h2>Quelles formes peut prendre la data transformation ?</h2><p>La <em>data transformation</em> est un élément essentiel du processus de<strong> gestion des données</strong>, qui comprend leur intégration, leur migration, leur stockage et leur préparation. Ce processus peut prendre différentes formes :</p><ul><li>constructive : les données sont ajoutées, copiées ou répliquées ;</li><li>destructive : lorsque des registres et des champs sont supprimés ;</li><li>esthétique : lorsque certaines valeurs sont normalisées ;</li><li>structurelle : ce qui consiste à renommer, déplacer et combiner des colonnes.</li></ul><h2>Pourquoi votre entreprise a-t-elle besoin de transformer ses données ?</h2><p>Les entreprises génèrent quotidiennement une <strong>énorme quantité</strong> de données. Cependant, celles-ci n&rsquo;ont <strong>aucune valeur</strong> si elles ne peuvent pas être utilisées pour générer des <em><strong>insights</strong> </em>à haute valeur ajoutée et stimuler la croissance de l&rsquo;entreprise.</p><p><em>Par exemple, des bases de données pourraient devoir être intégrées à la suite d&rsquo;une acquisition d&rsquo;entreprise, ou transférées vers un data warehouse dans le cloud ou encore fusionnées à des fins d&rsquo;analyse.</em></p><p>L’enjeu de la <em>data transformation</em> réside donc dans la capacité de votre organisation à donner les moyens de <strong>révéler </strong>le vrai potentiel de toutes ses données, même si celles-ci proviennent de sources complètement <strong>hétérogènes</strong>.</p><p>Voici quelques-uns des <strong>bénéfices</strong> que vous allez tirer de la <em>data transformation</em> :</p><ul><li>la transformation consiste à rendre compatibles des ensembles de données disparates, ce qui facilite leur <strong>consolidation</strong> en vue d&rsquo;une analyse approfondie ;</li><li>la <strong>migration</strong> des données est plus facile, car le format source peut être transformé en format cible ;</li><li>le processus de transformation permet également un <strong>enrichissement</strong> qui améliore la qualité des données ;</li><li>la transformation des données facilite la <strong>compatibilité</strong> entre les applications, les systèmes et les types de données.</li></ul><p>L&rsquo;objectif final est de disposer de données cohérentes et accessibles qui fournissent aux organisations des informations et des <a href="https://redstone-partners.com/pourquoi-lanalyse-predictive-est-elle-importante-pour-lavenir-de-votre-entreprise/">prédictions analytiques</a> fiables.</p><h2>Quelles sont les étapes clés de la transformation des données ?</h2><p>Les <em>data analysts</em>, <em>data engineers</em> et <em>data scientists</em> sont généralement chargés de la transformation des données au sein d&rsquo;une entreprise. Ils identifient les données sources, déterminent les formats de données requis et effectuent le mapping des données ainsi que l&rsquo;exécution du processus de transformation proprement dit avant de déplacer les données dans les bases appropriées pour les stocker et les utiliser.</p><p>Leur travail comporte cinq étapes principales :</p><p><strong>la découverte des données</strong>, ou<em> data discovery</em>, au cours de laquelle on utilise des outils de profilage des données ou des scripts de profilage pour comprendre la structure et les caractéristiques des données, mais aussi pour déterminer comment les transformer ;</p><p><strong>le mapping des données</strong> : au cours duquel on fait correspondre les champs de données d&rsquo;une première source aux champs de données d&rsquo;une autre source ;</p><p><strong>la génération du code</strong> : une partie du processus au cours de laquelle le code logiciel nécessaire à la transformation des données est créé (soit par des outils de transformation des données, soit par un expert data lui-même qui rédige un script) ;</p><p><strong>l&rsquo;exécution du code</strong> : au cours de laquelle les données subissent la transformation ;</p><p><strong>la phase d’examen ou de révision</strong> : phase au cours de laquelle les responsables de la data ou les utilisateurs finaux confirment que les données produites répondent aux exigences de transformation préalablement définies et, dans le cas contraire, traitent et corrigent les anomalies et les erreurs.</p><p><em>Pour les organisations qui utilisent des data warehouses sur site (on-premises), ces étapes se situent au milieu du processus <strong>ETL</strong>. Toutefois, les data warehouses évolutifs basés sur le cloud font appel au processus <strong>ELT</strong> pour extract, load, transform : dans ce cas, les entreprises peuvent charger des données brutes directement dans leurs data warehouses, puis transformer les données <strong>avant</strong> de les utiliser.</em></p><h2>Data Transformation : ce qu’il faut retenir</h2><p>Les entreprises ont besoin de données <strong>fiables et exploitables</strong> pour être en mesure d’en tirer un avantage comparatif dans un environnement concurrentiel exacerbé. Elles ont également besoin d<strong>’alimenter leurs systèmes</strong> d’analyse et de prévisions qui utilisent parfois l’intelligence artificielle basée sur des algorithmes de <a href="https://redstone-partners.com/pourquoi-le-machine-learning-est-il-important-pour-votre-business/">machine learning</a>.</p><p>La<strong> transformation des données</strong> joue alors ici un rôle prépondérant, en veillant à ce que la data collectée à partir d&rsquo;un système soit compatible avec celle d&rsquo;autres systèmes et que les données ainsi regroupées ou fusionnées puissent être utilisées à tout moment par le <strong>système</strong> ou l’application qui en a <strong>besoin</strong>.</p>								</div>
				</div>
					</div>
		</div>
					</div>
		</section>
				<section class="elementor-section elementor-top-section elementor-element elementor-element-d46dc14 elementor-section-boxed elementor-section-height-default elementor-section-height-default" data-id="d46dc14" data-element_type="section" data-e-type="section">
						<div class="elementor-container elementor-column-gap-default">
					<div class="elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-53299e5" data-id="53299e5" data-element_type="column" data-e-type="column">
			<div class="elementor-widget-wrap elementor-element-populated">
						<div class="elementor-element elementor-element-7dce791 elementor-widget-divider--view-line elementor-widget elementor-widget-divider" data-id="7dce791" data-element_type="widget" data-e-type="widget" data-widget_type="divider.default">
				<div class="elementor-widget-container">
							<div class="elementor-divider">
			<span class="elementor-divider-separator">
						</span>
		</div>
						</div>
				</div>
					</div>
		</div>
					</div>
		</section>
				<section class="elementor-section elementor-top-section elementor-element elementor-element-da90a35 elementor-section-boxed elementor-section-height-default elementor-section-height-default" data-id="da90a35" data-element_type="section" data-e-type="section">
						<div class="elementor-container elementor-column-gap-default">
					<div class="elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-622fe96" data-id="622fe96" data-element_type="column" data-e-type="column">
			<div class="elementor-widget-wrap elementor-element-populated">
						<div class="elementor-element elementor-element-71f247d elementor-widget elementor-widget-text-editor" data-id="71f247d" data-element_type="widget" data-e-type="widget" data-widget_type="text-editor.default">
				<div class="elementor-widget-container">
									<p><em>Sponsored by IBM </em></p>								</div>
				</div>
					</div>
		</div>
					</div>
		</section>
				</div>
		<p>L’article <a href="https://redstone-partners.com/pourquoi-la-data-transformation-est-elle-importante-pour-votre-business/">Pourquoi la data transformation est-elle importante pour votre business ?</a> est apparu en premier sur <a href="https://redstone-partners.com">Redstone Partners</a>.</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Data lake : quelles sont les bonnes pratiques à adopter pour en tirer parti?</title>
		<link>https://redstone-partners.com/data-lake-quelles-sont-les-bonnes-pratiques-a-adopter-pour-en-tirer-parti/</link>
		
		<dc:creator><![CDATA[Armstrong_qp]]></dc:creator>
		<pubDate>Thu, 20 Oct 2022 14:43:21 +0000</pubDate>
				<category><![CDATA[Data Management]]></category>
		<category><![CDATA[data intelligence]]></category>
		<category><![CDATA[smart data]]></category>
		<guid isPermaLink="false">https://redstone-partners.com/?p=1783</guid>

					<description><![CDATA[<p>Un data lake est une méthode de stockage massive utilisée par le Big Data. Un lac de données est un immense réservoir de données non ou très peu structurées auxquelles il est très facile de faire appel pour les besoins business de l’entreprise. Les data lakes sont les outils parfaits pour stocker et avoir à [&#8230;]</p>
<p>L’article <a href="https://redstone-partners.com/data-lake-quelles-sont-les-bonnes-pratiques-a-adopter-pour-en-tirer-parti/">Data lake : quelles sont les bonnes pratiques à adopter pour en tirer parti?</a> est apparu en premier sur <a href="https://redstone-partners.com">Redstone Partners</a>.</p>
]]></description>
										<content:encoded><![CDATA[		<div data-elementor-type="wp-post" data-elementor-id="1783" class="elementor elementor-1783" data-elementor-post-type="post">
						<section class="elementor-section elementor-top-section elementor-element elementor-element-545ed9a elementor-section-boxed elementor-section-height-default elementor-section-height-default" data-id="545ed9a" data-element_type="section" data-e-type="section">
						<div class="elementor-container elementor-column-gap-default">
					<div class="elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-79cb95d" data-id="79cb95d" data-element_type="column" data-e-type="column">
			<div class="elementor-widget-wrap elementor-element-populated">
						<div class="elementor-element elementor-element-5eba653 elementor-widget elementor-widget-text-editor" data-id="5eba653" data-element_type="widget" data-e-type="widget" data-widget_type="text-editor.default">
				<div class="elementor-widget-container">
									<p>Un <em>data lake</em> est une méthode de stockage massive utilisée par le Big Data. Un lac de données est un immense réservoir de données non ou très peu structurées auxquelles il est très facile de faire appel pour les besoins business de l’entreprise.</p><p>Les <em>data lakes</em> sont les outils parfaits pour<strong> stocker et avoir à disposition</strong> de large volume de <strong>données hétérogènes</strong> accessibles par simple requête.</p><p>Les <a href="https://redstone-partners.com/quest-ce-quun-data-lake-ou-lac-de-donnees/">lacs de données</a> facilitent l&rsquo;accès aux données pour des tâches telles que :</p><ul><li>l&rsquo;analyse de données ;</li><li>le machine learning ;</li><li>la création de rapports ou la visualisation de données.</li></ul><p>Dans cet article, nous mettons en lumière quelques-unes des bonnes pratiques relatives à l’utilisation d’un <em>data lake</em> pour la gestion des données dans une entreprise.</p><h2>Le business avant tout !</h2><p>La mise en place d’un <em>data lake</em> est un projet dont la conception et l’exécution sont entre les mains des équipes Data et IT. Si vous êtes à la tête d’un projet de type <em>data lake</em>, veillez cependant à ne pas perdre de vue les<strong> aspects business</strong> de celui-ci.</p><p>Il est important que le <em>data lake</em> serve au mieux les objectifs de performance et de croissance de l’entreprise. Pour cela, nous vous recommandons de mettre en place :</p><ul><li>des<strong> réunions de cadrage projet</strong> pour définir les objectifs, le pourquoi du projet de <em>data lake</em> ainsi que les priorités de développement ;</li><li>un comité de pilotage réunissant les équipes métiers, IT ainsi que la direction financière ou le CEO (peut-être pas à toutes les réunions).</li></ul><h2>Les points d’attention sur l’architecture de votre data lake</h2><p>Une fois le business et l’IT alignés sur les mêmes objectifs vient l’étape de la définition de l’architecture de votre lac de données.</p><p>Quels sont les différents composants dont vous aurez besoin et à quoi ressemblera la plateforme technique finale ? N&rsquo;oubliez pas qu&rsquo;il s&rsquo;agit d&rsquo;un investissement à long terme et que vous devez donc bien réfléchir à l&rsquo;évolution de la <strong>technologie utilisée</strong>.</p><p>Bien entendu, il se peut que vous n&rsquo;ayez pas toutes les réponses dès le départ et qu&rsquo;il soit nécessaire de procéder à une validation de principe pour gagner en expérience, affiner et apprendre en cours de route.</p><p>Un aspect particulièrement important de votre planification <strong>d’architecture IT</strong> est une bonne stratégie de gestion des données qui inclut la <strong>gouvernance</strong> des données et des métadonnées, et la manière dont vous allez les collecter.</p><h2>Protection et sécurité de vos données au sein du data lake</h2><p>Vous avez besoin d’une stratégie de <strong>protection</strong> des données efficace, surtout si vos données sont partagées avec les différents départements de l’entreprise, voire avec certains intervenants extérieurs ou certains de vos clients.</p><p>La confidentialité et la <strong>sécurité</strong> des données sont essentielles, en particulier pour les données sensibles. Vous devrez peut-être même prévoir des dispositions réglementaires spécifiques dans le cadre de l’utilisation de votre <em>data lake</em>.</p><p>Dernier point relatif à la protection des données : la gestion des <strong>droits d’accès</strong> des différents utilisateurs de l’entreprise. Vous devez par exemple penser à prévoir des moyens d’empêcher certains utilisateurs de partager les données auxquelles ils ont accès avec les collaborateurs qui ont des droits d’accès plus restreints.</p>								</div>
				</div>
					</div>
		</div>
					</div>
		</section>
				<section class="elementor-section elementor-top-section elementor-element elementor-element-3a96e90 elementor-section-boxed elementor-section-height-default elementor-section-height-default" data-id="3a96e90" data-element_type="section" data-e-type="section">
						<div class="elementor-container elementor-column-gap-default">
					<div class="elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-ce2893f" data-id="ce2893f" data-element_type="column" data-e-type="column">
			<div class="elementor-widget-wrap elementor-element-populated">
						<div class="elementor-element elementor-element-925233d elementor-widget elementor-widget-image" data-id="925233d" data-element_type="widget" data-e-type="widget" data-widget_type="image.default">
				<div class="elementor-widget-container">
															<img fetchpriority="high" decoding="async" width="640" height="426" src="https://redstone-partners.com/wp-content/uploads/2022/10/pexels-markus-spiske-2004161-1024x682.jpg" class="attachment-large size-large wp-image-1800" alt="" srcset="https://redstone-partners.com/wp-content/uploads/2022/10/pexels-markus-spiske-2004161-1024x682.jpg 1024w, https://redstone-partners.com/wp-content/uploads/2022/10/pexels-markus-spiske-2004161-300x200.jpg 300w, https://redstone-partners.com/wp-content/uploads/2022/10/pexels-markus-spiske-2004161-768x512.jpg 768w, https://redstone-partners.com/wp-content/uploads/2022/10/pexels-markus-spiske-2004161.jpg 1280w" sizes="(max-width: 640px) 100vw, 640px" />															</div>
				</div>
					</div>
		</div>
					</div>
		</section>
				<section class="elementor-section elementor-top-section elementor-element elementor-element-327a9a6 elementor-section-boxed elementor-section-height-default elementor-section-height-default" data-id="327a9a6" data-element_type="section" data-e-type="section">
						<div class="elementor-container elementor-column-gap-default">
					<div class="elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-9ea20d7" data-id="9ea20d7" data-element_type="column" data-e-type="column">
			<div class="elementor-widget-wrap elementor-element-populated">
						<div class="elementor-element elementor-element-c30d70a elementor-widget elementor-widget-text-editor" data-id="c30d70a" data-element_type="widget" data-e-type="widget" data-widget_type="text-editor.default">
				<div class="elementor-widget-container">
									<h2>Modèle d’E/S* et modèle de gestion de la capacité de stockage du data lake</h2><p>Dans le choix de la plateforme technologique et de son architecture, il faut réfléchir à <strong>l&rsquo;évolutivité</strong> du lac de données. Par exemple, le découplage entre les couches de stockage et de calcul sera-t-il utilisé ? Si oui, quelle sera la couche de stockage permanente ? Les exigences de performance du point de vue de la collecte des données doivent être bien comprises. C&rsquo;est ce qui déterminera la performance du système de stockage et du réseau ainsi que la possibilité de traiter les données dans des délais acceptables.</p><h2>Evaluation des ressources en interne</h2><p>Pour réussir un projet de lac de données, il est indispensable de pouvoir compter sur les <strong>bonnes personnes</strong>. Votre équipe est-elle dimensionnée pour ce type de projet ? Allez-vous devoir embaucher ou faire appel à une aide extérieure ponctuelle ?</p><p>Vous avez besoin <strong>d&rsquo;experts</strong> qui ont une expérience pratique de la création de plateformes de données et qui ont une grande expérience de la gestion et de la gouvernance des données.</p><p>Vous avez également besoin de<em><strong> data scientists</strong> </em>: ce sont eux qui seront les premiers utilisateurs de la plateforme. Vous devez les solliciter pendant la phase de conception, puisque ce sont des parties prenantes et qu&rsquo;il est très important d&rsquo;écouter leurs besoins et la façon dont ils souhaitent utiliser le lac de données lorsqu&rsquo;il sera terminé.</p><h2>Niveau de service attendu par les utilisateurs</h2><p>Pensez également au lac de données du point de vue <strong>SLA (Service Level Agreement)</strong> : quelles sont les exigences de SLA de vos partenaires commerciaux, en particulier en ce qui concerne les applications critiques pour l&rsquo;entreprise (c&rsquo;est-à-dire celles qui ont une incidence directe sur les revenus) ?</p><p>De bons niveaux de SLA sont nécessaires en termes de temps de latence et pour les données intégrées, traitées et transformées de manière récurrente. Pour en revenir à la question des personnes et des compétences, il est essentiel de disposer de personnes ayant l&rsquo;expérience de la gestion de ces environnements afin de constituer une équipe opérationnelle capable de respecter les SLA et de répondre aux exigences de l&rsquo;entreprise.</p><p><strong>Et pour finir : un plan de communication en interne pour populariser votre <em>data lake</em> ?</strong></p><p>Une fois le lac de données en place, comment allez-vous en faire la promotion au sein de l&rsquo;entreprise et recruter de nouveaux utilisateurs ? Pour que l&rsquo;environnement de votre lac de données se développe, vous devez obtenir la participation des différentes parties prenantes de l&rsquo;entreprise et montrer des résultats concrets. Pourquoi ne pas en parler au service RH/communication interne afin de mettre sur pied un plan de communication ?</p><p>Peut-être pourriez-vous en parallèle développer un module de formation en ligne pour faciliter l’apprentissage de l’utilisation de votre data lake auprès de tous les utilisateurs potentiels, même ceux qui travaillent en remote ?</p><p>Comme toute autre plateforme informatique, le succès d’un <em>data lake</em> repose en grande partie sur son adoption par les différents collaborateurs de l’entreprise.</p>								</div>
				</div>
					</div>
		</div>
					</div>
		</section>
				<section class="elementor-section elementor-top-section elementor-element elementor-element-762f64a elementor-section-boxed elementor-section-height-default elementor-section-height-default" data-id="762f64a" data-element_type="section" data-e-type="section">
						<div class="elementor-container elementor-column-gap-default">
					<div class="elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-3053e89" data-id="3053e89" data-element_type="column" data-e-type="column">
			<div class="elementor-widget-wrap elementor-element-populated">
						<div class="elementor-element elementor-element-5801731 elementor-widget-divider--view-line elementor-widget elementor-widget-divider" data-id="5801731" data-element_type="widget" data-e-type="widget" data-widget_type="divider.default">
				<div class="elementor-widget-container">
							<div class="elementor-divider">
			<span class="elementor-divider-separator">
						</span>
		</div>
						</div>
				</div>
					</div>
		</div>
					</div>
		</section>
				<section class="elementor-section elementor-top-section elementor-element elementor-element-1809fb1 elementor-section-boxed elementor-section-height-default elementor-section-height-default" data-id="1809fb1" data-element_type="section" data-e-type="section">
						<div class="elementor-container elementor-column-gap-default">
					<div class="elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-9d64a49" data-id="9d64a49" data-element_type="column" data-e-type="column">
			<div class="elementor-widget-wrap elementor-element-populated">
						<div class="elementor-element elementor-element-5dc5c87 elementor-widget elementor-widget-text-editor" data-id="5dc5c87" data-element_type="widget" data-e-type="widget" data-widget_type="text-editor.default">
				<div class="elementor-widget-container">
									<p><em>Sponsored by IBM </em></p>								</div>
				</div>
					</div>
		</div>
					</div>
		</section>
				</div>
		<p>L’article <a href="https://redstone-partners.com/data-lake-quelles-sont-les-bonnes-pratiques-a-adopter-pour-en-tirer-parti/">Data lake : quelles sont les bonnes pratiques à adopter pour en tirer parti?</a> est apparu en premier sur <a href="https://redstone-partners.com">Redstone Partners</a>.</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Qu’est-ce qu’un data lake (ou lac de données) ?</title>
		<link>https://redstone-partners.com/quest-ce-quun-data-lake-ou-lac-de-donnees/</link>
		
		<dc:creator><![CDATA[Armstrong_qp]]></dc:creator>
		<pubDate>Tue, 11 Oct 2022 13:00:50 +0000</pubDate>
				<category><![CDATA[Data Management]]></category>
		<category><![CDATA[data intelligence]]></category>
		<category><![CDATA[smart data]]></category>
		<guid isPermaLink="false">https://redstone-partners.com/?p=1761</guid>

					<description><![CDATA[<p>La quantité de données numériques double en moyenne chaque année. En 2021, on estime qu’on a produit 79 zettabytes de data, soit 40 fois plus qu’en 2010. Une projection pour 2022 donne 97 zettabytes, et le volume devrait approximativement doubler d’ici 2025. Problème : la plupart de ces données sont non structurées ou semi structurées. [&#8230;]</p>
<p>L’article <a href="https://redstone-partners.com/quest-ce-quun-data-lake-ou-lac-de-donnees/">Qu’est-ce qu’un data lake (ou lac de données) ?</a> est apparu en premier sur <a href="https://redstone-partners.com">Redstone Partners</a>.</p>
]]></description>
										<content:encoded><![CDATA[		<div data-elementor-type="wp-post" data-elementor-id="1761" class="elementor elementor-1761" data-elementor-post-type="post">
						<section class="elementor-section elementor-top-section elementor-element elementor-element-f198817 elementor-section-boxed elementor-section-height-default elementor-section-height-default" data-id="f198817" data-element_type="section" data-e-type="section">
						<div class="elementor-container elementor-column-gap-default">
					<div class="elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-13dacc9" data-id="13dacc9" data-element_type="column" data-e-type="column">
			<div class="elementor-widget-wrap elementor-element-populated">
						<div class="elementor-element elementor-element-235361e elementor-widget elementor-widget-text-editor" data-id="235361e" data-element_type="widget" data-e-type="widget" data-widget_type="text-editor.default">
				<div class="elementor-widget-container">
									<p><br />La quantité de données numériques double en moyenne chaque année. En 2021, on estime qu’on a produit 79 zettabytes de data, soit 40 fois plus qu’en 2010. Une projection pour 2022 donne 97 zettabytes, et le volume devrait approximativement doubler d’ici 2025.</p><p>Problème : la plupart de ces données sont non structurées ou semi structurées. Les stocker et y accéder rapidement est un défi pour nombre d’entreprises. Les data lakes (ou lacs de données) répondent à cette problématique.</p><h2>Qu’est-ce qu’un data lake ?</h2><p>Un <em>data lake</em> est un environnement de données partagé dans son format natif qui comprend plusieurs référentiels et exploite les technologies du Big Data.</p><p>Autrement dit, un lac de données est un <strong>référentiel centralisé</strong> qui vous permet de stocker toutes vos données structurées et non structurées à n&rsquo;importe quelle échelle.</p><p>Vous pouvez <strong>stocker</strong> vos données telles quelles, sans avoir à les structurer au préalable. Par la suite, il est possible d&rsquo;exécuter différents types d&rsquo;analyses, de générer des tableaux de bord ou d&rsquo;alimenter des outils de data-visualisation. Vous mettez ainsi à profit la puissance du Big Data associée aux capacités de calcul des technologies de <em>machine learning</em> pour répondre aux problématiques <strong>business</strong> de votre entreprise.</p><h3><br /><span style="text-decoration: underline;">Un stockage sans contraintes de vos données</span></h3><p>Contrairement à un <em>data warehouse</em> qui vous impose un certain niveau de hiérarchisation des données, un <em>data lake</em> utilise une architecture horizontale plus souple et plus flexible.</p><p>Chaque information présente dans un <em>data lake</em> se voit attribuer un identifiant unique. Elle est taguée avec un ensemble de balises et de métadonnées étendues qui permettent de la retrouver facilement par la suite en effectuant une simple requête (comme on le ferait sur le moteur de recherche Google). Il est donc possible d’isoler rapidement un lot restreint de données pour produire une <strong>analyse</strong> ou un <em>reporting</em>.</p><h3><br /><span style="text-decoration: underline;">Une confusion possible entre data lake et framework Hadoop</span></h3><p>Les lacs de données sont souvent associés et confondus avec le stockage d’objets orienté Hadoop. Dans ce cas, les données d’une entreprise sont d’abord chargées sur la plateforme Hadoop afin que des outils d’exploration et d’analyse des données puissent dans un second temps les exploiter correctement.</p><p>Un <em>data lake</em> est un concept <strong>plus large</strong> : il décrit tout un ensemble de données volumineuses dont le schéma et les exigences ne sont pas définis avant que les données ne soient interrogées.</p><h2>Pourquoi les entreprises utilisent-elles des data lakes ?</h2><p>Les lacs de données sont un élément clé de l&rsquo;architecture data dans de nombreuses organisations. Les entreprises les utilisent principalement comme <strong>plateforme centralisatrice</strong> pour l&rsquo;analyse du Big Data et d&rsquo;autres applications de data science nécessitant de grands volumes de données et impliquant des techniques d&rsquo;analyse avancées, telles que le data mining, la modélisation prédictive et le <em>machine learning</em>.</p><p>Un lac de données fournit un <strong>lieu central</strong> aux data scientists et aux analystes pour rechercher, préparer et analyser celles qui sont pertinentes. Sans lac de données, ce processus est plus compliqué.</p><h2>Quels sont les avantages d’un data lake ?</h2><p><br />Le principal avantage d&rsquo;un lac de données est la centralisation de sources de contenu <strong>disparates</strong>. Une fois réunies (à partir de leurs « silos d&rsquo;information »), ces sources peuvent être combinées et traitées à l&rsquo;aide du Big Data, de recherches et d&rsquo;analyses qui auraient été impossibles autrement. Ces sources de contenu hétérogènes contiennent souvent des informations sensibles qui nécessitent la mise en œuvre de mesures de sécurité appropriées dans le lac de données.</p><h3><br /><span style="text-decoration: underline;">Mécanismes de protection des données et paramétrage des niveaux d’accès</span></h3><p>Dans un data lake, les mécanismes de <strong>sécurité</strong> peuvent être conçus de manière à autoriser l’accès à certaines informations aux utilisateurs du lac de données qui n’ont pas accès aux données source. Ces utilisateurs ont un droit de consultation de l&rsquo;information, mais ne peuvent pas accéder à la source pour des raisons de <strong>confidentialité</strong>.</p><p> </p><h3><span style="text-decoration: underline;">Stockage à long terme des données utiles</span></h3><p>Il se peut également que certaines données ne soient accessibles que sous licence (via un service payant), ce qui empêche certains collaborateurs d’y avoir accès lorsque leur abonnement arrive à échéance et n’est pas renouvelé.</p><p>Un <em>data lake</em> permet de pallier cet inconvénient en stockant pour une <strong>durée illimitée</strong> de précieux lots de données accessibles selon les besoins de chacun.</p><h3><br /><span style="text-decoration: underline;">Enrichissement des données</span></h3><p>Une fois que le contenu se trouve dans le lac de données, il peut être normalisé et <strong>enrichi</strong>. Il peut s&rsquo;agir d&rsquo;extraction de métadonnées, de conversion de format, d&rsquo;augmentation, d&rsquo;extraction d&rsquo;entités, de liens croisés, d&rsquo;agrégation, de dénormalisation ou d&rsquo;indexation.</p><h3><br /><span style="text-decoration: underline;">Extraction au fil de l’eau</span></h3><p><br />Les données sont préparées «<strong> au fur et à mesure des besoins</strong> », ce qui réduit les coûts de préparation de la data par rapport au traitement initial (comme le feraient des data warehouses). Une structure Big Data permet de faire évoluer ce traitement pour inclure les plus grands ensembles de données possible.</p><h3><br /><span style="text-decoration: underline;">La data est accessible partout et par tous</span></h3><p><br />Les utilisateurs de différents départements, potentiellement dispersés dans le monde entier, peuvent avoir un <strong>accès flexible</strong> à un lac de données et à son contenu depuis n&rsquo;importe où. Cela augmente la faculté de réutilisation du contenu et aide les entreprises à <strong>collecter plus facilement</strong> les données nécessaires à la prise de décisions.</p><p><br />L&rsquo;information, c’est le <strong>pouvoir</strong>. Un lac de données place les informations entre les mains d&rsquo;un plus grand nombre de collaborateurs pour faire de l’entreprise un tout plus performant, plus agile et plus innovant.</p>								</div>
				</div>
					</div>
		</div>
					</div>
		</section>
				<section class="elementor-section elementor-top-section elementor-element elementor-element-1b88bd0 elementor-section-boxed elementor-section-height-default elementor-section-height-default" data-id="1b88bd0" data-element_type="section" data-e-type="section">
						<div class="elementor-container elementor-column-gap-default">
					<div class="elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-2bcab00" data-id="2bcab00" data-element_type="column" data-e-type="column">
			<div class="elementor-widget-wrap elementor-element-populated">
						<div class="elementor-element elementor-element-6669c65 elementor-widget elementor-widget-image" data-id="6669c65" data-element_type="widget" data-e-type="widget" data-widget_type="image.default">
				<div class="elementor-widget-container">
															<img decoding="async" width="640" height="427" src="https://redstone-partners.com/wp-content/uploads/2022/10/data-lake-lac-de-donnees-redstone-1024x683.jpg" class="attachment-large size-large wp-image-1768" alt="data lake lac de donnees redstone" srcset="https://redstone-partners.com/wp-content/uploads/2022/10/data-lake-lac-de-donnees-redstone-1024x683.jpg 1024w, https://redstone-partners.com/wp-content/uploads/2022/10/data-lake-lac-de-donnees-redstone-300x200.jpg 300w, https://redstone-partners.com/wp-content/uploads/2022/10/data-lake-lac-de-donnees-redstone-768x512.jpg 768w, https://redstone-partners.com/wp-content/uploads/2022/10/data-lake-lac-de-donnees-redstone-1536x1024.jpg 1536w, https://redstone-partners.com/wp-content/uploads/2022/10/data-lake-lac-de-donnees-redstone-2048x1365.jpg 2048w" sizes="(max-width: 640px) 100vw, 640px" />															</div>
				</div>
					</div>
		</div>
					</div>
		</section>
				<section class="elementor-section elementor-top-section elementor-element elementor-element-e05971f elementor-section-boxed elementor-section-height-default elementor-section-height-default" data-id="e05971f" data-element_type="section" data-e-type="section">
						<div class="elementor-container elementor-column-gap-default">
					<div class="elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-95e751d" data-id="95e751d" data-element_type="column" data-e-type="column">
			<div class="elementor-widget-wrap elementor-element-populated">
						<div class="elementor-element elementor-element-86b2425 elementor-widget elementor-widget-text-editor" data-id="86b2425" data-element_type="widget" data-e-type="widget" data-widget_type="text-editor.default">
				<div class="elementor-widget-container">
									<h2>Quelles sont les différences entre un data lake et un data warehouse ? </h2><p>Voici quelques éléments différenciateurs entre un data lake et l’approche conceptuelle relative au <em>data warehouse</em>.</p><h3><span style="text-decoration: underline;">Un data lake conserve toutes les données </span></h3><p>Lors du développement d&rsquo;un <em>data warehouse</em>, un temps considérable est consacré à l&rsquo;analyse des sources de données, à la compréhension des processus métiers et au paramétrage des données. Le résultat est un modèle de données hautement structuré conçu pour la production de <em>reportings</em> élaborés. </p><p>Une grande partie de ce processus consiste à prendre des décisions sur les données à inclure ou non dans le<em> data warehouse</em>. En général, si les données ne sont pas utilisées pour répondre à des questions spécifiques ou incluses dans un reporting défini, elles seront probablement exclues du data warehouse. Cette opération de sélection a généralement pour but de simplifier le modèle de données et d&rsquo;économiser l&rsquo;espace de stockage coûteux utilisé pour créer le data warehouse.</p><p>En revanche, un lac de données <strong>conserve toutes les données</strong> sans exception : non seulement les données qui sont couramment utilisées, mais aussi celles qui pourraient l’être et même celles qui ne le seront jamais.</p><p>Cette approche est rendue possible parce que le <strong>hardware</strong> d&rsquo;un lac de données est généralement très différent de celui utilisé pour un data warehouse. Faire passer la <strong>capacité</strong> d&rsquo;un lac de données d’un à plusieurs téraoctets ou à des pétaoctets peut se faire à peu de frais, ce qui n&rsquo;est pas le cas avec un data warehouse. </p><h3><span style="text-decoration: underline;">Un lac de données prend en charge tous les types de données</span></h3><p>Les <em>data warehouses</em> sont généralement constitués de données extraites de systèmes transactionnels ainsi que de données quantitatives et des attributs qui les décrivent. Les sources de données non traditionnelles, telles que les logs des serveurs web, les données des capteurs, l&rsquo;activité sur les réseaux sociaux ou les textes et les images, sont largement <strong>ignorées</strong>. </p><p>L&rsquo;approche du lac de données permet de prendre en compte ce type de données <strong>non traditionnelles</strong>. Dans un lac de données, toutes les données sont stockées, quelles que soient leur source et leur structure. Elles sont conservées sous leur forme <strong>brute</strong> et ne sont pas transformées avant d&rsquo;être utilisées. Cette approche est connue sous le nom de Schema on Read par opposition à Schema on Write qui est l&rsquo;approche utilisée dans les <em>data warehouses</em>.</p><h3><span style="text-decoration: underline;">Un seul lac de données pour répondre aux besoins de tous les utilisateurs</span></h3><p>Dans la plupart des organisations, <strong>80 %</strong> ou plus des utilisateurs sont « opérationnels ». Ils veulent disposer de<strong> leurs propres reportings</strong>, consulter leurs KPI ou sélectionner chaque jour le même ensemble de données dans une feuille de calcul et l&rsquo;analyser. Le <em>data warehouse</em> est l&rsquo;outil idéal pour ces utilisateurs, car il est bien structuré et facile à utiliser.</p><p>Parmi les 20 % restants, <strong>19 %</strong> effectuent des <strong>analyses plus poussées</strong> sur ces données. Ils utilisent le data warehouse comme point de départ, mais sont souvent obligés d&rsquo;aller directement puiser dans les répertoires de données originels pour obtenir ce dont ils ont besoin. Ils font parfois également appel à des imports de données externes à l&rsquo;entreprise. Leur outil préféré est le spreadsheet et ils créent de nouveaux rapports qui sont souvent diffusés au sein de toute l&rsquo;entreprise. Le data warehouse est leur source d&rsquo;accès privilégiée aux données, mais ce dernier montre parfois ses <strong>limites</strong>. </p><p>Enfin, les derniers <strong>1 %</strong> des utilisateurs effectuent une analyse approfondie. Ils sont amenés à créer des sources de données entièrement nouvelles sur la base de leurs propres recherches. Ils combinent plusieurs types de données différents et posent de nouvelles questions business. Ces utilisateurs sont en mesure d&rsquo;utiliser le <em>data warehouse</em>, mais ils s&rsquo;en passent souvent car on leur demande des analyses très poussées. Parmi cette typologie d&rsquo;utilisateurs, on retrouve des <strong>data scientists</strong> qui manipulent des outils d&rsquo;analytics sophistiqués qu&rsquo;ils préfèrent souvent alimenter avec de la donnée brute. </p>								</div>
				</div>
					</div>
		</div>
					</div>
		</section>
				<section class="elementor-section elementor-top-section elementor-element elementor-element-61ced6b elementor-section-boxed elementor-section-height-default elementor-section-height-default" data-id="61ced6b" data-element_type="section" data-e-type="section">
						<div class="elementor-container elementor-column-gap-default">
					<div class="elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-5e0eeee" data-id="5e0eeee" data-element_type="column" data-e-type="column">
			<div class="elementor-widget-wrap elementor-element-populated">
						<div class="elementor-element elementor-element-173b2b4 elementor-widget elementor-widget-image" data-id="173b2b4" data-element_type="widget" data-e-type="widget" data-widget_type="image.default">
				<div class="elementor-widget-container">
															<img decoding="async" width="640" height="427" src="https://redstone-partners.com/wp-content/uploads/2022/10/disque-dur-1024x683.jpg" class="attachment-large size-large wp-image-1772" alt="" srcset="https://redstone-partners.com/wp-content/uploads/2022/10/disque-dur-1024x683.jpg 1024w, https://redstone-partners.com/wp-content/uploads/2022/10/disque-dur-300x200.jpg 300w, https://redstone-partners.com/wp-content/uploads/2022/10/disque-dur-768x512.jpg 768w, https://redstone-partners.com/wp-content/uploads/2022/10/disque-dur-1536x1024.jpg 1536w, https://redstone-partners.com/wp-content/uploads/2022/10/disque-dur-2048x1365.jpg 2048w" sizes="(max-width: 640px) 100vw, 640px" />															</div>
				</div>
					</div>
		</div>
					</div>
		</section>
				<section class="elementor-section elementor-top-section elementor-element elementor-element-d77dd95 elementor-section-boxed elementor-section-height-default elementor-section-height-default" data-id="d77dd95" data-element_type="section" data-e-type="section">
						<div class="elementor-container elementor-column-gap-default">
					<div class="elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-75fb945" data-id="75fb945" data-element_type="column" data-e-type="column">
			<div class="elementor-widget-wrap elementor-element-populated">
						<div class="elementor-element elementor-element-5868de3 elementor-widget elementor-widget-text-editor" data-id="5868de3" data-element_type="widget" data-e-type="widget" data-widget_type="text-editor.default">
				<div class="elementor-widget-container">
									<h2><span style="color: var( --e-global-color-text ); font-family: var( --e-global-typography-text-font-family ), Sans-serif; font-weight: var( --e-global-typography-text-font-weight ); font-size: 1rem;">Les data lakes : pour une vision globale et instantanée de votre business</span></h2>
<p>Dans la mesure où les lacs de données contiennent <strong>toutes les informations</strong> et tous les types de données, ils permettent aux utilisateurs d&rsquo;accéder aux données avant qu&rsquo;elles n&rsquo;aient été transformées, nettoyées et structurées. C&rsquo;est la raison pour laquelle les utilisateurs peuvent obtenir des résultats <strong>plus rapidement</strong> que dans le cas du <em>data warehouse</em> traditionnel.</p>
<p>Toutefois, cet accès anticipé aux données a une contrepartie. Le travail habituellement effectué par l&rsquo;équipe de conception du <em>data warehouse</em> ne peut pas être réalisé sur toutes les sources de données pourtant nécessaires pour effectuer les analyses dont les opérationnels ont besoin. Le data lake permet aux utilisateurs d&rsquo;explorer et d&rsquo;utiliser les données à leur convenance, mais le premier niveau d&rsquo;utilisateurs décrit plus haut (les moins expérimentés) ne voudra peut-être pas faire tout ce travail ou n’en aura pas la capacité.</p>
<p>Pour s’assurer qu’ils aient toujours accès à leurs reportings et leurs indicateurs clés de performance, il faudra donc équiper l’entreprise d’un outil de <strong>data visualisation</strong>, ceci afin d’abaisser le niveau de complexité d’accès à la data et à son analyse de manière plus structurée.</p>								</div>
				</div>
					</div>
		</div>
					</div>
		</section>
				<section class="elementor-section elementor-top-section elementor-element elementor-element-41b5333 elementor-section-boxed elementor-section-height-default elementor-section-height-default" data-id="41b5333" data-element_type="section" data-e-type="section">
						<div class="elementor-container elementor-column-gap-default">
					<div class="elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-6d375d8" data-id="6d375d8" data-element_type="column" data-e-type="column">
			<div class="elementor-widget-wrap elementor-element-populated">
						<div class="elementor-element elementor-element-db58d35 elementor-widget-divider--view-line elementor-widget elementor-widget-divider" data-id="db58d35" data-element_type="widget" data-e-type="widget" data-widget_type="divider.default">
				<div class="elementor-widget-container">
							<div class="elementor-divider">
			<span class="elementor-divider-separator">
						</span>
		</div>
						</div>
				</div>
					</div>
		</div>
					</div>
		</section>
				<section class="elementor-section elementor-top-section elementor-element elementor-element-0a2e723 elementor-section-boxed elementor-section-height-default elementor-section-height-default" data-id="0a2e723" data-element_type="section" data-e-type="section">
						<div class="elementor-container elementor-column-gap-default">
					<div class="elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-5b21f53" data-id="5b21f53" data-element_type="column" data-e-type="column">
			<div class="elementor-widget-wrap elementor-element-populated">
						<div class="elementor-element elementor-element-8014b8b elementor-widget elementor-widget-text-editor" data-id="8014b8b" data-element_type="widget" data-e-type="widget" data-widget_type="text-editor.default">
				<div class="elementor-widget-container">
									<p><em>Sponsored by IBM </em></p>								</div>
				</div>
					</div>
		</div>
					</div>
		</section>
				</div>
		<p>L’article <a href="https://redstone-partners.com/quest-ce-quun-data-lake-ou-lac-de-donnees/">Qu’est-ce qu’un data lake (ou lac de données) ?</a> est apparu en premier sur <a href="https://redstone-partners.com">Redstone Partners</a>.</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
