« Un Manifeste pour une Data Science Agile » : différence entre les versions
De Wiki Agile
Aucun résumé des modifications |
|||
| Ligne 49 : | Ligne 49 : | ||
[[Fichier:Ads-Listen fr.png|600px]]<br/> | [[Fichier:Ads-Listen fr.png|600px]]<br/> | ||
<br/> | <br/> | ||
===Respecter la pyramide des données | ===Respecter la pyramide de la valeur des données=== | ||
La pyramide des données | La pyramide de la valeur des données (figure ci-dessous) est une pyramide à cinq niveaux calquée sur la hiérarchie des besoins de Maslow. Elle exprime la quantité croissante de valeur créée lors de l'affinage des données brutes sous forme de tableaux et de graphiques, suivis de rapports, puis de prévisions, le tout destiné à permettre de nouvelles actions ou à améliorer les actions existantes : | ||
* Le premier niveau de la pyramide données | * Le premier niveau de la pyramide de la valeur des données (les enregistrements) concerne la tuyauterie ; il s'agit de faire circuler un ensemble de données depuis l'endroit où elles sont recueillies jusqu'à celui où elles apparaissent dans une application. | ||
* La couche des graphiques et des tableaux est le niveau où commencent l'affinage et l'analyse. | * La couche des graphiques et des tableaux est le niveau où commencent l'affinage et l'analyse. | ||
* La couche des rapports permet une exploration immersive des données, où l'on peut vraiment en discuter et apprendre à les connaître. | * La couche des rapports permet une exploration immersive des données, où l'on peut vraiment en discuter et apprendre à les connaître. | ||
| Ligne 58 : | Ligne 58 : | ||
<br/> | <br/> | ||
[[Fichier:Ads-pyramid fr.png|800px]]<br/> | [[Fichier:Ads-pyramid fr.png|800px]]<br/> | ||
<small>''La pyramide données | <small>''La pyramide de la valeur des données. Figure reproduite avec l'aimable autorisation de Russell Jurney.''</small><br/> | ||
<br/> | <br/> | ||
La pyramide données | La pyramide de la valeur des données donne une structure à notre travail. La pyramide est un élément à garder à l'esprit, et non une règle à suivre. Parfois on saute des étapes, parfois on travaille en marche arrière. Si vous introduisez un nouvel ensemble de données directement dans un modèle prédictif en tant que caractéristique, vous contractez une dette technique si vous ne rendez pas cet ensemble de données transparent et accessible en l'ajoutant à votre modèle de données d'application dans les niveaux inférieurs. Vous devez garder cela à l'esprit et rembourser la dette dès que vous en êtes capable.<br/> | ||
<br/> | <br/> | ||
===Trouver le chemin critique=== | ===Trouver le chemin critique=== | ||
Pour maximiser nos chances de succès, nous devrions consacrer la majeure partie de notre temps à l'aspect de notre application qui est le plus essentiel à sa réussite. Mais de quel aspect s'agit-il ? Il faut le découvrir par l'expérimentation. Le développement de produits analytiques correspond à la recherche et à la poursuite d'un objectif mouvant.<br/> | Pour maximiser nos chances de succès, nous devrions consacrer la majeure partie de notre temps à l'aspect de notre application qui est le plus essentiel à sa réussite. Mais de quel aspect s'agit-il ? Il faut le découvrir par l'expérimentation. Le développement de produits analytiques correspond à la recherche et à la poursuite d'un objectif mouvant.<br/> | ||