« Un Manifeste pour une Data Science Agile » : différence entre les versions

De Wiki Agile
Ligne 24 : Ligne 24 :
==Le Manifeste de la Data Science Agile==
==Le Manifeste de la Data Science Agile==
===Itérer, itérer, itérer===
===Itérer, itérer, itérer===
La prise de conscience provient de la 25e requête d'une chaîne de requêtes, et non de la première. Les tableaux de données doivent être analysés, formatés, triés, agrégés et résumés avant de pouvoir être compris. Les tableaux pertinents proviennent généralement de la troisième ou quatrième tentative, et non de la première. La construction de modèles prédictifs précis peut nécessiter de nombreuses itérations d'ingénierie des fonctionnalités et de réglage des hyperparamètres. En data science, l'itération est l'élément essentiel de l'extraction, de la visualisation et de la production de la connaissance. Lorsque nous construisons, nous itérons.<br/>
La prise de conscience provient de la 25e requête d'une chaîne de requêtes, et non de la première. Les tableaux de données doivent être analysés, formatés, triés, agrégés et résumés avant de pouvoir être compris. Les tableaux pertinents proviennent généralement de la troisième ou quatrième tentative, et non de la première. La construction de modèles prédictifs précis peut nécessiter de nombreuses itérations d'ingénierie des caractéristiques et de réglage des hyperparamètres. En data science, l'itération est l'élément essentiel de l'extraction, de la visualisation et de la production de la connaissance. Lorsque nous construisons, nous itérons.<br/>
<br/>
<br/>
[[Fichier:Ads-Iterate fr.png|border|600px]]<br/>
[[Fichier:Ads-Iterate fr.png|border|600px]]<br/>
Ligne 43 : Ligne 43 :
<br/>
<br/>
===Ecouter les données===
===Ecouter les données===
Ce qui est possible est aussi important que ce qui est prévu. Ce qui est facile et ce qui est difficile sont aussi importants à connaître que ce qui est désiré. Dans le développement d'applications logicielles, il y a trois perspectives à prendre en compte : celles des clients, des développeurs et de l'entreprise. Dans le développement d'applications analytiques, il y a une autre perspective : celle des données. Sans comprendre ce que les données "ont à dire" sur une fonctionnalité, le propriétaire du produit ne peut pas faire un bon travail. L'opinion des données doit toujours être incluse dans les discussions sur le produit, ce qui signifie qu'elles doivent être fondées sur la visualisation par le biais d'une analyse exploratoire des données dans le cadre de l'application interne qui devient le centre de nos efforts.<br/>
Ce qui est possible est aussi important que ce qui est prévu. Ce qui est facile et ce qui est difficile sont aussi importants à connaître que ce qui est désiré. Dans le développement d'applications logicielles, il y a trois perspectives à prendre en compte : celles des clients, des développeurs et de l'entreprise. Dans le développement d'applications analytiques, il y a une autre perspective : celle des données. Sans comprendre ce que les données "ont à dire" sur une caractéristique, le product owner ne peut pas faire un bon travail. L'opinion des données doit toujours être incluse dans les discussions sur le produit, ce qui signifie qu'elles doivent être fondées sur la visualisation par le biais d'une analyse exploratoire des données dans le cadre de l'application interne qui devient le centre de nos efforts.<br/>
<br/>
<br/>
[[Fichier:Ads-Listen fr.png|600px]]<br/>
[[Fichier:Ads-Listen fr.png|600px]]<br/>
Ligne 56 : Ligne 56 :
<br/>
<br/>
[[Fichier:Ads-pyramid fr.png|800px]]<br/>
[[Fichier:Ads-pyramid fr.png|800px]]<br/>
<small>''La pyramide données-valeur. Figure reproduite avec l'aimable autorisation de Russell Jurney.''</small><br/>
<small>''La pyramide données-valeurs. Figure reproduite avec l'aimable autorisation de Russell Jurney.''</small><br/>
<br/>
La pyramide données-valeurs donne une structure à notre travail. La pyramide est un élément à garder à l'esprit, et non une règle à suivre. Parfois on saute des étapes, parfois on travaille en marche arrière. Si vous introduisez un nouvel ensemble de données directement dans un modèle prédictif en tant que caractéristique, vous contractez une dette technique si vous ne rendez pas cet ensemble de données transparent et accessible en l'ajoutant à votre modèle de données d'application dans les niveaux inférieurs. Vous devez garder cela à l'esprit et rembourser la dette dès que vous en êtes capable.<br/>
<br/>
<br/>
[[Fichier:Ads-Critical path fr.png|600px]]<br/>
[[Fichier:Ads-Critical path fr.png|600px]]<br/>