« Un Manifeste pour une Data Science Agile » : différence entre les versions

De Wiki Agile
Aucun résumé des modifications
Aucun résumé des modifications
Ligne 11 : Ligne 11 :
<br/>
<br/>
Appliquer des méthodes de développement Agile de logiciels à des projets de data science.<br/>
Appliquer des méthodes de développement Agile de logiciels à des projets de data science.<br/>
<br/>
[[Fichier:Fractal-1832620 1920 crop.jpg|border|400px]]<br/>
  Découvrez [https://www.safaribooksonline.com/library/view/agile-data-science/9781491960103/?_ga=2.187671656.1982994763.1586506705-1376861266.1586506705 Agile Data Science 2.0] pour explorer en profondeur la théorie et la pratique de la data science Agile.<br/>
  Découvrez [https://www.safaribooksonline.com/library/view/agile-data-science/9781491960103/?_ga=2.187671656.1982994763.1586506705-1376861266.1586506705 Agile Data Science 2.0] pour explorer en profondeur la théorie et la pratique de la data science Agile.<br/>
À titre personnel, je pratique la data science Agile, le développement itératif et évolutif d'applications analytiques, depuis une dizaine d'années, bien avant que je ne sache comment l'appeler. En tant que développeur solitaire, il était naturel de faire évoluer de manière itérative le logiciel d'analyse que j'avais construit. Lorsque j'ai rejoint une équipe, je m'attendais à ce que les choses fonctionnent de cette manière. Ce n'était pas le cas.<br/>
À titre personnel, je pratique la data science Agile, le développement itératif et évolutif d'applications analytiques, depuis une dizaine d'années, bien avant que je ne sache comment l'appeler. En tant que développeur solitaire, il était naturel de faire évoluer de manière itérative le logiciel d'analyse que j'avais construit. Lorsque j'ai rejoint une équipe, je m'attendais à ce que les choses fonctionnent de cette manière. Ce n'était pas le cas.<br/>
Ligne 23 : Ligne 25 :
===Itérer, itérer, itérer===
===Itérer, itérer, itérer===
La prise de conscience provient de la 25e requête d'une chaîne de requêtes, et non de la première. Les tableaux de données doivent être analysés, formatés, triés, agrégés et résumés avant de pouvoir être compris. Les tableaux pertinents proviennent généralement de la troisième ou quatrième tentative, et non de la première. La construction de modèles prédictifs précis peut nécessiter de nombreuses itérations d'ingénierie des fonctionnalités et de réglage des hyperparamètres. En data science, l'itération est l'élément essentiel de l'extraction, de la visualisation et de la production de la connaissance. Lorsque nous construisons, nous itérons.<br/>
La prise de conscience provient de la 25e requête d'une chaîne de requêtes, et non de la première. Les tableaux de données doivent être analysés, formatés, triés, agrégés et résumés avant de pouvoir être compris. Les tableaux pertinents proviennent généralement de la troisième ou quatrième tentative, et non de la première. La construction de modèles prédictifs précis peut nécessiter de nombreuses itérations d'ingénierie des fonctionnalités et de réglage des hyperparamètres. En data science, l'itération est l'élément essentiel de l'extraction, de la visualisation et de la production de la connaissance. Lorsque nous construisons, nous itérons.<br/>
<br/>
[[Fichier:Agile-Data-Science fr.png|border|900px]]<br/>
<br/>
[[Fichier:Fractal-1832620 1920 crop.jpg|border|400px]]<br/>
<br/>
<br/>
[[Fichier:Ads-Iterate fr.png|border|600px]]<br/>
[[Fichier:Ads-Iterate fr.png|border|600px]]<br/>
Ligne 42 : Ligne 40 :
[[Fichier:Ads-Meta fr.png|600px]]<br/>
[[Fichier:Ads-Meta fr.png|600px]]<br/>
<br/>
<br/>
[[Fichier:Agile-Data-Science fr.png|border|900px]]