Science des données
La richesse de l’étude des pharmacopées anciennes, notamment de par l’éventail des disciplines impliquées dans le consortium, amène les différents participants à travailler sur des données variées : manuscrits ou remèdes, données botaniques, chimiques, moléculaires, connaissances anciennes, actuelles, et nouvelles…
Ces données sont complexes, volumineuses et présentent des caractéristiques différentes, avec notamment des données temporelles, spatiales, textuelles, chimiques. Il en découle un défi qui est de parvenir à recouper ces données pour répondre aux différents questionnements qui émergent de l’étude pluridisciplinaire des pharmacopées anciennes, nécessitant une expertise dans les données et techniques adaptées à leur traitement. Dans ces conditions, l’apport de la gestion des données, de l’intelligence artificielle et de la visualisation est essentiel, cette quantité d’information ne pouvant être traitées sans une aide informatique.
Ainsi, l’extraction de connaissances vise à exploiter des bases de données afin de révéler des connaissances cachées dans ces données, inconnues auparavant et utiles pour une problématique.
Le processus d’extraction de connaissances comporte différentes étapes et met en jeu différents algorithmes, pour la sélection et la préparation des données, la fouille de données (data mining) proprement dite, la visualisation et l’analyse des résultats.
Ce GT travaillera sur les problématiques d’analyse des données identifiées dans les autres GT, afin de mettre en œuvre des processus d’extraction de connaissances adaptés.


