École thématique BIG DATA

Flux d'information et constitution des connaissances scientifiques

 

Responsable : Anouk Barberousse (STL/Université Lille 1)

 

                                                                                                                              

 

Description du projet

Modalités pédagogiques

Programme

Thème des ateliers

 

Inscriptions (du 12 juillet au 6 septembre 2013)

 

Formulaire de préinscription en ligne

 

 

Contacts : Anouk Barberousse

Emmanuelle Jablonski

 

CNRS, Délégation régionale Nord Pas-de-Calais et Picardie

UMR 8163 STL

 

 

 

23 au 26 septembre 2013

 

Université Lille 3

Maison de la Recherche (Bât. F)

 

 

 

 

 

 

 

Description du projet :

Depuis que les ordinateurs ont des capacités de stockage importantes et que les données des appareils de détection et de mesure transitent nécessairement par eux, on observe une augmentation considérable de la quantité des données disponibles pour la recherche. Les expressions de « déluge de données » et « avalanche de données », de même que « big data » sont devenues courantes. Plusieurs domaines de la recherche sont concernés, et en particulier les disciplines issues de la génomique (protéomique, etc., qui élaborent des méthodes d'expérimentation à haut débit) et celles qui étudient le changement climatique (dont la physique de l'atmosphère). Ainsi des problèmes communs se posent-ils à des disciplines fort éloignées, concernant par exemple l'accessibilité des données, leur cohérence lorsqu'elles sont hétérogènes, la pérennité de leur stockage, et plus généralement leur interprétation et leur utilisabilité pour résoudre des questions scientifiques. Un autre aspect concerne le travail en équipe : dans ces domaines, les informaticiens sont souvent des intermédiaires indispensables entre le chercheur et ses données. Cela soulève des questions concrètes d'organisation du travail scientifique, de transmission des informations et des compétences.
Le projet de l'école est d'identifier plus précisément les problèmes soulevés par le caractère gigantesque des masses de données disponibles et d'offrir la possibilité d'un dialogue interdisciplinaire, éclairé par une perspective d'histoire et de philosophie des sciences. En effet, les intervenants de ce domaine auront pour tâche de replacer ces développements récents sur des échelles de temps plus longues et dans la vaste diversité des méthodologies mises en oeuvre dans les différentes branches de la science.

 

Modalités pédagogiques :

Après la journée introductive, les trois autres journées de l'école se dérouleront selon le format suivant :
- le matin, un intervenant fait un exposé qui présente un aspect majeur des big data ; une plage conséquente (d'une heure à une heure trente) est réservée aux discussions avec les participants.
- l'après-midi, les participants se partagent en petits groupes pour travailler collectivement sur des thèmes liés aux big data, qui auront été présentés lors de la première journée. Chaque groupe (de 4 ou 5 participants) choisit un thème, qu'il gardera toute la durée de l'école. L'après-midi du dernier jour sera consacré à la restitution de ce travail collectif, sous forme de projets d'articles.
Des exemples de thèmes pour le travail en atelier se trouvent en annexe de ce programme.

Thèmes des ateliers

Thème A : Problèmes de méthodologie


1. « Data-driven sciences » versus « hypothesis-driven sciences ».
2. Concernant les « data-driven sciences »

Thème B : l’utilisateur face aux données


1. Quantité versus gain épistémique
2. Formats de présentation des données
3. Sélection de données à des fins d’accessibilité cognitive
4. « Les » utilisateurs face aux données

Thème C : Stockage et échange des données


1. Diminution de données
2. Stockage et classification
3. Le problème de la standardisation
4. Partage des données
5. Impact sur les modalités de publication scientifique

Thème D : Particularités disciplinaires