Le pôle de compétences Humanités Numériques se situe au croisement des sciences dures (mathématique et informatique) et des sciences humaines et sociales. Il met ses compétences en matière de modélisation, de programmation et de géosimulation au service des SHS. Les travaux du pôle relèvent d’une activité de recherche mathématique appliquée.
L’équipe du pôle est constituée de 30 personnes dont 27 maîtres de conférences, ingénieurs et techniciens qui travaillent en étroite collaboration avec le CAPMAS (Central Agency for public mobilisation and Statistics) et la Bibliotheca Alexandrina (BIBALEX). Les principales fonctions du pôle Humanités numériques sont :
1/ le développement d’outils numériques de recherche documentaire pour les scientifiques qui travaillent dans le domaine des humanités, que ce soit le traitement de Big Data ou la cartographie interactive : citons parmi ses réalisations la carte numérique mondiale des zones arides (2018), le portail des archives de presse du CEDEJ (2018), le portail web des sites archéologiques en Egypte ou le portail en préparation cedej-capmas présentant 14 recensements égyptiens (2019).
L’analyse de données massives (Big Data) nécessite des méthodes de traitement mathématique et de nouvelles définitions d’algorithmes et d’outils.
2/ une action de formation : le pôle coordonne depuis 2014 une formation de niveau Master, appelée GIS 4D, sur les techniques d’analyse de données à référence spatiale qui est destinée aux fonctionnaires du CAPMAS (Agence nationale de statistiques) : 10 fonctionnaires formés en 2017.
3/ le soutien à la recherche collective en participant à des projets relevant des sciences sociales, tels le traitement des données électorales, la pollution urbaine, la pauvreté ou encore projet actuel d’Atlas de l’Égypte contemporaine, ou le portail des caricatures de la presse égyptienne
4/ la gestion des ressources documentaires du CEDEJ (bibliothèque et cartothèque)
5/ la supervision des serveurs et de la plate-forme informatiques du laboratoire
En 2018, le pôle a entrepris la sauvegarde de ses bases de données avec la Très Grande Infrastructure de Recherche (TGIR) Huma-Num du CNRS et il sert de laboratoire pilote pour la TGIR PROGEDO- Développer la culture des données afin de diffuser en libre-accès ses bases de données créditées auprès de la communauté de chercheurs.
Responsable : Hala Bayoumi (Prix Cristal du CNRS 2017)
Données et Base de données démographiques
- Les données démographiques contenues n’appartiennent pas au CEDEJ : elles sont la propriété exclusive du CAPMAS. Ces données de base du CAPMAS sont disponibles dans des livres vendus par cette même institution. Le CEDEJ n’est pas autorisé à vendre ces données démographiques.
Le CAPMAS autorise le CEDEJ à exploiter les données démographiques aux conditions suivantes fixées dans une charte d’utilisation des données.
Le CEDEJ s’engage auprès du CAPMAS au respect de ces conditions.
- La base de données démographiques disponible au CEDEJ couvre une période allant de 1882 à 2006. La création de la base de données démographiques, créditée EGIPTE, a été initiée par François Moriconi-Ebrard et Eric Denis en 1993. Ce projet a été ultérieurement poursuivi par Hala Bayoumi.
Le résultat de ce travail de recherche collectif est la publication, en 2003, d’un Cédérom et d’un fascicule sous la direction de Hala Bayoumi, Eric Denis et François Moriconi-Ebrard. Le Cédérom intitulé Le recensement du siècle comprend les données démographiques de la République arabe d’Egypte sur cent ans (1882-1996) et il s’accompagne d’un fascicule Un siècle de recensement – Egypte. Cette publication s’ancre sur le développement d’une application de cartographie interactive.
Le pôle « Humanités numériques » du CEDEJ a poursuivi l’alimentation de cette base de données démographiques avec le recensement de 2006 en effectuant, parallèlement, la mise à jour du géocodage et du géo-référencement. Cette action de recherche est encadrée par une convention de coopération signée depuis 2003 entre le CAPMAS et le CNRS, représenté par le CEDEJ.
Le CEDEJ met gratuitement à disposition des chercheurs des extractions ciblées de la base de données pour un programme de recherche précis, moyennant mention de la source du CEDEJ et une demande raisonnable.
Données électorales
Pour la méthodologie et le traitement des données électorales en Egypte en 2011 (présidentielles) et 2012 (législatives), la responsable du pôle et son équipe ont opéré ainsi au cours d’un travail de deux ans :
- la création d’une base de données électorales (en français) à partir des données électorales brutes collectées sur papier manuscrit (en arabe) auprès des bureaux de vote égyptiens
- des traitements statistiques des données électorales brutes pour les rendre exploitables
- une harmonisation des échelles géographiques différenciées (qism et markaz), cette mise à niveau étant indispensable pour comparer les quatre scrutins (deux tours pour les élections présidentielles et législatives)
- la création d’un nouveau fonds ou découpage cartographique sur lequel on peut faire figurer les données électorales
- la création d’une base de données socio-économiques de l’Egypte à partir des données brutes du CAPMAS (variables)
- une analyse multidimensionnelle (analyse factorielle exploratoire et analyse factorielle confirmatoire) appliquée à la centaine de variables socio-économiques du CAPMAS pour extraire les données utiles à la sociologie ou la géographie électorales.
- la création de 20 paramètres à partir de ces variables CAPMAS (pauvreté, niveau d’éducation, rural/urbain, islamiste, militaire etc.) dans le but d’un croisement avec la base des données électorales législatives et présidentielles
- la corrélation mathématique de toutes les données géolocalisées et géoréférencées pour mesurer l’influence de chaque paramètre sur les résultats électoraux
- la publication des résultats de ces corrélations sous forme de tableaux, graphes ou des cartes (exemple : croisement vote islamiste/rural, vote/niveau d’éducation, taux d’abstention et pauvreté etc.)
Hala Bayoumi, Méthodologie et traitement des données électorales en Egypte en 2011 (présidentielles) et 2012 (législatives) https://hal.archives-ouvertes.fr/hal-01343096
Hala Bayoumi, Election présidentielle 2011-2012 en Egypte : constitution d’une base de données à référence spatiale sur 440 qism et markaz, et traitement des données électorales https://hal.archives-ouvertes.fr/hal-01342873
Hala Bayoumi, responsable du Pôle Humanités Numériques met à disposition la méthodologie et le traitement des données électorales en Egypte (2011 et 2012) pour tout-e étudiant-e et chercheur/se en SHS intéressé-e, qu’il/elle soit politiste, économiste, sociologue ou géographe.
Etudiant-e ou chercheur/se peuvent exploiter les résultats de ces traitements statistiques et mathématiques réalisés au sein du CEDEJ à condition de :
- s’inscrire dans le cadre d’un programme officiel de recherches avec le CEDEJ
- mentionner le crédit CEDEJ dans les publications ultérieures sous la forme de « © CEDEJ »