Les Humanités Numériques se situent au croisement des mathématiques appliquées, de l’informatique et des sciences sociales. L’équipe Humanités Numériques est constituée de 30 personnes, dont 27 maîtres de conférences, ingénieurs et techniciens qui travaillent en étroite collaboration avec le CAPMAS (Central Agency for Public Mobilisation and Statistics, Agence nationale de statistiques) et la Bibliotheca Alexandrina (BIBALEX). Le pôle Humanités Numériques :
1/ développe des outils numériques pour les chercheurs en sciences sociales, par exemple le traitement des données massives ou la cartographie interactive. L’équipe a crée une carte numérique mondiale des zones arides (2018), le portail des archives de presse du CEDEJ (2018), le portail web des sites archéologiques en Egypte. Elle travaille sur le portail Cedej-Capmas, qui présente 14 recensements égyptiens.
2/ mène des actions de formation : le pôle coordonne depuis 2014 une formation de niveau Master, GIS 4D, sur les techniques d’analyse de données à référence spatiale pour les fonctionnaires du CAPMAS.
3/ participe à des projets relevant des sciences sociales, tels le traitement des données électorales, la pollution urbaine, la pauvreté ou encore l’Atlas de l’Égypte contemporaine et le portail des caricatures de la presse égyptienne.
4/ gère les ressources documentaires du CEDEJ (bibliothèque et cartothèque).
5/ supervise les serveurs et la plate-forme informatiques du CEDEJ.
En 2018, le pôle a entrepris la sauvegarde de ses bases de données grâce à la Très Grande Infrastructure de Recherche (TGIR) Huma-Num du CNRS. Il sert de laboratoire pilote pour la TGIR PROGEDO Développer la culture des données, pour diffuser en libre-accès ses bases de données.
Responsable : Hala Bayoumi (Prix Cristal du CNRS 2017)
Données et Base de données démographiques
- Les données démographiques contenues n’appartiennent pas au CEDEJ : elles sont la propriété exclusive du CAPMAS. Ces données de base du CAPMAS sont disponibles dans des livres vendus par cette même institution. Le CEDEJ n’est pas autorisé à vendre ces données démographiques.
Le CAPMAS autorise le CEDEJ à exploiter les données démographiques aux conditions suivantes fixées dans une charte d’utilisation des données.
Le CEDEJ s’engage auprès du CAPMAS au respect de ces conditions.
- La base de données démographiques disponible au CEDEJ couvre une période allant de 1882 à 2006. La création de la base de données démographiques, créditée EGIPTE, a été initiée par François Moriconi-Ebrard et Eric Denis en 1993. Ce projet a été ultérieurement poursuivi par Hala Bayoumi.
Le résultat de ce travail de recherche collectif est la publication, en 2003, d’un Cédérom et d’un fascicule sous la direction de Hala Bayoumi, Eric Denis et François Moriconi-Ebrard. Le Cédérom intitulé Le recensement du siècle comprend les données démographiques de la République arabe d’Egypte sur cent ans (1882-1996) et il s’accompagne d’un fascicule Un siècle de recensement – Egypte. Cette publication s’ancre sur le développement d’une application de cartographie interactive.
Le pôle « Humanités numériques » du CEDEJ a poursuivi l’alimentation de cette base de données démographiques avec le recensement de 2006 en effectuant, parallèlement, la mise à jour du géocodage et du géo-référencement. Cette action de recherche est encadrée par une convention de coopération signée depuis 2003 entre le CAPMAS et le CNRS, représenté par le CEDEJ.
Le CEDEJ met gratuitement à disposition des chercheurs des extractions ciblées de la base de données pour un programme de recherche précis, moyennant mention de la source du CEDEJ et une demande raisonnable.
Données électorales
Pour la méthodologie et le traitement des données électorales en Egypte en 2011 (présidentielles) et 2012 (législatives), la responsable du pôle et son équipe ont opéré ainsi au cours d’un travail de deux ans :
- la création d’une base de données électorales (en français) à partir des données électorales brutes collectées sur papier manuscrit (en arabe) auprès des bureaux de vote égyptiens
- des traitements statistiques des données électorales brutes pour les rendre exploitables
- une harmonisation des échelles géographiques différenciées (qism et markaz), cette mise à niveau étant indispensable pour comparer les quatre scrutins (deux tours pour les élections présidentielles et législatives)
- la création d’un nouveau fonds ou découpage cartographique sur lequel on peut faire figurer les données électorales
- la création d’une base de données socio-économiques de l’Egypte à partir des données brutes du CAPMAS (variables)
- une analyse multidimensionnelle (analyse factorielle exploratoire et analyse factorielle confirmatoire) appliquée à la centaine de variables socio-économiques du CAPMAS pour extraire les données utiles à la sociologie ou la géographie électorales.
- la création de 20 paramètres à partir de ces variables CAPMAS (pauvreté, niveau d’éducation, rural/urbain, islamiste, militaire etc.) dans le but d’un croisement avec la base des données électorales législatives et présidentielles
- la corrélation mathématique de toutes les données géolocalisées et géoréférencées pour mesurer l’influence de chaque paramètre sur les résultats électoraux
- la publication des résultats de ces corrélations sous forme de tableaux, graphes ou des cartes (exemple : croisement vote islamiste/rural, vote/niveau d’éducation, taux d’abstention et pauvreté etc.)
Hala Bayoumi, Méthodologie et traitement des données électorales en Egypte en 2011 (présidentielles) et 2012 (législatives) https://hal.archives-ouvertes.fr/hal-01343096
Hala Bayoumi, Election présidentielle 2011-2012 en Egypte : constitution d’une base de données à référence spatiale sur 440 qism et markaz, et traitement des données électorales https://hal.archives-ouvertes.fr/hal-01342873
Hala Bayoumi, responsable du Pôle Humanités Numériques met à disposition la méthodologie et le traitement des données électorales en Egypte (2011 et 2012) pour tout-e étudiant-e et chercheur/se en SHS intéressé-e, qu’il/elle soit politiste, économiste, sociologue ou géographe.
Etudiant-e ou chercheur/se peuvent exploiter les résultats de ces traitements statistiques et mathématiques réalisés au sein du CEDEJ à condition de :
- s’inscrire dans le cadre d’un programme officiel de recherches avec le CEDEJ
- mentionner le crédit CEDEJ dans les publications ultérieures sous la forme de « © CEDEJ »