Accueil :
Plateformes
WEBLITT, plateforme du web littéraire
Weblitt est chronologiquement le premier projet réalisé par le consortium qui s’est ensuite consolidé autour du projet LIFRANUM. Les deux projets naissent en effet d’un même constat et d’un même besoin : un continent méconnu existe, immense mais dans sa grande majorité peu parcouru, celui des productions littéraires dites « nativement numériques » relevant non plus de l’âge pionnier de la littérature électronique, mais de l’ère d’abord des sites et des blogs, puis de celle de la massification des usages des réseaux sociaux. Il était donc nécessaire de commencer par un geste d’inventaire, qui donne de la visibilité à ces contenus et les mettre à disposition de diverses communautés, du grand public aux bibliothèques en passant par les chercheurs en humanités numériques.
L’objectif du projet « Weblitt », que l’on peut a posteriori considérer comme la première brique de LIFRANUM, était ainsi de proposer une interface rendant accessibles les productions littéraires nativement numériques, produites sur blogs, sites et réseaux sociaux, actuellement en ligne, dans l’ensemble de l’espace francophone. Sur le plan théorique, le projet Weblitt vise à :
- montrer une francophonie littéraire décentrée, ou polycentrée (réseaux) ;
- sensibiliser à la diversité des formes vivantes de création littéraire: formes brèves sur les réseaux, capsules vidéo, etc. ;
- contrer le mythe de la « révolution numérique » en inscrivant certaines productions dans l’histoire littéraire (formes à contraintes: le haïku, le sonnet) ;
- reconnaître l’émergence de formes neuves polysémiotiques / plurimodales (rapport texte/image/son) ;
- sensibiliser à la possibilité d’une poétique numérique: influence du type de support (notion d’affordance) sur la forme même de la production littéraire.
LIFRANUM, un corpus de littérature numérique
LIFRANUM est un corpus de littérature web crawlé au printemps 2021 et qui contient une très grande part de la production littéraire web francophone. Nous avons mis en œuvre une méthodologie originale d'identification sur le web des productions littéraires. Cette identification a permis d'éditer une collection de racines qui ont servi ensuite à mettre en œuvre un crawl, réalisé à l'aide d'HERITRIX, en maîtrisant les sauts mais en permettant également de crawler en profondeur les sites et blogs. Cette stratégie a permis de recueillir l’ensemble le plus complet possible de sites et blogs reposant sur un projet littéraire et donc publiant des textes à portée littéraire. Le crawl a permis d’identifier le contexte immédiat de cette production.
Ce corpus est envisagé comme étant à la fois un outil de travail pour les scientifiques, un objet patrimonial et culturel. Ce corpus a été évalué et comparé aux propositions formulées par la BNF, qui a mis en place sa propre archive. Il peut être actuellement interrogé en utilisant SOLRWAYBACK qui est un outil permettant à la fois d'interroger en plein texte et en utilisant un système de facettes. Ce dernier permet notamment de formuler des requêtes par domaine, hôte, liens entrant et sortant, etc.
Le corpus LIFRANUM est dévolu à des usages variés ; en effet, l’élaboration des textes, le souci de la langue et du discours, en fait un corpus pour des approches diverses : linguistiques, sociologiques notamment. Des projets sont actuellement en cours pour l’utilisation du corpus dans d’autres perspectives.
Enfin, un travail est en cours pour élaborer un modèle d’indexation reposant sur des traits discursifs et expressifs (indépendamment des thématiques et des auteurs), de façon faire émerger des liens stylistiques et poétiques entre des œuvres a priori éloignées.
► Accéder à la plateforme
Pour avoir accès à l'identifiant et au mot de passe, veuillez contacter alice.pantel@univ-lyon3.fr
Les schémas d'identification et les listes de racines sont disponibles sur l'espace de stockage de même que les crawls effectués.
► Accéder aux fichiers stockées sur humanum-box
COLLECTION LIFRANUM, un moteur de recherche
Un moteur de recherche a été développé pour permettre un accès facilité auprès des membres du projet, non forcément experts des outils informatiques. Celui-ci permet une recherche à base de mots-clefs et propose l’utilisation de filtres pour pouvoir préciser une période temporelle, un type de source ou l’identité d’un auteur.
A la date du 10 octobre 2024, le site est hébergé sur les serveurs de la MSH-LSE.
► Accéder au moteur de recherche