De l'écrit au numérique
Constituer, normaliser, exploiter des corpus électroniques
Benoit Habert, Cecile Fabre, Fabrice Issac - Collection Informatiques
Résumé
Sommaire :
Des données brutes aux textes utilisables. Les textes gisement d'information. Rendre les textes comparables. Chercher, filtrer, trier. Des nettoyages nécessaires aux balisages incontournables. Constituer et documenter un corpus. Problèmes juridiques. Caractériser les données textuelles. Normaliser. Du codage physique à une représentation logique : SGML. Hypertextes et normes HTML. Combiner les traitements. Motifs, recherches, filtrages. Outils de base. Outils extensibles. Segmenter. Séquences répétées et "attirance" entre mots. Structurer. Grammaire et langage.
L'auteur - Benoit Habert
Docteur de l'universite Denis-Diderot (Paris-VII), Benoit Habert est maitre de conferences a l'ecole normale superieure de Fontenay-Saint-Cloud. Ses recherches portent sur l'emploi des modeles a objet pour la presentation des connaissances linguistiques et sur la programmation a objet. en particulier de CLOS, dans la realisation d'outils logiciels pour le traitement du langage naturel.
Autres livres de Benoit Habert
Caractéristiques techniques
PAPIER | |
Éditeur(s) | InterEditions |
Auteur(s) | Benoit Habert, Cecile Fabre, Fabrice Issac |
Collection | Informatiques |
Parution | 10/05/1998 |
Nb. de pages | 328 |
EAN13 | 9782225829536 |
Avantages Eyrolles.com
Consultez aussi
- Les meilleures ventes en Graphisme & Photo
- Les meilleures ventes en Informatique
- Les meilleures ventes en Construction
- Les meilleures ventes en Entreprise & Droit
- Les meilleures ventes en Sciences
- Les meilleures ventes en Littérature
- Les meilleures ventes en Arts & Loisirs
- Les meilleures ventes en Vie pratique
- Les meilleures ventes en Voyage et Tourisme
- Les meilleures ventes en BD et Jeunesse