Passer aux informations produits
1 de 1

De l'écrit au numérique

De l'écrit au numérique

  • Livre Grand Format
  • En français Français
Etat des produits
Prix habituel 2,55 €
Prix habituel 3,19 € Prix promotionnel 2,55 €
Promo

Livraison à 2,49€ en point-relais. Gratuite dès 25 €

Expédition sous 24/48h | Jour ouvré
Garantie 30 jours
Satisfait ou remboursé sous 30 jours. Retour simple et rapide.
Paiement sécurisé
  • American Express
  • Apple Pay
  • Cartes Bancaires
  • Mastercard
  • PayPal
  • Visa

Un achat engagé

  • Soutenez une coopérative à but non lucratif
  • Produit collecté, stocké et traité en France
  • Articles d'occasion contrôlés
Afficher tous les détails
  • Description

    Internet donne accès à un gisement considérable de connaissances sous forme électronique. Ce gisement est cependant rarement utilisable directement : il faut nettoyer les données textuelles disponibles et les ramener aux standards des documents électroniques (SGML, HMTL, etc.). Cet ouvrage présente les critères à prendre pour constituer un corpus électronique représentatif. Il montre également comment le normaliser et comment l'exploiter. Mis au point et testé dans le cadre d'une formation professionnelle, cet ouvrage forme aux outils standard qui permettent de filtrer les données (grep), d'opérer des transformations simples (sed), de travailler sur des tableaux (awk), de segmenter (lex) et de structurer les textes (yace) ou d'appliquer des traitements arbitrairement complexes (perf). Un CD-Rom d'accompagnement permet de se familiariser avec ces notions en travaillant sur un corpus d'entraînement à l'aide des outils présentés. Ces manipulations et de nombreux exercices corrigés, conduisent à une maîtrise effective de ces techniques. Cette formation pratique est complétée par la présentation des concepts (langages réguliers, automates...) et des standards (SGML, HTML, ISO-Latin) dont la connaissance est indipensable dans le domaine en pleine expansion des corpus électroniques.

    Source : Masson
  • Caractéristiques