Gael le Chauff de Kerguenec

1998 - 1999

CV

CV

 

 

PROJET LINGUISTIQUE

DE

RESUME AUTOMATIQUE PAR SELECTION DE PHRASES

 

 

 

Introduction :

Schéma général :

1. L’étude du titre : sémantique du texte

1.1 Recherches sur les lexèmes du titre : établissement d’un champ lexical

1.11 Les dérivés sémantiques des mots du titre

1.12 Les dérivés grammaticaux des mots du titre

1.2 Etude syntaxique du titre

2. La structure du texte : Démarche de la recherche

2.1 Les squelettes phrastiques, syntagmatiques et propositionnels :

2.11 Les constructeurs par défaut :

2.12 Le système de squelettes :

2.121 La banque de modèles :

2.122 La structure des squelettes :

3. Modèles de squelettes

Construction de modèles étiquetés :

3.1 Nomenclature :

3.2 Schéma d’insertion des squelettes

3.3 Modèles syntaxiques : proposition (P1, P2, [...], Pn)

énoncé assertif descriptif :

énoncé détaillant

3.4 Modèles phrastiques

énoncé argumentatif :

3.5 Modèles textuels

3.6 Structures de textes

Sensibilité de la détection :

Interprétation des indices : les énoncés qu’ils favorisent

Les temps et rapports de temps :

Les constructeurs par défaut : articles, adverbes,...

Mouvements des différents types d’article et hiérarchie en vue d’une sélection :

polémique :

informatif :

article d’exposition :

Schéma d’algorithme d’analyse des textes :

Production des résumés : évaluation des choix de phrases d’après leurs indices d’étiquetage

Texte 1 : assimilé à un modèle de textes du type " article d’exposition "

L’économiste, l’ingénieur et le médecin : résumé

Texte 2 : assimilé à un modèle de textes du type " article d’exposition "

La finance en première ligne : résumé

Texte 3 : assimilé à un modèle de textes du type " informatif "

Les plantes transgéniques modifient la flore microbienne du sol : résumé

Texte 4 : assimilé à un modèle de textes du type " polémique "

Front national : des mots pour faire mal : résumé

Conclusion :

1. Perspectives :

2.Difficultés :

3. Implémentation et résultats :

Bibliographie :

Articles :

Ouvrages :

Introduction :

Le travail suivant part du postulat qu’il existe des indices sémantiques stables qui ont un paradigme sémantique défini dont on peut utiliser la liste exhaustive.

Le choix sémantique ne dépend que du rapport qu’ont ces éléments les uns par rapport aux autres dans la phrase indépendamment du sujet traité.

Dans la perspective de ce projet, ils seront appelés des constructeurs par défaut car ils permettent d’échafauder le texte en gardant par défaut l’une des significations qui leur sont propres.

Ensuite, il s’agit de rechercher des similitudes pour en déduire des modèles textuels ; la même démarche suit pour les phrases et les syntagmes.

Ces modèles obtenus, ils pourraient avoir deux applications :

- la génération de texte à partir d’une base d’entrée de thèmes

- l’analyse de texte par comparaison à des modèles et le travail sur le texte par transformation de ces modèles

Sur de nombreux points, cette méthode suit celle de l’exploration contextuelle, surtout lors de l’étiquetage sémantique des structures emboîtables, pour la recherche de marqueurs pertinents, pour les noms d’étiquettes (annonce thématique,...), l’importance de la position dans le paragraphe pertinent, le classement des types d’indices.

 

 

 

 

Organisation des recherches

 

 

Schéma général :

 

1. L’étude du titre : sémantique du texte

 

1.1 Recherches sur les lexèmes du titre : établissement d’un champ lexical

1.11 Les dérivés sémantiques des mots du titre

Les liens de connotation en langue : " le diasystème "

Reconnaissance d’un sème à travers ses différences diasystémiques :

Par concordance des domaines on essaye d’éviter d’engendrer des contresens de champ d’investigation.

1.12 Les dérivés grammaticaux des mots du titre

Cette recherche permet l’utilisation de l’étiquette " mot clé " qui peut jouer lors d’un choix d’étiquetage de la phrase.

 

1.2 Etude syntaxique du titre

La modalité : interrogation, exclamation, phrase nominale, énumération,...

Elle peut être un indice de la tendance du texte : exposition, comparaison, et peut favoriser un schéma sémantique du texte si plusieurs sont possibles.

L’adéquation de la forme syntaxique d’un texte avec un squelette de phrase peut donner des indices sur la valeur des mots clés en contexte :

exemple : étude des titres des textes étudiés et des modèles suggérés :

Evocation d’un thème dans un domaine

La

finance

en

première

ligne

Thématisation

Thème

appartenance

 

domaine

Fait : d’un sujet un objet

Les

plantes

transgéniques

modifient

 

 

agent

caractérise l’agent

action

 

la

flore

microbienne

du

sol

 

patient

caractérise le patient

caractérise le

patient

Définition d’un thème :

Front

national

:

des

thème

caractérise le thème

introduit une définition

 

mots

pour

faire

mal

définition

introduit un but

but de la définition

 

Enumération, comparaison : 3 thèmes juxtaposés :

L’économiste

,

l’ingénieur

et

le médecin

thème 1

juxtapose

thème 2

coordonne

thème 3

Les phrases à mots clés rentreront dans des schémas plus favorables si les informations du titre permettent de préférer une possibilité à une autre.

 

2. La structure du texte : Démarche de la recherche

 

2.1 Les squelettes phrastiques, syntagmatiques et propositionnels :

Ils sont obtenus par la compositions de mots clés et de constructeurs par défaut.

 

2.11 Les constructeurs par défaut :

On considère comme constructeurs par défaut les parties n’ayant une amplitude polysémique réduite qu’à ses différentes acceptions répertoriées. Ces mots prennent en contexte un de leurs sens prédéfinis mais dépendent peu des présupposés de discours.

Les parties de discours concernées sont les suivantes classées dans le sens d’une prédicativité croissante :

ou des locutions voire des propositions idiomatiques

A cette liste on peut ajouter les informations véhiculées par les grammèmes (ces informations peuvent aider à retrouver les liens anaphoriques) :

Enfin on ajoute à partir des données de l’étude du titre la notion de mot clé associé de son rôle observé dans le titre.

Exemple à partir des premières phrases du texte : L’économiste, l’ingénieur et le médecin

Le

nom

adjectif

se

verbe

part passé

en

permanence

à

des

nom

adjectif

ou

à

des

nom

adjectif

qui

verbe

aussi

bien

les

nom

que

la

nom

adjectif

description + comparaison

 

 

Pour

y

infinitif

nom

,

le

nom

est

alors

tout

naturellement

de

infinitif

à

un

nom

du

nom

adjectif

,

à

l’

nom

de

ce

que

l’on

verbe

dans

le

nom

de

la

nom

ou

de

la

nom

 

 

but (renvoi anaphorique) + solution + appartenance + comparaison

 

2.12 Le système de squelettes :

Ils sont construits en fonction de l’agencement des constructeurs par défaut et des lexèmes et à l’aide de squelettes de structures sémantiques types préétablies.

La comparaison entre les squelettes des phrases du texte étudié et les modèles étiquetés permet d’établir des " synonymies " structurales.

 

2.121 La banque de modèles :

Elle est à double entrée :

D’une part des squelettes types, composés :

D’autre part correspondant à chaque squelette type une étiquette décrivant son rôle dans l’argumentation :

Constatation d’un fait

Assertion

Conséquence : indique le résultat d’un fait

Confirmation : assertion ajoutée, précision

Consécution : indique plus le rapport que le résultat

Exposition

Commentaire : avec des marques de l’interprétation d’auteur

Adage (ou maxime, précepte... avec les parques caractéristiques)

Nuance

Illustration

Explication

Explicatif : comprend faits, raisonnement, explication

Projet : assertion annonce (souvent au futur)

Affirmation : asserte comme une vérité générale

Conclusion : favorisée en fin de §

Exemple d’un modèle d’étiquetage concernant l’incipit de l’article : L’économiste, l’ingénieur et le médecin :

phrase 1 { Problème posé : mot clé " système économique "

phrase 2 { Solution : spécialiste

{ comparaison : technologie & santé

phrase 3 { Nuance : constat : efficace

phrase 4  { raisons : comparaison : En amont - assertion 1

En aval - assertion 2

L’analyse ci-dessus expose un schéma type qui pourrait être détecté pour ce texte mais ne rentre pas dans l’analyse précise des squelettes de phrases.

La notion de comparaison peut être favorisée par l’étude préalable du titre de ce texte comme nous l’avons vue plus haut.

On peut établir une hiérarchie des types de rapports discursifs :

Cette hiérarchie donne une idée du résumé par sélection du degré de conservation des idées essentielles en allant vers les idées plus annexes.

2.122 La structure des squelettes :

Une phrase peut constituer un squelette en soi où être composée de plusieurs structures de modèles concaténés linéairement ou imbriqués les uns dans les autres.

 

 

3. Modèles de squelettes

 

a. Modèles étiquetés

Construction de modèles étiquetés :

 

3.1 Nomenclature :

 

3.2 Schéma d’insertion des squelettes

 

3.3 Modèles syntaxiques : proposition (P1, P2, [...], Pn)

 

énoncé assertif descriptif :

du nom N énumération des ¹ symboles : " tel sujet "

nom + déterminant

,

n fois

syntagme nom

verbe

autre nom de N

 

autres noms de N

N

 

" tel sujet " : syntagme nom

0 à n déterminants

nom

0 à n déterminants

 

assertion " a telle caractéristique "

" tel sujet "

verbe

syntagme nom

 

rapport

caractéristique

 

énoncé détaillant

* circonstanciel de temps

adverbe de temps

syntagme nom

,

 

 

le paradigme des adverbes de temps : {depuis, après, ...}

 

3.4 Modèles phrastiques

 

énoncé argumentatif :

* nuance

pourtant

,

circonstanciel marqué

,

" tel sujet "

" a telle caractéristique "

le paradigme de " pourtant " : {cependant, néanmoins, pour autant, toutefois, mais}

observations mises en parallèles

" tel sujet "

" a telle caractéristique "

,

" tel sujet "

" a telle caractéristique "

 

 

 

justification

P1

:

P2

justification

P1

puisque

P2

paradigme de puisque : {pour la (simple, bonne) raison que, car, ...}

 

3.5 Modèles textuels

consécution

P1

 

aussi

pronom 1 ou 2

verbe

paradigme de aussi {donc, par conséquent, d’où, ...}

[...].

En effet

Pn

paradigme de " en effet " {...}

 

3.6 Structures de textes

sont indiqués entre guillemets les indicateurs majeurs d’un type de rapport

 

b. Le paragraphe

Le paragraphe peut déjà permettre de circonscrire le champ de recherches de ces super structures en considérant que le changement de paragraphe marque les différents mouvements de pensée.

Des indices structuraux favorisés par la position dans le paragraphe :

on note la récurrence privilégiée de procédés, de marques signalant l’ouverture et la clôture d’un paragraphe.

Au début :

L’ouverture du paragraphe est marquée très souvent par une disjonction spatiale, temporelle ou actorielle dans les textes narratifs, une disjonction thématique dans les autres textes. D’où la présence des marques linguistiques suivantes :

- indicateurs spatio-temporaux

exemple : trois jours plus tard, le lendemain, non loin de là, plus loin...

signalant un changement de lieu ou de temps.

- changement ou introduction de nouveaux noms (propres ou communs), manifestant l’apparition de nouveaux actants.

- anaphoriques, rappelant le thème du paragraphe antécédent.

Très souvent, après le recours massif à des substituts pronominaux dans le paragraphe qui précède, on rethématise notamment par renomination avec souvent des reprises démonstratives.

Exemple : de renomination dans l’article : Front national : des mots pour faire mal :

- connecteurs logiques déterminant les étapes successives d’une argumentation construite dans le cadre d’une schématisation dérivée

Exemple : d’abord... ensuite... de plus... enfin...

- procédés de reprises metatextuels, marque de redondance, explicitant le passage d’un thème à un autre.

Exemple : cela dit, pour autant, après avoir... considérons à présent..., s’il est vrai que... en revanche...

- rupture de temps verbaux liée par exemple au passage d’une séquence narrative à une séquence descriptive ou l’inverse.

- marqueurs de sériation, qui extraient un élément d’un ensemble (en ce qui concerne..., pour ce qui est de..., quant à) dans le cadre d’une progression thématique dérivée.

A la fin du paragraphe :

La clôture du paragraphe est marquée par la présence fréquente de termes récapitulatifs, conclusifs, qui signalent la saturation relative du thème développé. La dernière phrase pourra être amorcée par des petits mots comme " enfin " marquant l’épuisement d’une liste, comme " donc ", " par conséquent ", " en conséquence " ¼ exprimant la consécution ou la déduction, des marqueurs d’illustration " ainsi ", " par exemple " ou des marqueurs de reformulation " c’est-à-dire ", " autrement dit " ¼ qui saturent, les uns et les autres, l’explication engagée.

Dans la majorité des cas, le paragraphe finit sur deux types de phrase :

La composition des paragraphes :

Le but est ici de définir des règles d’organisation interne du paragraphe pour parvenir au principe d’une grammaire du paragraphe analogue à celle de la phrase qui nous permettra d’établir des squelettes sémantiques à l’échelle du paragraphe à partir de la composition de squelettes phrastiques. Classement d’après les paramètres de Longacre :

Les paragraphes se répartissent en deux catégories :

- paragraphes de base à structure binaire, close (2 phrases)

- paragraphes à structure ouverte, à constituants multiples (plus de 2 phrases)

Ces derniers pouvant être analysés comme une combinaison des paragraphes de base.

Longacre distingue 5 types de relation entre les constituants immédiats d’un paragraphe binaire qui permettent de classer les paragraphes en familles.

A - les relations de conjonction

ex. : - le paragraphe antithétique (A ¹ B)

- le paragraphe restrictif (A cependant B)

-- le paragraphe alternatif (ou A ou B)

-- la paragraphe coordinatif (A et B) : les éléments coordonnés sont d’égale importance

B - les relations temporelles (A puis B)

C - les relations logiques

ex. : - le paragraphe explicatif - justificatif (B ¬ A) : le résultat est plus important que la cause

- le paragraphe consécutif - déductif (A ® B) : la conclusion est plus importante que la prémisse

- le paragraphe concessif (B ¬ A) : le rapport prévaut sur les propositions

A partir de la combinatoire de ces structures sémantiques on peut caractériser des grands types de paragraphes propres à l’argumentation de certains styles de textes à visée polémique, informative, définitoire, descriptive,... dont il reste à repérer des structures récurrentes permettant d’en construire un modèle globale.

D - Différentes composantes des types de paragraphes ci-dessus :

Exemple : avec en gras les indices saillants et à droite l’étiquette sémantique qu’ils favorisent.

R.Monory : circulaire ministérielle à l’adresse des instituteurs :

Madame,

§ explicatif

Compte tenu des débats provoqués par la mise en place des maître-directeurs,

rappel d’un fait

j’ai pensé utile de m’adresser directement à vous,

conséquence

pas nécessairement pour vous convaincre, mais assurément pour vous informer

but

 

§ consécutif

Une large concertation a eu lieu sur ce projet (...). Les projets initiaux ont été modifiés

rappel de faits

pour tenir compte des suggestions (...).

but des faits

Le texte définitif est conforme à l’avis émis par le Conseil d’état.

Assertion (résultat)

 

§ consécutif

Votre activité professionnelle n’est pas modifiée par cette mesure :

rappel de faits

vous continuerez à être... à garder votre ...

Assertion (résultat)

 

§ consécutif

Votre métier est suffisamment valorisé, tant sur le plan moral que sur le plan matériel. J’ai fait inscrire 860 millions supplémentaires,

rappel de faits

pour la revalorisation (nom) des traitements

but des faits

et j’espère pouvoir faire un effort comparable ou accru en 1998.

projet

Dorénavant, un maître-directeur bénéficiera de... pour le calcul de sa retraite.

Assertion (annonce)

 

§ consécutif

Un instituteur sur sept est actuellement sur un poste de direction et j’ai réservé un tiers du contingent annuel des postes de maîtres-directeurs,

rappel de faits

pour permettre l’intégration (nom) immédiate au nouveau corps des directeurs qui le désirent.

but des faits

Cette modalité, le nombre de postes de direction et le renouvellement du corps feront qu’

projet (conséquence)

une grande partie d’entre vous sera concernée par ces nouvelles dispositions.

Assertion (annonce)

 

§ assertif

Cette mesure est ...

assertion (caractérisant la mesure)

 

§ antithétique

En la décidant,

Constatation d’un fait

j’ai visé ni à vous déplaire ni à provoquer certaines organisations professionnelles.

but des faits nié

Au contraire,

introduit l’opposition

parce que je considère que vous êtes des acteurs fondamentaux dans la formation de notre jeunesse,

Explicatif

j’ai souhaité renforcer l’efficacité de votre action et valoriser votre rôle social

assertion (de l’opposition)

 

§ assertif

Veuillez agréer,...

assertion

 

Cet exemple permet de mettre en évidence des structures récursives à l’échelle du paragraphe et des indices qui en sont caractéristiques (passage du passé composé au futur qui indique la transition d’une relation des faits vers l’assertion d’un projet).

 

 

 

Structures des 4 textes d’exemple

 

 

Sensibilité de la détection :

- numération : premièrement, deuxièmement, en premier, premier X,...

- ordre spatial : d’un côté, de l’autre, 1er plan, en amont,...

- ordre temporel : d’abord, ensuite, enfin,...

 

Interprétation des indices : les énoncés qu’ils favorisent

Les types de verbes :

Les temps et rapports de temps :

 

Les constructeurs par défaut : articles, adverbes,...

Texte 1

Texte 2

Texte 3

Texte 4

 

 

Titre des

articles

Faits discursifs

indices dans le texte :

L’économiste, l’ingénieur et le médecin

indices dans le texte :

La finance en première ligne

indices dans le texte :

Les plantes transgéniques modifient la flore microbienne du sol

indices dans le texte :

Front national : des mots pour faire mal

Constatation d’un fait attesté

§ (de présentation)

1 présent + en permanence

§ (de présentation)

1 parce que + présent

§ (de présentation)

1 gérondif (en + -ant) + nominale

§ (de présentation)

1 on + a + déjà

conséquence

2 pour y faire face + est alors

, + seront

, + a +

guère (interprétatif)

 

confirmation

 

 

 

2 en effet, peu (interp.)

exposition

 

 

 

3 Mais ce + ne " prend forme " que (interp.)

commentaire

 

 

2 De l’avis de ce + serait (conditionnel de l’interp.)

 

nuance

3 Cependant + infinitif

 

3 A contrario, il semble que + ait été

 

adage

 

 

 

4 Ce qui est...ne peut être (ce + pronom relatif + début de phrase + présent omnitemporel ® infinitif du verbe être)

assertion

 

2 Premier changement :

 

§ (assertif) 5 Le + présent + aucune

assertion précision

 

et non plus

 

les + sont + toujours

consécution

4 Pour trouver les raisons de ce + il faut

 

4 Car + (causes)

 

assertion

 

3 Les + seront

 

 

illustration

 

 

comme vient de le montrer

6 Dans une tribune + nom propre + affirmait + citation

explication

 

 

§ (explicatif) 5 Ces travaux + objectif précis : + infinitif

7 Cet + s’effectue selon + nom commun

assertion

§ (de 1ère partie) 5 En amont, + art défini (la ou la) + modalité (ont à + infinitif)

§ (informatif) 4 Les + futur + ne plus

6 Les résultats + ont démontré que

§ (de 1ère partie) 8 tout d’abord + de + infinitif

constatation

 

 

7 gérondif + (constat)

 

affirmation

souvent + adjectif en -able

 

, + les + mettre en évidence

9 Cet + présent + tout (généralisant 8)

consécution

6 en déduisent + (effet)

 

 

(caractérisation) 10 se + présent + alors + en

assertion

7 le + mot clé + présent

(ajout analogue) 5 De même + les + verbe intransitif au futur

(commentaire) 8 Un constat + dont + futur + désormais

11 (conclusif) Ce + présent + tout (généralisant 10)

consécution

(effet, conclusion) 8 Les + mot clé + sont + ainsi + fin de §

 

(avec nuance) mais + " : " + infinitif

 

définition

 

 

espoir + " : " + celui

 

définition

 

 

apposition à nom commun de : -...- sans signes introducteurs de citation

 

assertion

 

6 Le + sera + adj. en

-able

(anaphorique résumante) 9 citation + résument + noms propres

(annonce thématique) 12 Dans (cadre) + présent

consécution

9 Ces X + entraînent + des X

" , " + étant donné + syntagme nominal (cause)

 

 

explication

 

" : " + les + sont

10 en effet

(par description) 13 succession de verbes

comparaison

10 entre + et + aussi bien + entre + et que + entre + et, les uns et les autres

 

 

 

assertion

11 (ajout à10,analogie) Comme corollaire + le + et le + sont

 

 

14 Le + présent + tout + , + tout (généralisant)

assertion conclusion

 

7 Elles seront + attribut adjectival

11 Ce + pronom (en réf. à 10) + négation + présent + de + infinitif

 

assertion

12 En + nom clé + " , " + le + est

 

12 (ajout, analogie) ni de + infinitif (structure identique

à 11)

 

 

 

 

La difficulté rencontrée est la sélection d’indices pertinents et le rejet de constructeurs superflus à un niveau trop large d’analyse. Cependant, dans la perspective d’une analyse sémantique affinée à l’échelle du syntagme, la prise en compte exhaustive des unités discrètes peut permettre de rendre compte des procédés discursifs au sein de la phrase. Mais cela suppose un élargissement de la liste des faits discursifs et peut entraîner une explosion combinatoire par la multiplicité d’indices à confronter.

 

 

Mouvements des différents types d’article et hiérarchie en vue d’une sélection :

 

polémique :

assertion + consécution + adage + conclusion

Schéma et options d’un paragraphe :

 

 

 

Deux démarches discursives caractérisent le texte polémique :

- L’exposition de faits avec des références (sous forme de citation ou introduit par des locutions du type : " par exemple ") suivis d’interprétations marquées par exemple par le conditionnel ou des adverbes d’intensités du type : peu, guère

L’assertion où est privilégiée la formulation courte et incisive du type précepte, adage,...

 

 

 

informatif :

constatation + conséquence + assertion

Schéma et options d’un paragraphe :

 

 

 

Prédominance du rapport de cause à effet et des conclusions qui peuvent en être tirées

Favorise le choix de phrase composées de structure complète du type :

fait - conséquence - conclusions

 

 

article d’exposition :

faits + consécutions associées + n assertions + comparaisons (pour aider à la compréhension)

Schéma et options d’un paragraphe :

 

 

Par rapport au type informatif, les assertions jouent un rôle prépondérant.

 

 

Schéma d’algorithme d’analyse des textes :

1. analyse des titres

2. repérage des constructeurs par défaut et des champs lexicaux de mots clés

3. assimilation des phrases à des squelettes de phrases

3.1. rapprocher les structures des propositions au squelette ayant le plus de correspondances de structure : ordre des étiquettes de faits discursifs prévaut sur la similitude des étiquettes

4. recherche des liens anaphoriques par mots identiques ou dérivés grammaticaux ou par correspondances d’accords

4.1. phrase commençant par un anaphorique du type pronom personnel ou démonstratif favorise les étiquettes du types consécution ou assertion ajoutée à la précédente

construction de la hiérarchie d’étiquettes par identification au schéma textuel le plus ressemblant

6. sélection de phrases en suivant l’heuristique suivante

6.1. Sélectionner les étiquettes des propositions qui sont assimilables à celles du modèle associé au texte.

6.2. Si l’étiquette d’une proposition correspond à une étiquette de niveau 1 dans le modèle, la sélectionner

6.2.1. contrainte : phrase commençant par un anaphorique du type pronom personnel ou démonstratif favorise la sélection de la phrase précédente

6.2.2. favoriser une phrase comportant un unité de structure complète, c’est-à-dire un système de chaîne d’étiquettes (type : assertion ® consécution ® illustration)

 

 

Production des résumés : évaluation des choix de phrases d’après leurs indices d’étiquetage

 

Texte 1 :

 assimilé à un modèle de textes du type " article d’exposition "

L’économiste, l’ingénieur et le médecin : résumé

Le système économique se trouve confronté en permanence à des difficultés chroniques ou à des défis nouveaux qui concernent aussi bien les entreprises que la puissance publique. Pour y faire face le réflexe est alors tout naturellement de recourir à un spécialiste du domaine concerné, à l’image de ce que l’on pratique dans le domaine de la technologie ou de la santé.

En amont la physique ou la biologie ont à manipuler des systèmes de complexité maîtrisable et de forte stabilité, souvent isolables de leur environnement et soumis à un nombre réduit de causes. L’économie se trouve confrontée à des systèmes bien plus complexes et en perpétuelle évolution, qui sont le siège de phénomènes enchevêtrés liés à des causes multiples et d’importance comparable.

En aval, le milieu décisionnel concerné par l’ingénierie ou la médecine est relativement bien cerné et homogène et se réduit même souvent à un commanditaire unique qui sollicite une aide ciblée.

Ces différentes modalités de décision ont des répercussions sur l’autonomie de l’expertise.

En parallèle, enfin, l’ingénierie et la médecine sont constamment alimentées par des innovations techniques engendrées dans des laboratoires de recherche spécialisées, dûment brevetées et testées sur des systèmes réduits.

La notion d’acte économique reste difficile à cerner sauf pour des opérations de consulting, et s’avère souvent incomplète, en se limitant à des recommandations assez générales, entraînant par là même une faible responsabilité de l’expert.

Dans ces conditions, la profession n’a guère de statut, et, si des diplômes d’économiste existent bel et bien, ils n’empêchent personne de se déclarer économiste et de faire des recommandations à qui veut bien les entendre.

On peut s’astreindre, à travers une prise de conscience de la profession plus que par un arsenal réglementaire, à développer une démarche empirique mieux fondée, à dégager des règles de l’art, à susciter une reconnaissance des compétences, à organiser des débats d’idées.

On peut remarquer, en sens inverse, que l’ingénierie et la médecine ont tendance à se rapprocher de l’économie en n’ayant qu’un rôle d’accompagnement dans la résolution des problèmes.

__________________________

 

Texte 2 :

 assimilé à un modèle de textes du type " article d’exposition "

La finance en première ligne : résumé

Aux avant postes, les banques vont devoir expérimenter le nouveau système de concurrence européen.

Premier changement : le refinancement s’effectuera auprès de la Banque centrale européenne et non plus auprès de l’institut d’émission national.

De même, les profits liés aux opérations de conversion des monnaies disparaîtront.

La naissance d’une monnaie unique européenne ne fera que transformer des opérations dollar/franc ou dollar/mark en dollars/euro, mais elle n’entraînera pas de déperdition de volumes.

Primo, l’euro pourrait rapidement jouer un rôle de monnaie de réserve. Secundo, la monnaie unique devrait multiplier les transactions sur les titres européens de la part des investisseurs américains et nippons.

Les banques devront reconstruire leurs systèmes informatiques, adapter les distributeurs automatiques de billets, revoir les systèmes de virements internationaux, mettre en place des programmes de formation et des campagnes d’information.

L’euro aura pour effet d’établir une concurrence directe.

La monnaie unique va obliger tous les établissements à reconsidérer leurs poitiques de développement à l’étranger, leurs offres de produits, la fixation de leurs marges, leurs relations avec leurs clients.

Dès le 1er janvier 1999, l’horizon de placement des épargnants européens sera en effet considérablement élargi.

La concurrence entre produits financiers européens se doublera, enfin, d’une rivalité accrue entre les places financières.

__________________________

Texte 3 :

 assimilé à un modèle de textes du type " informatif "

Les plantes transgéniques modifient la flore microbienne du sol : résumé

La culture de plantes transgéniques peut modifier, dans des proportions considérables, la composition bactérienne du sol qui les héberge.

La maîtrise des relations entre végétaux et bactéries pourrait alors ouvrir de nouvelles perspectives, plus écologiques, dans le domaine agricole.

En ajoutant un unique gène dans le patrimoine d’une légumineuse, le lotier corniculé, des chercheurs de l’Institut des sciences végétales du CNRS ont observé dans son voisinage une forte stimulation de certaines populations bactériennes.

En transformant une variété végétale de manière à lui faire produire des substances inhabituelles, les chercheurs ont mis en évidence une très forte croissance des bactéries capables de dégrader ces composés. Un, constat dont tous les experts en transgénèse devront désormais tenir compte, mais qui se double d’un espoir : celui d’exploiter cette propriété pour mieux comprendre le fonctionnement de la rhizosphère - l’ensemble des micro-organismes qui prolifèrent autour des racines végétales -, et y favoriser la présence de bactéries bénéfiques à l’agronomie.

Biais expérimental

Pour l’essentiel, ces micro-organismes se nourrissent des déchets métaboliques que les plantes " relarguent " par leur racines.

Pour mener leur expérience à bien, les chercheurs ont choisi le lotier corniculé.

Après avoir subi les manipulations ad hoc, plusieurs plants de lotier se sont mis à produire des molécules particulières, les opines, qui constituent une importante source d’azote et de carbone pour certaines bactéries de la rhizosphère.

Les résultats ont été spectaculaires, puisque les populations bactériennes capables de dégrader ces opines, au voisinage des racines de lotiers transgéniques, ont augmenté de 100 à... 3000 fois.

Intérêt agronomique :

Afin de renforcer l’action des " bons " micro-organismes, les chercheurs envisagent par exemple d’effectuer une double modification génétique : sur les plantes pour leur faire fabriquer des opines et sur les bactéries pour les rendre aptes à consommer ces mêmes molécules.

Selon les chercheurs de l’Institut des sciences végétales, cette application de leurs travaux pourrait ainsi ouvrir de nouvelles perspectives, plus écologiques, dans le domaine agricole.

__________________________

 

Texte 4 :

 assimilé à un modèle de textes du type " polémique "

Front national : des mots pour faire mal : résumé

Ce qui est dit ne peut être dissocié des manières de le dire.

Le Front national ne cède dans ce domaine à aucune improvisation ;

Il s’agit, tout d’abord de miser inlassablement sur la double topique du sexuel et du médical. Ce répertoire de métaphores ouvre la porte à tout un imaginaire du pur et de l’impur, du Bien et du Mal, du sale et du propre.

Ce jeu d’images sexuelles et médicales participe à l’évidence d’une entreprise de scandalisation. Mais cette stratégie de scandalisation risquerait de se retourner contre ses auteurs si elle ne se doublait d’une mobilisation des ressources du rire. La moquerie court-circuite la raison et l’argumentation logique, piégeant ainsi toute démonstration contraire dans les filets de l’émotion brute. Elle est en politique le signe de ralliement des faibles qui épongent leur propres humiliations en humiliant la victime émissaire.

Il s’agit, ensuite, d’emprunter les accessoires langagiers à la culture populaire, ou plutôt à la caricature que le FN se fait d’un peuple " en parlure ".

La dénonciation des élites politiques que l’on retrouve dans tous les discours frontistes se nourrit de cette parole affranchie des codes de convenance.

Alors que le débat politique traditionnel semble s’enliser dans l’évitement des vraies questions, dans le contournement des problèmes et semble s’enliser dans une logomachie oblique et opaque, le franc-parler d’un Le Pen prétend réintroduire la notion d’affrontement, retrouver les vertus d’un face-à-face.

La parole obscène du leader du Front national redécouvre les postures de la révolte et permet à Jean-Marie Le Pen d’incarner le sauveur, solitaire contre tous, le Gaulois révolté, la figure emblématique du Français de souche, jouisseur et indiscipliné.

__________________________

 

Conclusion :

 

1. Perspectives :

Le but de cette recherche est de proposer un moyen d’obtenir un modèle de différents types de textes afin de disposer d’un outil adaptable à diverses formes de traitement d’un texte d’entrée : résumé, prise de notes, reformulation, catégorisation rhétorique...

La méthode des squelettes sémantique a été ici adapté dans la perspective du résumé par sélection de phrase, néanmoins le système est plus propre à la sélection de phases articulatoires parfois d’échelle autre que la phrase cf. 2.122 p.8. Pour pallier à ce fait, nous pouvons envisager une sélection des phrases en fonction de la quantité d’étiquettes qu’elles contiennent et bien sûr de la qualité de ces dernières.

 

2.Difficultés :

Elles se présentent sous deux points de vus :

21. de la base de modèles vers les textes

Trouver des modèles qui rendent compte d’un maximum de types de discours.

Les cases vides doivent pallier au problème des phrases n’entrant que partiellement dans un modèle, le risque est la perte d’informations importantes situées dans une position non prise en compte dans un modèle et de ce fait reléguée dans une case vide.

 

22. des textes étudiés confrontés au système de traitement :

Certains types de texte peuvent ne pas présenter de type caractéristique et devrait susciter un modèle de type neutre, le problème est de définir parfois arbitrairement l’écart d’un texte de la neutralité vers un genre et de définir parfois arbitrairement que pour des considérations de structures pas toujours représentatives d’un mode d’analyse pouvant être erroné.

 

3. Implémentation et résultats :

Partant d’une approche purement linguistique, l’implémentation entraînera une rigidité du système, cependant elle permettra de rendre compte d’une unité ou du caractère aléatoire du type de texte.

Pour l’instant, seul l’aspect linguistique a été abordé mais en gardant à l’esprit des méthodes d’analyse automatique telle l’attribution d’étiquettes (sur un principe inspiré de l’exploration contextuelle), l’unification avec les modèles facilement programmable, des méthodes statistiques dans la phrase identification du texte à un modèle...

Les résultats à ce stade sont difficilement évaluables si ce n’est que l’on peut supposer a priori la sélection de tel ou tel type d’énoncer par rapport à tel autre en fonction de son squelette sémantique.

__________________________

 

 

Bibliographie :

Articles :

Exploration contextuelle :

C.A.M.S. (décembre 1995) : " Projet Séraphin : rapport final du C.A.M.S. ", IV- Acquisition des connaissances linguistiques, 4.1 - Aspect sémiotique de la mise en valeur, 4.2.1 - L’annonce thématique, 4.2.2 - La conclusion thématique.

Berri J., Le Roux D., Malrieu D., Minel J-L., (1996) : " SERAPHIN, main sentences automatic extraction automatic system ", 5 - Linguistic knowledge

Marcu D., EACL97, " From discourse structures to text summaries ", Intelligence Scalable Text Summarization, pp. 82-88, Madrid, 1997.

Berri J., Cartier E., (1996) : " Extraction automatique de certaines phrases des textes à partir d’un étiquetage sémantique ", 3 - L’analyse linguistique des textes.

 

Linguistique opératoire :

Morandin, (1988) : " A propos de la notion de thème de discours ", in Langue française, n° 78, 1988.

E. Roulet : "Echanges, interventions et actes de langage dans la structure de la conversation ", in Etudes de Linguistique Appliquée n°44, octobre-décembre 1981.

 

Ouvrages :

Ouvrages de référence :

Wagner R.L., Pinchon J., Grammaire du Français, Paris, Hachette, 1962.

Soutet O., Linguistique, Paris, PUF, 1995.

 

Sur la linguistique textuelle :

Adam J.-M., Eléments de linguistique textuelle, Bruxelles-Liège, Mardaga, 1990.

- Les textes : types et prototypes, Nathan-Université, 1992.

Charolles M., Fisher S., Le Discours : représentation et interprétation, Paris, PUF, 1990.

Desclés J.-P., Langages applicatifs, langues naturelles et cognition, partie 9.4.2. Vers une théorie des voix grammaticales, pp.229-237, Paris, Hermès, 1990.

G. Niquet, Ecrire avec logique et clarté, chap. 2 le paragraphe, unité du texte raisonné, pp. 18-37, Profil formation, éd. Hatier, 1984.

Roulet E., L’Articulation du discours en français contemporain, Berne, Peter Lang, 1985.

Tamba-Mecz I., La Sémantique, pp. 79-124, Paris, PUF, Que sais-je ?, 1988.