Gael le Chauff de Kerguenec
1998 - 1999
PROJET LINGUISTIQUE DE RESUME AUTOMATIQUE PAR SELECTION DE PHRASES |
1. L’étude du titre : sémantique du texte
1.1 Recherches sur les lexèmes du titre : établissement d’un champ lexical
1.11 Les dérivés sémantiques des mots du titre
2. La structure du texte : Démarche de la recherche
2.1 Les squelettes phrastiques, syntagmatiques et propositionnels :
2.11 Les constructeurs par défaut :
2.12 Le système de squelettes :
Construction de modèles étiquetés :
3.2 Schéma d’insertion des squelettes
3.3 Modèles syntaxiques : proposition (P1, P2, [...], Pn)
Interprétation des indices : les énoncés qu’ils favorisent
Les temps et rapports de temps :
Les constructeurs par défaut : articles, adverbes,...
Mouvements des différents types d’article et hiérarchie en vue d’une sélection :
Schéma d’algorithme d’analyse des textes :
Production des résumés : évaluation des choix de phrases d’après leurs indices d’étiquetage
Texte 1 : assimilé à un modèle de textes du type " article d’exposition "
Texte 2 : assimilé à un modèle de textes du type " article d’exposition "
Texte 3 : assimilé à un modèle de textes du type " informatif "
Les plantes transgéniques modifient la flore microbienne du sol : résumé
Texte 4 : assimilé à un modèle de textes du type " polémique "
Le travail suivant part du postulat qu’il existe des indices sémantiques stables qui ont un paradigme sémantique défini dont on peut utiliser la liste exhaustive.
Le choix sémantique ne dépend que du rapport qu’ont ces éléments les uns par rapport aux autres dans la phrase indépendamment du sujet traité.
Dans la perspective de ce projet, ils seront appelés des constructeurs par défaut car ils permettent d’échafauder le texte en gardant par défaut l’une des significations qui leur sont propres.
Ensuite, il s’agit de rechercher des similitudes pour en déduire des modèles textuels ; la même démarche suit pour les phrases et les syntagmes.
Ces modèles obtenus, ils pourraient avoir deux applications :
- la génération de texte à partir d’une base d’entrée de thèmes
- l’analyse de texte par comparaison à des modèles et le travail sur le texte par transformation de ces modèles
Sur de nombreux points, cette méthode suit celle de l’exploration contextuelle, surtout lors de l’étiquetage sémantique des structures emboîtables, pour la recherche de marqueurs pertinents, pour les noms d’étiquettes (annonce thématique,...), l’importance de la position dans le paragraphe pertinent, le classement des types d’indices.
Organisation des recherches
1. L’étude du titre : sémantique du texte
1.1 Recherches sur les lexèmes du titre : établissement d’un champ lexical
1.11 Les dérivés sémantiques des mots du titre
Les liens de connotation en langue : " le diasystème "
Reconnaissance d’un sème à travers ses différences diasystémiques :
Par concordance des domaines on essaye d’éviter d’engendrer des contresens de champ d’investigation.
1.12 Les dérivés grammaticaux des mots du titre
Cette recherche permet l’utilisation de l’étiquette " mot clé " qui peut jouer lors d’un choix d’étiquetage de la phrase.
La modalité : interrogation, exclamation, phrase nominale, énumération,...
Elle peut être un indice de la tendance du texte : exposition, comparaison, et peut favoriser un schéma sémantique du texte si plusieurs sont possibles.
L’adéquation de la forme syntaxique d’un texte avec un squelette de phrase peut donner des indices sur la valeur des mots clés en contexte :
exemple : étude des titres des textes étudiés et des modèles suggérés :
Evocation d’un thème dans un domaine
La |
finance |
en |
première |
ligne |
Thématisation |
Thème |
appartenance |
|
domaine |
Fait : d’un sujet un objet
Les |
plantes |
transgéniques |
modifient |
|
|
agent |
caractérise l’agent |
action |
|
la |
flore |
microbienne |
du |
sol |
|
patient |
caractérise le patient |
caractérise le |
patient |
Définition d’un thème :
Front |
national |
: |
des |
thème |
caractérise le thème |
introduit une définition |
|
mots |
pour |
faire |
mal |
définition |
introduit un but |
but de la définition |
|
Enumération, comparaison : 3 thèmes juxtaposés :
L’économiste |
, |
l’ingénieur |
et |
le médecin |
thème 1 |
juxtapose |
thème 2 |
coordonne |
thème 3 |
Les phrases à mots clés rentreront dans des schémas plus favorables si les informations du titre permettent de préférer une possibilité à une autre.
Démarche de la recherche
2.1 Les squelettes phrastiques, syntagmatiques et propositionnels :
Ils sont obtenus par la compositions de mots clés et de constructeurs par défaut.
2.11 Les constructeurs par défaut :
On considère comme constructeurs par défaut les parties n’ayant une amplitude polysémique réduite qu’à ses différentes acceptions répertoriées. Ces mots prennent en contexte un de leurs sens prédéfinis mais dépendent peu des présupposés de discours.
Les parties de discours concernées sont les suivantes classées dans le sens d’une prédicativité croissante :
ou des locutions voire des propositions idiomatiques
A cette liste on peut ajouter les informations véhiculées par les grammèmes (ces informations peuvent aider à retrouver les liens anaphoriques) :
Enfin on ajoute à partir des données de l’étude du titre la notion de mot clé associé de son rôle observé dans le titre.
Exemple à partir des premières phrases du texte : L’économiste, l’ingénieur et le médecin
Le |
nom |
adjectif |
se |
verbe |
part passé |
en |
permanence |
à |
des |
nom |
adjectif |
ou |
à |
des |
nom |
adjectif |
qui |
verbe |
aussi |
bien |
les |
nom |
que |
la |
nom |
adjectif |
description + comparaison
Pour |
y |
infinitif |
nom |
, |
le |
nom |
est |
alors |
tout |
naturellement |
de |
infinitif |
à |
un |
nom |
du |
nom |
adjectif |
, |
à |
l’ |
nom |
de |
ce |
que |
l’on |
verbe |
dans |
le |
nom |
de |
la |
nom |
ou |
de |
la |
nom |
|
|
but (renvoi anaphorique) + solution + appartenance + comparaison
2.12 Le système de squelettes :
Ils sont construits en fonction de l’agencement des constructeurs par défaut et des lexèmes et à l’aide de squelettes de structures sémantiques types préétablies.
La comparaison entre les squelettes des phrases du texte étudié et les modèles étiquetés permet d’établir des " synonymies " structurales.
Elle est à double entrée :
D’une part des squelettes types, composés :
D’autre part correspondant à chaque squelette type une étiquette décrivant son rôle dans l’argumentation :
Constatation d’un fait
Assertion
Conséquence : indique le résultat d’un fait
Confirmation : assertion ajoutée, précision
Consécution : indique plus le rapport que le résultat
Exposition
Commentaire : avec des marques de l’interprétation d’auteur
Adage (ou maxime, précepte... avec les parques caractéristiques)
Nuance
Illustration
Explication
Explicatif : comprend faits, raisonnement, explication
Projet : assertion annonce (souvent au futur)
Affirmation : asserte comme une vérité générale
Conclusion : favorisée en fin de §
Exemple d’un modèle d’étiquetage concernant l’incipit de l’article : L’économiste, l’ingénieur et le médecin :
phrase 1 { Problème posé : mot clé " système économique "
phrase 2 { Solution : spécialiste
{ comparaison : technologie & santé
phrase 3 { Nuance : constat : efficace
phrase 4 { raisons : comparaison : En amont - assertion 1
En aval - assertion 2
L’analyse ci-dessus expose un schéma type qui pourrait être détecté pour ce texte mais ne rentre pas dans l’analyse précise des squelettes de phrases.
La notion de comparaison peut être favorisée par l’étude préalable du titre de ce texte comme nous l’avons vue plus haut.
On peut établir une hiérarchie des types de rapports discursifs :
Cette hiérarchie donne une idée du résumé par sélection du degré de conservation des idées essentielles en allant vers les idées plus annexes.
2.122 La structure des squelettes :
Une phrase peut constituer un squelette en soi où être composée de plusieurs structures de modèles concaténés linéairement ou imbriqués les uns dans les autres.
a. Modèles étiquetés
Construction de modèles étiquetés :
3.2 Schéma d’insertion des squelettes
3.3 Modèles syntaxiques : proposition (P1, P2, [...], Pn)
du nom N énumération des ¹ symboles : " tel sujet "
nom + déterminant |
, |
n fois |
syntagme nom |
verbe |
autre nom de N |
|
autres noms de N |
N |
|
" tel sujet " : syntagme nom
0 à n déterminants |
nom |
0 à n déterminants |
assertion " a telle caractéristique "
" tel sujet " |
verbe |
syntagme nom |
|
rapport |
caractéristique |
* circonstanciel de temps
adverbe de temps |
syntagme nom |
, |
|
|
le paradigme des adverbes de temps : {depuis, après, ...}
* nuance
pourtant |
, |
circonstanciel marqué |
, |
" tel sujet " |
" a telle caractéristique " |
le paradigme de " pourtant " : {cependant, néanmoins, pour autant, toutefois, mais}
observations mises en parallèles
" tel sujet " |
" a telle caractéristique " |
, |
" tel sujet " |
" a telle caractéristique " |
|
|
|
justification
P1 |
: |
P2 |
justification
P1 |
puisque |
P2 |
paradigme de puisque : {pour la (simple, bonne) raison que, car, ...}
consécution
P1 |
|
aussi |
pronom 1 ou 2 |
verbe |
paradigme de aussi {donc, par conséquent, d’où, ...}
[...]. |
En effet |
Pn |
paradigme de " en effet " {...}
sont indiqués entre guillemets les indicateurs majeurs d’un type de rapport
b. Le paragraphe
Le paragraphe peut déjà permettre de circonscrire le champ de recherches de ces super structures en considérant que le changement de paragraphe marque les différents mouvements de pensée.
Des indices structuraux favorisés par la position dans le paragraphe :
on note la récurrence privilégiée de procédés, de marques signalant l’ouverture et la clôture d’un paragraphe.
L’ouverture du paragraphe est marquée très souvent par une disjonction spatiale, temporelle ou actorielle dans les textes narratifs, une disjonction thématique dans les autres textes. D’où la présence des marques linguistiques suivantes :
- indicateurs spatio-temporaux
exemple : trois jours plus tard, le lendemain, non loin de là, plus loin...
signalant un changement de lieu ou de temps.
- changement ou introduction de nouveaux noms (propres ou communs), manifestant l’apparition de nouveaux actants.
- anaphoriques, rappelant le thème du paragraphe antécédent.
Très souvent, après le recours massif à des substituts pronominaux dans le paragraphe qui précède, on rethématise notamment par renomination avec souvent des reprises démonstratives.
Exemple : de renomination dans l’article : Front national : des mots pour faire mal :
- connecteurs logiques déterminant les étapes successives d’une argumentation construite dans le cadre d’une schématisation dérivée
Exemple : d’abord... ensuite... de plus... enfin...
- procédés de reprises metatextuels, marque de redondance, explicitant le passage d’un thème à un autre.
Exemple : cela dit, pour autant, après avoir... considérons à présent..., s’il est vrai que... en revanche...
- rupture de temps verbaux liée par exemple au passage d’une séquence narrative à une séquence descriptive ou l’inverse.
- marqueurs de sériation, qui extraient un élément d’un ensemble (en ce qui concerne..., pour ce qui est de..., quant à) dans le cadre d’une progression thématique dérivée.
La clôture du paragraphe est marquée par la présence fréquente de termes récapitulatifs, conclusifs, qui signalent la saturation relative du thème développé. La dernière phrase pourra être amorcée par des petits mots comme " enfin " marquant l’épuisement d’une liste, comme " donc ", " par conséquent ", " en conséquence " ¼ exprimant la consécution ou la déduction, des marqueurs d’illustration " ainsi ", " par exemple " ou des marqueurs de reformulation " c’est-à-dire ", " autrement dit " ¼ qui saturent, les uns et les autres, l’explication engagée.
Dans la majorité des cas, le paragraphe finit sur deux types de phrase :
La composition des paragraphes :
Le but est ici de définir des règles d’organisation interne du paragraphe pour parvenir au principe d’une grammaire du paragraphe analogue à celle de la phrase qui nous permettra d’établir des squelettes sémantiques à l’échelle du paragraphe à partir de la composition de squelettes phrastiques. Classement d’après les paramètres de Longacre :
Les paragraphes se répartissent en deux catégories :
- paragraphes de base à structure binaire, close (2 phrases)
- paragraphes à structure ouverte, à constituants multiples (plus de 2 phrases)
Ces derniers pouvant être analysés comme une combinaison des paragraphes de base.
Longacre distingue 5 types de relation entre les constituants immédiats d’un paragraphe binaire qui permettent de classer les paragraphes en familles.
A - les relations de conjonction
ex. : - le paragraphe antithétique (A ¹ B)
- le paragraphe restrictif (A cependant B)
-- le paragraphe alternatif (ou A ou B)
-- la paragraphe coordinatif (A et B) : les éléments coordonnés sont d’égale importance
B - les relations temporelles (A puis B)
C - les relations logiques
ex. : - le paragraphe explicatif - justificatif (B ¬ A) : le résultat est plus important que la cause
- le paragraphe consécutif - déductif (A ® B) : la conclusion est plus importante que la prémisse
- le paragraphe concessif (B ¬ A) : le rapport prévaut sur les propositions
A partir de la combinatoire de ces structures sémantiques on peut caractériser des grands types de paragraphes propres à l’argumentation de certains styles de textes à visée polémique, informative, définitoire, descriptive,... dont il reste à repérer des structures récurrentes permettant d’en construire un modèle globale.
D - Différentes composantes des types de paragraphes ci-dessus :
Exemple : avec en gras les indices saillants et à droite l’étiquette sémantique qu’ils favorisent.
R.Monory : circulaire ministérielle à l’adresse des instituteurs :
Madame,
§ explicatif
Compte tenu des débats provoqués par la mise en place des maître-directeurs, |
rappel d’un fait |
j’ai pensé utile de m’adresser directement à vous, |
conséquence |
pas nécessairement pour vous convaincre, mais assurément pour vous informer |
but |
§ consécutif
Une large concertation a eu lieu sur ce projet (...). Les projets initiaux ont été modifiés |
rappel de faits |
pour tenir compte des suggestions (...). |
but des faits |
Le texte définitif est conforme à l’avis émis par le Conseil d’état. |
Assertion (résultat) |
§ consécutif
Votre activité professionnelle n’est pas modifiée par cette mesure : |
rappel de faits |
vous continuerez à être... à garder votre ... |
Assertion (résultat) |
§ consécutif
Votre métier est suffisamment valorisé, tant sur le plan moral que sur le plan matériel. J’ai fait inscrire 860 millions supplémentaires, |
rappel de faits |
pour la revalorisation (nom) des traitements |
but des faits |
et j’espère pouvoir faire un effort comparable ou accru en 1998. |
projet |
Dorénavant, un maître-directeur bénéficiera de... pour le calcul de sa retraite. |
Assertion (annonce) |
§ consécutif
Un instituteur sur sept est actuellement sur un poste de direction et j’ai réservé un tiers du contingent annuel des postes de maîtres-directeurs, |
rappel de faits |
pour permettre l’intégration (nom) immédiate au nouveau corps des directeurs qui le désirent. |
but des faits |
Cette modalité, le nombre de postes de direction et le renouvellement du corps feront qu’ |
projet (conséquence) |
une grande partie d’entre vous sera concernée par ces nouvelles dispositions. |
Assertion (annonce) |
§ assertif
Cette mesure est ... |
assertion (caractérisant la mesure) |
§ antithétique
En la décidant, |
Constatation d’un fait |
j’ai visé ni à vous déplaire ni à provoquer certaines organisations professionnelles. |
but des faits nié |
Au contraire, |
introduit l’opposition |
parce que je considère que vous êtes des acteurs fondamentaux dans la formation de notre jeunesse, |
Explicatif |
j’ai souhaité renforcer l’efficacité de votre action et valoriser votre rôle social |
assertion (de l’opposition) |
§ assertif
Veuillez agréer,... |
assertion |
Cet exemple permet de mettre en évidence des structures récursives à l’échelle du paragraphe et des indices qui en sont caractéristiques (passage du passé composé au futur qui indique la transition d’une relation des faits vers l’assertion d’un projet).
Structures des 4 textes d’exemple
- numération : premièrement, deuxièmement, en premier, premier X,...
- ordre spatial : d’un côté, de l’autre, 1er plan, en amont,...
- ordre temporel : d’abord, ensuite, enfin,...
Interprétation des indices : les énoncés qu’ils favorisent
Les types de verbes :
Les temps et rapports de temps :
Les constructeurs par défaut : articles, adverbes,...
Titre des articles Faits discursifs |
indices dans le texte : L’économiste, l’ingénieur et le médecin |
indices dans le texte : La finance en première ligne |
indices dans le texte : Les plantes transgéniques modifient la flore microbienne du sol |
indices dans le texte : Front national : des mots pour faire mal |
Constatation d’un fait attesté |
§ (de présentation) 1 présent + en permanence |
§ (de présentation) 1 parce que + présent |
§ (de présentation) 1 gérondif (en + -ant) + nominale |
§ (de présentation) 1 on + a + déjà |
conséquence |
2 pour y faire face + est alors |
, + seront |
, + a + guère (interprétatif) |
|
confirmation |
|
|
|
2 en effet, peu (interp.) |
exposition |
|
|
|
3 Mais ce + ne " prend forme " que (interp.) |
commentaire |
|
|
2 De l’avis de ce + serait (conditionnel de l’interp.) |
|
nuance |
3 Cependant + infinitif |
|
3 A contrario, il semble que + ait été |
|
adage |
|
|
|
4 Ce qui est...ne peut être (ce + pronom relatif + début de phrase + présent omnitemporel ® infinitif du verbe être) |
assertion |
|
2 Premier changement : |
|
§ (assertif) 5 Le + présent + aucune |
assertion précision |
|
et non plus |
|
les + sont + toujours |
consécution |
4 Pour trouver les raisons de ce + il faut |
|
4 Car + (causes) |
|
assertion |
|
3 Les + seront |
|
|
illustration |
|
|
comme vient de le montrer |
6 Dans une tribune + nom propre + affirmait + citation |
explication |
|
|
§ (explicatif) 5 Ces travaux + objectif précis : + infinitif |
7 Cet + s’effectue selon + nom commun |
assertion |
§ (de 1ère partie) 5 En amont, + art défini (la ou la) + modalité (ont à + infinitif) |
§ (informatif) 4 Les + futur + ne plus |
6 Les résultats + ont démontré que |
§ (de 1ère partie) 8 tout d’abord + de + infinitif |
constatation |
|
|
7 gérondif + (constat) |
|
affirmation |
souvent + adjectif en -able |
|
, + les + mettre en évidence |
9 Cet + présent + tout (généralisant 8) |
consécution |
6 en déduisent + (effet) |
|
|
(caractérisation) 10 se + présent + alors + en |
assertion |
7 le + mot clé + présent |
(ajout analogue) 5 De même + les + verbe intransitif au futur |
(commentaire) 8 Un constat + dont + futur + désormais |
11 (conclusif) Ce + présent + tout (généralisant 10) |
consécution |
(effet, conclusion) 8 Les + mot clé + sont + ainsi + fin de § |
|
(avec nuance) mais + " : " + infinitif |
|
définition |
|
|
espoir + " : " + celui |
|
définition |
|
|
apposition à nom commun de : -...- sans signes introducteurs de citation |
|
assertion |
|
6 Le + sera + adj. en-able |
(anaphorique résumante) 9 citation + résument + noms propres |
(annonce thématique) 12 Dans (cadre) + présent |
consécution |
9 Ces X + entraînent + des X |
" , " + étant donné + syntagme nominal (cause) |
|
|
explication |
|
" : " + les + sont |
10 en effet |
(par description) 13 succession de verbes |
comparaison |
10 entre + et + aussi bien + entre + et que + entre + et, les uns et les autres |
|
|
|
assertion |
11 (ajout à10,analogie) Comme corollaire + le + et le + sont |
|
|
14 Le + présent + tout + , + tout (généralisant) |
assertion conclusion |
|
7 Elles seront + attribut adjectival |
11 Ce + pronom (en réf. à 10) + négation + présent + de + infinitif |
|
assertion |
12 En + nom clé + " , " + le + est |
|
12 (ajout, analogie) ni de + infinitif (structure identiqueà 11) |
|
La difficulté rencontrée est la sélection d’indices pertinents et le rejet de constructeurs superflus à un niveau trop large d’analyse. Cependant, dans la perspective d’une analyse sémantique affinée à l’échelle du syntagme, la prise en compte exhaustive des unités discrètes peut permettre de rendre compte des procédés discursifs au sein de la phrase. Mais cela suppose un élargissement de la liste des faits discursifs et peut entraîner une explosion combinatoire par la multiplicité d’indices à confronter.
Mouvements des différents types d’article et hiérarchie en vue d’une sélection :
assertion + consécution + adage + conclusion
Schéma et options d’un paragraphe :
Deux démarches discursives caractérisent le texte polémique :
- L’exposition de faits avec des références (sous forme de citation ou introduit par des locutions du type : " par exemple ") suivis d’interprétations marquées par exemple par le conditionnel ou des adverbes d’intensités du type : peu, guère
L’assertion où est privilégiée la formulation courte et incisive du type précepte, adage,...
constatation + conséquence + assertion
Schéma et options d’un paragraphe :
Prédominance du rapport de cause à effet et des conclusions qui peuvent en être tirées
Favorise le choix de phrase composées de structure complète du type :
fait - conséquence - conclusions
faits + consécutions associées + n assertions + comparaisons (pour aider à la compréhension)
Schéma et options d’un paragraphe :
Par rapport au type informatif, les assertions jouent un rôle prépondérant.
Schéma d’algorithme d’analyse des textes :
1. analyse des titres
2. repérage des constructeurs par défaut et des champs lexicaux de mots clés
3. assimilation des phrases à des squelettes de phrases
3.1. rapprocher les structures des propositions au squelette ayant le plus de correspondances de structure : ordre des étiquettes de faits discursifs prévaut sur la similitude des étiquettes
4. recherche des liens anaphoriques par mots identiques ou dérivés grammaticaux ou par correspondances d’accords
4.1. phrase commençant par un anaphorique du type pronom personnel ou démonstratif favorise les étiquettes du types consécution ou assertion ajoutée à la précédente
construction de la hiérarchie d’étiquettes par identification au schéma textuel le plus ressemblant
6. sélection de phrases en suivant l’heuristique suivante
6.1. Sélectionner les étiquettes des propositions qui sont assimilables à celles du modèle associé au texte.
6.2. Si l’étiquette d’une proposition correspond à une étiquette de niveau 1 dans le modèle, la sélectionner
6.2.1. contrainte : phrase commençant par un anaphorique du type pronom personnel ou démonstratif favorise la sélection de la phrase précédente
6.2.2. favoriser une phrase comportant un unité de structure complète, c’est-à-dire un système de chaîne d’étiquettes (type : assertion ® consécution ® illustration)
Production des résumés : évaluation des choix de phrases d’après leurs indices d’étiquetage
assimilé à un modèle de textes du type " article d’exposition "
L’économiste, l’ingénieur et le médecin : résumé
Le système économique se trouve confronté en permanence à des difficultés chroniques ou à des défis nouveaux qui concernent aussi bien les entreprises que la puissance publique. Pour y faire face le réflexe est alors tout naturellement de recourir à un spécialiste du domaine concerné, à l’image de ce que l’on pratique dans le domaine de la technologie ou de la santé.
En amont la physique ou la biologie ont à manipuler des systèmes de complexité maîtrisable et de forte stabilité, souvent isolables de leur environnement et soumis à un nombre réduit de causes. L’économie se trouve confrontée à des systèmes bien plus complexes et en perpétuelle évolution, qui sont le siège de phénomènes enchevêtrés liés à des causes multiples et d’importance comparable.
En aval, le milieu décisionnel concerné par l’ingénierie ou la médecine est relativement bien cerné et homogène et se réduit même souvent à un commanditaire unique qui sollicite une aide ciblée.
Ces différentes modalités de décision ont des répercussions sur l’autonomie de l’expertise.
En parallèle, enfin, l’ingénierie et la médecine sont constamment alimentées par des innovations techniques engendrées dans des laboratoires de recherche spécialisées, dûment brevetées et testées sur des systèmes réduits.
La notion d’acte économique reste difficile à cerner sauf pour des opérations de consulting, et s’avère souvent incomplète, en se limitant à des recommandations assez générales, entraînant par là même une faible responsabilité de l’expert.
Dans ces conditions, la profession n’a guère de statut, et, si des diplômes d’économiste existent bel et bien, ils n’empêchent personne de se déclarer économiste et de faire des recommandations à qui veut bien les entendre.
On peut s’astreindre, à travers une prise de conscience de la profession plus que par un arsenal réglementaire, à développer une démarche empirique mieux fondée, à dégager des règles de l’art, à susciter une reconnaissance des compétences, à organiser des débats d’idées.
On peut remarquer, en sens inverse, que l’ingénierie et la médecine ont tendance à se rapprocher de l’économie en n’ayant qu’un rôle d’accompagnement dans la résolution des problèmes.
__________________________
assimilé à un modèle de textes du type " article d’exposition "
La finance en première ligne : résumé
Aux avant postes, les banques vont devoir expérimenter le nouveau système de concurrence européen.
Premier changement : le refinancement s’effectuera auprès de la Banque centrale européenne et non plus auprès de l’institut d’émission national.
De même, les profits liés aux opérations de conversion des monnaies disparaîtront.
La naissance d’une monnaie unique européenne ne fera que transformer des opérations dollar/franc ou dollar/mark en dollars/euro, mais elle n’entraînera pas de déperdition de volumes.
Primo, l’euro pourrait rapidement jouer un rôle de monnaie de réserve. Secundo, la monnaie unique devrait multiplier les transactions sur les titres européens de la part des investisseurs américains et nippons.
Les banques devront reconstruire leurs systèmes informatiques, adapter les distributeurs automatiques de billets, revoir les systèmes de virements internationaux, mettre en place des programmes de formation et des campagnes d’information.
L’euro aura pour effet d’établir une concurrence directe.
La monnaie unique va obliger tous les établissements à reconsidérer leurs poitiques de développement à l’étranger, leurs offres de produits, la fixation de leurs marges, leurs relations avec leurs clients.
Dès le 1er janvier 1999, l’horizon de placement des épargnants européens sera en effet considérablement élargi.
La concurrence entre produits financiers européens se doublera, enfin, d’une rivalité accrue entre les places financières.
__________________________
assimilé à un modèle de textes du type " informatif "
Les plantes transgéniques modifient la flore microbienne du sol : résumé
La culture de plantes transgéniques peut modifier, dans des proportions considérables, la composition bactérienne du sol qui les héberge.
La maîtrise des relations entre végétaux et bactéries pourrait alors ouvrir de nouvelles perspectives, plus écologiques, dans le domaine agricole.
En ajoutant un unique gène dans le patrimoine d’une légumineuse, le lotier corniculé, des chercheurs de l’Institut des sciences végétales du CNRS ont observé dans son voisinage une forte stimulation de certaines populations bactériennes.
En transformant une variété végétale de manière à lui faire produire des substances inhabituelles, les chercheurs ont mis en évidence une très forte croissance des bactéries capables de dégrader ces composés. Un, constat dont tous les experts en transgénèse devront désormais tenir compte, mais qui se double d’un espoir : celui d’exploiter cette propriété pour mieux comprendre le fonctionnement de la rhizosphère - l’ensemble des micro-organismes qui prolifèrent autour des racines végétales -, et y favoriser la présence de bactéries bénéfiques à l’agronomie.
Biais expérimental
Pour l’essentiel, ces micro-organismes se nourrissent des déchets métaboliques que les plantes " relarguent " par leur racines.
Pour mener leur expérience à bien, les chercheurs ont choisi le lotier corniculé.
Après avoir subi les manipulations ad hoc, plusieurs plants de lotier se sont mis à produire des molécules particulières, les opines, qui constituent une importante source d’azote et de carbone pour certaines bactéries de la rhizosphère.
Les résultats ont été spectaculaires, puisque les populations bactériennes capables de dégrader ces opines, au voisinage des racines de lotiers transgéniques, ont augmenté de 100 à... 3000 fois.
Intérêt agronomique :
Afin de renforcer l’action des " bons " micro-organismes, les chercheurs envisagent par exemple d’effectuer une double modification génétique : sur les plantes pour leur faire fabriquer des opines et sur les bactéries pour les rendre aptes à consommer ces mêmes molécules.
Selon les chercheurs de l’Institut des sciences végétales, cette application de leurs travaux pourrait ainsi ouvrir de nouvelles perspectives, plus écologiques, dans le domaine agricole.
__________________________
assimilé à un modèle de textes du type " polémique "
Front national : des mots pour faire mal : résumé
Ce qui est dit ne peut être dissocié des manières de le dire.
Le Front national ne cède dans ce domaine à aucune improvisation ;
Il s’agit, tout d’abord de miser inlassablement sur la double topique du sexuel et du médical. Ce répertoire de métaphores ouvre la porte à tout un imaginaire du pur et de l’impur, du Bien et du Mal, du sale et du propre.
Ce jeu d’images sexuelles et médicales participe à l’évidence d’une entreprise de scandalisation. Mais cette stratégie de scandalisation risquerait de se retourner contre ses auteurs si elle ne se doublait d’une mobilisation des ressources du rire. La moquerie court-circuite la raison et l’argumentation logique, piégeant ainsi toute démonstration contraire dans les filets de l’émotion brute. Elle est en politique le signe de ralliement des faibles qui épongent leur propres humiliations en humiliant la victime émissaire.
Il s’agit, ensuite, d’emprunter les accessoires langagiers à la culture populaire, ou plutôt à la caricature que le FN se fait d’un peuple " en parlure ".
La dénonciation des élites politiques que l’on retrouve dans tous les discours frontistes se nourrit de cette parole affranchie des codes de convenance.
Alors que le débat politique traditionnel semble s’enliser dans l’évitement des vraies questions, dans le contournement des problèmes et semble s’enliser dans une logomachie oblique et opaque, le franc-parler d’un Le Pen prétend réintroduire la notion d’affrontement, retrouver les vertus d’un face-à-face.
La parole obscène du leader du Front national redécouvre les postures de la révolte et permet à Jean-Marie Le Pen d’incarner le sauveur, solitaire contre tous, le Gaulois révolté, la figure emblématique du Français de souche, jouisseur et indiscipliné.
__________________________
Le but de cette recherche est de proposer un moyen d’obtenir un modèle de différents types de textes afin de disposer d’un outil adaptable à diverses formes de traitement d’un texte d’entrée : résumé, prise de notes, reformulation, catégorisation rhétorique...
La méthode des squelettes sémantique a été ici adapté dans la perspective du résumé par sélection de phrase, néanmoins le système est plus propre à la sélection de phases articulatoires parfois d’échelle autre que la phrase cf. 2.122 p.8. Pour pallier à ce fait, nous pouvons envisager une sélection des phrases en fonction de la quantité d’étiquettes qu’elles contiennent et bien sûr de la qualité de ces dernières.
Elles se présentent sous deux points de vus :
21. de la base de modèles vers les textes
Trouver des modèles qui rendent compte d’un maximum de types de discours.
Les cases vides doivent pallier au problème des phrases n’entrant que partiellement dans un modèle, le risque est la perte d’informations importantes situées dans une position non prise en compte dans un modèle et de ce fait reléguée dans une case vide.
22. des textes étudiés confrontés au système de traitement :
Certains types de texte peuvent ne pas présenter de type caractéristique et devrait susciter un modèle de type neutre, le problème est de définir parfois arbitrairement l’écart d’un texte de la neutralité vers un genre et de définir parfois arbitrairement que pour des considérations de structures pas toujours représentatives d’un mode d’analyse pouvant être erroné.
3. Implémentation et résultats :
Partant d’une approche purement linguistique, l’implémentation entraînera une rigidité du système, cependant elle permettra de rendre compte d’une unité ou du caractère aléatoire du type de texte.
Pour l’instant, seul l’aspect linguistique a été abordé mais en gardant à l’esprit des méthodes d’analyse automatique telle l’attribution d’étiquettes (sur un principe inspiré de l’exploration contextuelle), l’unification avec les modèles facilement programmable, des méthodes statistiques dans la phrase identification du texte à un modèle...
Les résultats à ce stade sont difficilement évaluables si ce n’est que l’on peut supposer a priori la sélection de tel ou tel type d’énoncer par rapport à tel autre en fonction de son squelette sémantique.
__________________________
Exploration contextuelle :
C.A.M.S. (décembre 1995) : " Projet Séraphin : rapport final du C.A.M.S. ", IV- Acquisition des connaissances linguistiques, 4.1 - Aspect sémiotique de la mise en valeur, 4.2.1 - L’annonce thématique, 4.2.2 - La conclusion thématique.
Berri J., Le Roux D., Malrieu D., Minel J-L., (1996) : " SERAPHIN, main sentences automatic extraction automatic system ", 5 - Linguistic knowledge
Marcu D., EACL97, " From discourse structures to text summaries ", Intelligence Scalable Text Summarization, pp. 82-88, Madrid, 1997.
Berri J., Cartier E., (1996) : " Extraction automatique de certaines phrases des textes à partir d’un étiquetage sémantique ", 3 - L’analyse linguistique des textes.
Linguistique opératoire :
Morandin, (1988) : " A propos de la notion de thème de discours ", in Langue française, n° 78, 1988.
E. Roulet : "Echanges, interventions et actes de langage dans la structure de la conversation ", in Etudes de Linguistique Appliquée n°44, octobre-décembre 1981.
Ouvrages de référence :
Wagner R.L., Pinchon J., Grammaire du Français, Paris, Hachette, 1962.
Soutet O., Linguistique, Paris, PUF, 1995.
Sur la linguistique textuelle :
Adam J.-M., Eléments de linguistique textuelle, Bruxelles-Liège, Mardaga, 1990.
- Les textes : types et prototypes, Nathan-Université, 1992.
Charolles M., Fisher S., Le Discours : représentation et interprétation, Paris, PUF, 1990.
Desclés J.-P., Langages applicatifs, langues naturelles et cognition, partie 9.4.2. Vers une théorie des voix grammaticales, pp.229-237, Paris, Hermès, 1990.
G. Niquet, Ecrire avec logique et clarté, chap. 2 le paragraphe, unité du texte raisonné, pp. 18-37, Profil formation, éd. Hatier, 1984.
Roulet E., L’Articulation du discours en français contemporain, Berne, Peter Lang, 1985.
Tamba-Mecz I., La Sémantique, pp. 79-124, Paris, PUF, Que sais-je ?, 1988.