Traitement du langage naturel - Création

Dans ce chapitre, nous discuterons de la création du langage naturel dans le traitement du langage naturel. Pour commencer, comprenons d'abord ce qu'est la grammaire du langage naturel.

Grammaire du langage naturel

Pour la linguistique, la langue est un groupe de signes vocaux arbitraires. On peut dire que le langage est créatif, régi par des règles, à la fois innée et universelle. D'un autre côté, c'est humainement aussi. La nature de la langue est différente selon les personnes. Il y a beaucoup d'idées fausses sur la nature de la langue. C'est pourquoi il est très important de comprendre le sens du terme ambigu‘grammar’. En linguistique, le terme grammaire peut être défini comme les règles ou principes à l'aide de quelle langue fonctionne. Au sens large, nous pouvons diviser la grammaire en deux catégories -

Grammaire descriptive

L'ensemble des règles, où la linguistique et les grammairiens formulent la grammaire du locuteur, est appelé grammaire descriptive.

Grammaire en perspective

C'est un sens de la grammaire très différent, qui tente de maintenir une norme d'exactitude dans la langue. Cette catégorie a peu à voir avec le fonctionnement réel de la langue.

Composantes du langage

La langue d'étude est divisée en composantes interdépendantes, qui sont des divisions conventionnelles et arbitraires de la recherche linguistique. L'explication de ces composants est la suivante -

Phonologie

La toute première composante de la langue est la phonologie. C'est l'étude des sons de la parole d'une langue particulière. L'origine du mot peut être attribuée à la langue grecque, où «téléphone» signifie son ou voix. La phonétique, subdivision de la phonologie, est l'étude des sons de la parole du langage humain sous l'angle de leur production, de leur perception ou de leurs propriétés physiques. IPA (International Phonetic Alphabet) est un outil qui représente les sons humains de manière régulière tout en étudiant la phonologie. Dans IPA, chaque symbole écrit représente un et un seul son de parole et vice-versa.

Phonèmes

Il peut être défini comme l'une des unités sonores qui différencient un mot d'un autre dans une langue. En linguistique, les phonèmes sont écrits entre des barres obliques. Par exemple, phonème/k/ se produit dans des mots tels que kit, sketch.

Morphologie

C'est la deuxième composante du langage. C'est l'étude de la structure et de la classification des mots dans une langue particulière. L'origine du mot est de la langue grecque, où le mot «morphe» signifie «forme». La morphologie considère les principes de formation des mots dans une langue. En d'autres termes, comment les sons se combinent en unités significatives comme les préfixes, les suffixes et les racines. Il examine également comment les mots peuvent être regroupés en parties de discours.

Lexème

En linguistique, l'unité abstraite d'analyse morphologique qui correspond à un ensemble de formes prises par un seul mot est appelée lexème. La manière dont un lexème est utilisé dans une phrase est déterminée par sa catégorie grammaticale. Le lexème peut être un mot individuel ou un mot multiple. Par exemple, le mot talk est un exemple de lexème de mot individuel, qui peut avoir de nombreuses variantes grammaticales comme parler, parler et parler. Le lexème à plusieurs mots peut être composé de plusieurs mots orthographiques. Par exemple, parler, tirer, etc. sont des exemples de lexèmes à plusieurs mots.

Syntaxe

C'est la troisième composante du langage. C'est l'étude de l'ordre et de la disposition des mots en unités plus grandes. Le mot peut être attribué à la langue grecque, où le mot suntassein signifie «mettre en ordre». Il étudie le type de phrases et leur structure, de clauses, de phrases.

Sémantique

C'est la quatrième composante du langage. C'est l'étude de la manière dont le sens est véhiculé. Le sens peut être lié au monde extérieur ou peut être lié à la grammaire de la phrase. Le mot peut être attribué à la langue grecque, où le mot semainein signifie «signifier», «montrer», «signaler».

Pragmatique

C'est la cinquième composante du langage. C'est l'étude des fonctions du langage et son utilisation en contexte. L'origine du mot peut être attribuée à la langue grecque où le mot «pragma» signifie «acte», «affaire».

Catégories grammaticales

Une catégorie grammaticale peut être définie comme une classe d'unités ou de caractéristiques dans la grammaire d'une langue. Ces unités sont les éléments constitutifs du langage et partagent un ensemble commun de caractéristiques. Les catégories grammaticales sont également appelées caractéristiques grammaticales.

L'inventaire des catégories grammaticales est décrit ci-dessous -

Nombre

C'est la catégorie grammaticale la plus simple. Nous avons deux termes liés à cette catégorie: le singulier et le pluriel. Singulier est le concept de «un» alors que le pluriel est le concept de «plus d'un». Par exemple, chien / chiens, ceci / ces.

Le sexe

Le genre grammatical est exprimé par la variation des pronoms personnels et de la 3ème personne. Les exemples de genres grammaticaux sont singuliers - lui, elle, ça; la première et la deuxième personne forment - moi, nous et vous; la troisième personne du pluriel de leur forme, est soit le genre commun, soit le genre neutre.

La personne

Une autre catégorie grammaticale simple est la personne. En vertu de cela, les trois termes suivants sont reconnus -

  • 1st person - La personne qui parle est reconnue comme 1ère personne.

  • 2nd person - La personne qui est l'auditeur ou la personne à qui on parle est reconnue comme 2ème personne.

  • 3rd person - La personne ou la chose dont nous parlons est reconnue comme 3ème personne.

Cas

C'est l'une des catégories grammaticales les plus difficiles. Il peut être défini comme une indication de la fonction d'une phrase nominale (NP) ou de la relation d'une phrase nominale à un verbe ou aux autres phrases nominales de la phrase. Nous avons les trois cas suivants exprimés en pronoms personnels et interrogatifs -

  • Nominative case- C'est la fonction du sujet. Par exemple, moi, nous, vous, lui, elle, elle, eux et qui sont nominatifs.

  • Genitive case- C'est la fonction du possesseur. Par exemple, mon / le mien, le notre / le nôtre, le sien, le sien, le son, le leur, dont sont génitifs.

  • Objective case- C'est la fonction de l'objet. Par exemple, moi, nous, vous, lui, elle, eux, qui sont objectifs.

Diplôme

Cette catégorie grammaticale est liée aux adjectifs et aux adverbes. Il comprend les trois termes suivants -

  • Positive degree- Il exprime une qualité. Par exemple, grands, rapides, beaux sont des degrés positifs.

  • Comparative degree- Il exprime un degré ou une intensité plus élevé de la qualité dans l'un des deux éléments. Par exemple, les diplômes comparatifs sont plus grands, plus rapides, plus beaux.

  • Superlative degree- Il exprime le plus grand degré ou intensité de la qualité dans l'un des trois éléments ou plus. Par exemple, les diplômes superlatifs sont les plus grands, les plus rapides, les plus beaux.

Caractère définitif et indéfini

Ces deux concepts sont très simples. La définition que nous connaissons représente un référent, qui est connu, familier ou identifiable par le locuteur ou l'auditeur. En revanche, l'indéfini représente un référent qui n'est pas connu ou qui n'est pas familier. Le concept peut être compris dans la co-occurrence d'un article avec un nom -

  • definite article- le

  • indefinite article- a / an

Tendu

Cette catégorie grammaticale est liée au verbe et peut être définie comme l'indication linguistique du temps d'une action. Un temps établit une relation car il indique le temps d'un événement par rapport au moment de la parole. En gros, il s'agit des trois types suivants -

  • Present tense- Représente l'occurrence d'une action dans le moment présent. Par exemple, Ram travaille dur.

  • Past tense- Représente l'occurrence d'une action avant le moment présent. Par exemple, il a plu.

  • Future tense- Représente l'occurrence d'une action après le moment présent. Par exemple, il pleuvra.

Aspect

Cette catégorie grammaticale peut être définie comme la vue prise d'un événement. Il peut être des types suivants -

  • Perfective aspect- La vue est prise dans son ensemble et complète dans l'aspect. Par exemple, le passé simple commeyesterday I met my friend, en anglais a un aspect perfectif car il considère l'événement comme complet et entier.

  • Imperfective aspect- La vue est considérée comme continue et incomplète dans l'aspect. Par exemple, le participe présent commeI am working on this problem, en anglais a un aspect imparfait car il considère l'événement comme incomplet et en cours.

Ambiance

Cette catégorie grammaticale est un peu difficile à définir mais elle peut être simplement énoncée comme l'indication de l'attitude de l'orateur envers ce dont il parle. C'est aussi la caractéristique grammaticale des verbes. Il est distinct des temps grammaticaux et de l'aspect grammatical. Les exemples d'humeurs sont indicatifs, interrogatifs, impératifs, injonctifs, subjonctifs, potentiels, optatifs, gérondifs et participes.

Accord

Il est également appelé concorde. Cela se produit lorsqu'un mot change en fonction des autres mots auxquels il se rapporte. En d'autres termes, il s'agit de faire concorder la valeur d'une catégorie grammaticale entre différents mots ou une partie du discours. Les suivants sont les accords basés sur d'autres catégories grammaticales -

  • Agreement based on Person- C'est l'accord entre le sujet et le verbe. Par exemple, nous utilisons toujours «je suis» et «il est», mais jamais «il est» et «je suis».

  • Agreement based on Number- Cet accord est entre le sujet et le verbe. Dans ce cas, il existe des formes verbales spécifiques pour la première personne du singulier, la deuxième personne du pluriel et ainsi de suite. Par exemple, 1ère personne du singulier: Je suis vraiment, 2ème personne du pluriel: Nous sommes vraiment, 3ème personne du singulier: Le garçon chante, 3ème personne du pluriel: Les garçons chantent.

  • Agreement based on Gender- En anglais, il y a accord de genre entre pronoms et antécédents. Par exemple, Il a atteint sa destination. Le navire a atteint sa destination.

  • Agreement based on Case- Ce type d'accord n'est pas une caractéristique importante de l'anglais. Par exemple, qui est venu en premier - lui ou sa sœur?

Syntaxe de la langue parlée

La grammaire anglaise écrite et la grammaire anglaise parlée ont de nombreuses caractéristiques communes, mais avec cela, elles diffèrent également sur un certain nombre d'aspects. Les caractéristiques suivantes distinguent la grammaire anglaise parlée et écrite -

Disfluences et réparation

Cette caractéristique frappante rend la grammaire anglaise parlée et écrite différente les unes des autres. Il est connu individuellement comme des phénomènes de disfluences et collectivement comme des phénomènes de réparation. Les disfluences comprennent l'utilisation de la suite -

  • Fillers words- Parfois, entre les phrases, nous utilisons des mots de remplissage. Ils sont appelés des remplisseurs de pause de remplissage. Des exemples de tels mots sont uh et um.

  • Reparandum and repair- Le segment répété de mots entre la phrase est appelé reparandum. Dans le même segment, le mot modifié est appelé réparation. Prenons l'exemple suivant pour comprendre cela -

Does ABC airlines offer any one-way flights uh one-way fares for 5000 rupees?

Dans la phrase ci-dessus, le vol aller simple est un reparadum et le vol aller simple est une réparation.

Redémarre

Après la pause de remplissage, le redémarrage se produit. Par exemple, dans la phrase ci-dessus, les redémarrages se produisent lorsque le locuteur commence à poser des questions sur les vols aller simple puis s'arrête, se corrige par une pause de remplissage, puis recommence à poser des questions sur les tarifs aller simple.

Fragments de mots

Parfois, nous prononçons les phrases avec de plus petits fragments de mots. Par exemple,wwha-what is the time? Ici les mots w-wha sont des fragments de mots.