Overblog Suivre ce blog
Editer l'article Administration Créer mon blog
Le blog du CRRIAM

Organisation des fichiers aiml et base d'ecriture.

11 Avril 2011 , Rédigé par crriam Publié dans #Organisation des fichiers aiml

I Pour plus de simplicité, les fichiers seront organisés par sujet de discussion. (texte publié par Bruno Claret)

  Certain préférerons classer leur fichier par ordre alphabetique ou d'une façon qui leur sera propre. Personnellement la méthode que j'ai retenue est celle de faire un fichier par sujet de conversation. Je trouve qu'il est bien plus facile de rechercher dedans lorsque l'on sait de quoi on parle. Voici un exemple des fichiers que nous utilisons : 

 

fichier-sujetj-copie-1.jpg

 

II Les problemes liés au français et à la reconnaissance.

 

  • Le plus gros problème, l'absence de reconnaissance d'une variante de phrase exemple: 

Pour le mots bonjour, entré par l'humain, le robot répond salut.

 

Humain : Bonjour

Robot : Salut

 

On programera ça :

 

<category>
 <pattern> bonjour </pattern>
 <template> Salut</template>
</category>

 

Alors où est le probléme ?

Et bien si l'humain entre à la place de bonjour-> bonjour toi, le robot ne reconnait plus du tout l'entrée et renvoit la réponse associé au caractère *

 

(Il conviendra donc de coder la réponse que l'on veut faire en cas de non reconnaissance. Celle-ci permettra de soit faire comprendre à l'utilisateur que le robot n'a pas compris, soit de le renvoyer sur un sujet que le robot comprend. On y reviendra plus tard)

 

Pour éviter celà, on codera normalement et on ajoutera un gabarit srai 3* c'est à dire que l'on ne tiendra pas compte de tout ce qui n'est pas reconnut et on renvera par la balise srai vers ce que l'on connait exemple :

 

<category>
 <pattern> bonjour </pattern>
 <template> Salut</template>
</category>

 

<category>
 <pattern>* bonjour </pattern>
 <template><srai> bonjour </srai></template>
</category>
<category>
 <pattern>* bonjour *</pattern>
 <template><srai> bonjour </srai></template>
</category>
<category>
 <pattern> bonjour *</pattern>
 <template><srai> bonjour </srai></template>
</category>

 

De cette façon, le robot pourra répondre pour toutes les formes de phrases comprenant le mots bonjour exemple :

Bonjour toi, he bonjour, he bonjour toi etc.

 

  Pour coder ça vous pouvez utiliser le generateur de code  dont vous trouverez le mode d'emplois dans le menu de ce site à gauche.

  • Le 2eme plus gros problème, les fautes d'orthographes !  Comme vous l'aurez remarqué, j'en fais passablement suite à une petite dysorthographie. Problème, je ne suis pas le seul, et il faut bien que le robot comprenne tout de même !
  • le problème lié au langage sms, beaucoup de personnes écrivent avec plus ou moins de sms dans leur phrases.
  • les fautes de frappe, inversion de lerttes-> lettres
  • les accents et les cédilles qui ne sont pas toujours reconnus par les logiciels, et beaucoup de fautes d'accents.
  • les fautes de conjugaison, tu fait-> tu fais 
  • les synonymes ou groupes synonymes (même chose mais dites différemment)

 

Alors, comment faire  ?

 

on ne peut pas tout éviter, c'est impossible !

 

Pour minimiser, le risque de ne pas comprendre, On va donc

 

- en premier, essayer d'éviter la reconnaissance des verbes, puis éviter les conjugués autrement qu'avec tu, je, il (on) , qui sont les principaux dans une conversation standard.

- éviter si possibles les pluriels

 

- Faire un fichier synonymes

qui intégrera, les contractions comme t'as-> tu as, les principaux sms comme mdr, lol, tu fé etc. tout les smile :-) et les principales fautes de conjugaison courrantes.

 

Pour ce faire, utiliser le generateur 4* avec renvois, en bas a gauche. possibilités ci dessous qui rempace le mot par un autre dans la phrase en renvoyant en plus le reste de la phrase entrée (caractère *) exemple:

 

 <category><pattern> stp </pattern><template><srai> s il te plait </srai></template></category>


  <category><pattern> stp * </pattern><template><srai> s il te plait  <star/></srai></template></category>


  <category><pattern> * stp * </pattern><template><srai> <star/> s il te plait <star index="2"/></srai></template></category>


  <category><pattern> * stp </pattern><template><srai> <star/> s il te plait </srai></template></category>

 

Attention !!!!! si vous codez à la main, toujours laisser un espace entre le mots et:  la balise <star/> ou <star index=""/> ou le caractère * (ce que j'ai mis en orange)

sinon ça ne marchera pas !d'ou l'utiliter du generateur :-)

 

 

- Faire un fichier cédille

 

- faire un fichier accent

 

de la même façon il faudra penser au differente tournure de phrase, là on utilisera

 

le generateur srai 4* pour faire les synonymes des phrases complettes : sans renvois de l'étoile sur les autres formulations possibles exemple :

 comme les synonimes de comment vas tu

 

<category>
 <pattern> tu va bien </pattern>
 <template><srai> comment vas tu </srai></template>
</category>
<category>
 <pattern>* tu va bien </pattern>
 <template><srai> comment vas tu </srai></template>
</category>
<category>
 <pattern>* tu va bien *</pattern>
 <template><srai> comment vas tu </srai></template>
</category>
<category>
 <pattern> tu va bien *</pattern>
 <template><srai> comment vas tu </srai></template>
</category>

ça baigne-> comment vas tu

ca va -> comment vas tu

etc.

Partager cet article

Repost 0

Commenter cet article