Llenguatge natural

El llenguatge natural és el llenguatge oral i escrit que utilitzem les persones per comunicar-nos entre nosaltres, ja que és el més amigable, és natural (com el seu nom indica). Aquest tipus de llenguatge es caracteritza per ser dependent del context i dels interlocutors, a més d'incloure elements que poden dificultar la seva interpretació com paraules d'argot, acrònims, sinònims, homònims, etc. Es tracta de llenguatge molt flexible i ric, que pot arribar a ser molt especialitzat però, a la vegada, molt ambigu.

Els sistemes d'informació no poden utilitzar aquest tipus de llenguatge per prendre decisions de manera autònoma, ja que no el poden interpretar automàticament, comparar ni explotar de manera global. Existeixen eines de processament de llenguatge natural que permeten transformar text desestructurat en vocabulari controlat, normalitzant-lo. L'ús d'aquestes eines està augmentant però encara són molt dependents del context i no permeten tractar informació heterogènia. El cas que més s'està treballant és la codificació semiautomàtica o assistida de diagnòstics a partir d'un literal escrit a un camp de diagnòstic per part d'un professional assistencial, i en base a un vocabulari controlat com CIM-9-MC o CIM-10. En qualsevol cas, per tal que els sistemes d'informació puguin identificar, comparar i operar amb la informació que emmagatzemen, és necessari estrucutrar-la, utilitzant vocabularis controlats.