fayerwayer

DEviaNT: Sistema que identifica frases con potencial para una broma de doble sentido

Básicamente el sistema llamado Double Entendre via Noun Transfer (DEviaNT), reconoce cuando es divertido seguir una frase con “that’s what she said” (TWSS) como cuando alguien dice “¿No crees que estos bollos son demasiado para esta carne?” o “Wow, esa es una espada muy grande”.

La automatización de este proceso implica la identificación de frases que contienen posibles eufemismos y siguen una estructura particular – un difícil problema para la comprensión del lenguaje natural.

Publicidad

Los investigadores empezaron analizando dos conjuntos diferentes de texto, una con 1,5 millones de frases eróticas, y otro con 57.000 de la literatura estándar. Para esta prueba entrenaron a DEviaNT con la recopilación de chistes de twssstories.com y textos no-TWSS de sitios como wikiquote.org.

El sistema logró un 70% de precisión, pero los investigadores dicen que esto es bajo porque gran parte de los datos de entrenamiento no eran de bromas TWSS, pero con más datos se podría alcanzar 99,5% de precisión. Los resultados serán presentados en la Reunión Anual de la Asociación de Lingüística Computacional en junio y esperan que más adelante el trabajo con DEviaNT pueda identificar otras expresiones de doble sentido.

Obviamente este sistema no sirve de nada si no pasa la prueba del “alburmexicano y como ejemplo todos (o casi todos) los tweets etiquetados con #alburfree,  bueno es lo que dijo ella.

Link: That’s what she said: Software that tells dirty jokes (Newscientist)

Síguenos en Google News:Google News

Contenido Patrocinado

Lo Último