Lunes, 05 Enero 2015 14:17

Premian a alumno del IPN por Software antiplagio

Escrito por

El primer lugar en la categoría de Alineación de Textos de la 11 edición del Evaluation Lab on Uncovering Plagiarism, Authorship, and Social Software Misuse (conocido como PAN) celebrado en la Universidad de Sheffield, Inglaterra, fue otorgado al alumno de doctorado, Miguel Ángel Sánchez Pérez y los investigadores Alexander Gelbukh y Grigori Sidorov, del Centro de Investigación en Computación (CIC) del Instituto Politécnico Nacional (IPN).

El software que desarrollaron es un modelo de detección de plagio que permite identificar textos producto de la piratería.

El modelo, desarrollado por Sánchez con la asesoría de Gelbukh y Sidorov para obtener el grado de maestro en Ciencias de la Computación, superó en el certamen a trabajos desarrollados por competidores de otros países como Chile, Estados Unidos, España, Alemania, China y Reino Unido.

Sánchez señaló que descubrir un plagio implica la búsqueda y conocimiento de una amplia cantidad de textos en fuentes originales, por ello científicos de todo el mundo centran sus investigaciones en la generación de modelos para la detección automática de plagio.

Explicó que la localización de fragmentos de texto que son semejantes entre dos documentos se le denomina alineación.

Para competir, el modelo debía llevarse a un sistema o software con alto grado de eficiencia, porque se evalúan miles de documentos, se hace un gran número de comparaciones entre textos en busca de fragmentos plagiados.

“En el certamen se proporciona a los equipos competidores una base de datos aproximado de 5 mil pares de documentos a comparar, los cuales pueden o no contener plagio”, señaló.

Sánchez también comentó que el proceso del concurso consiste en encontrar con el modelo desarrollado los fragmentos similares entre un par de documentos que les fueron proporcionados.

“Para evaluar qué tan bien encontramos un par de fragmentos similares, las medidas usadas son precisión y exhaustividad. Precisión se refiere a cuántos caracteres del texto que detecté realmente fueron plagiados, mientras que exhaustividad se refiere a cuántos, de la cantidad de caracteres que fueron plagiados, detecté. La combinación de esos dos parámetros nos permitió ganar el concurso”, expresó el galardonado.

El politécnico señaló que es difícil que un sistema de este tipo tenga una certeza de 100 por ciento.

“Hace falta la intervención de un humano, pero el sistema puede ayudarle a encontrar textos que quizá no había considerado y con fragmentos específicos para hacerlo más rápido”, subrayó.

Sánchez dijo que además de la detección de plagio, el modelo puede ayudar a la construcción de sitios de contenido colectivo, como Wikipedia, donde muchas personas escriben artículos, pero se elaboran numerosos contenidos sobre el mismo tema; el modelo podría informar al que escribe si su texto es único o posee similitudes que le permitirían integrarse a otro.

Señaló que a diferencia de otros participantes que no dan a conocer la forma en que obtienen sus resultados, “nosotros tenemos el código abierto en una página del doctor Alexander Gelbukh, por lo que cualquier persona puede acceder y usarlo, solo tiene que citar el artículo”.

Por la aportación tecnológica, con ese mismo modelo, el estudiante politécnico recientemente obtuvo el segundo lugar nacional en el Concurso de Mejor Tesis en Inteligencia Artificial, organizado por la Sociedad Mexicana de Inteligencia Artificial (SMIA).

 

 

 

 

 

Información y fotografía de Milenio

Realidad 7 Noticias

Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.

Síguenos en Facebook

banner

  1. Popular
  2. Trending
  3. Comments

Calendario 2018

« Agosto 2019 »
Lun Mar Mier Jue Vie Sáb Dom
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  

banner vertical