Detecció de text ofuscat per evitar els detectors de plagi
Avila Ferré, Victor
Duran Cals, Jordi, dir. (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Títol variant: Detection of obfuscated text to avoid plagiarism detectors
Títol variant: Detección de texto ofuscado para evitar detectores de plagio
Data: 2016-06-24
Resum: En l'àmbit acadèmic i professional hi ha una corrent molt àmplia de plagis en els documents, atemptant contra la propietat intel·lectual de l'autor original. Per combatre'ls existeixen eines anomenades detectors de plagi, que permeten analitzar documents amb possibles irregularitats. Aquests detectors tenen una alta probabilitat de detecció, però poden ser enganyats utilitzant els anomenats mètodes d'ofuscació. Els mètodes d'ofuscació permeten al plagiador utilitzar tècniques no visibles per al sistema visual humà que confonen al detector, fent que els documents fruit del plagi no siguin detectats correctament. Aquest projecte té com a finalitat desenvolupar una llibreria capaç d'analitzar documents per detectar indicis d'ofuscació en el seu contingut. Els detectors de plagi podran fer ús d'aquesta eina per augmentar la seva eficàcia. El desenvolupament del projecte consta d'un treball de camp previ per a la cerca de la informació necessària per a la seva posterior realització, així com un treball de desenvolupament on es dura a terme la programació i les proves de funcionament de la llibreria.
Resum: In every academic and profesional field there is a wide variety of plagiarisms in documents, attempting to the intellectual property of the original author. In order to face such attempts, there are tools named "plagiarism detectors" that are able to analyse documents with possible irregularities. These detectors have a high chance of detection, but they can also be deceived by using the so-called obfuscation techniques. Obfusation techniques allow the plagiarist to use non visible techniques for the human visual system which confuse the detector, making plagiarized documents not being detected correctly. The main purpose of this project is to develop a library capable of analysing documents to detect evidences of obfuscation in its content. Plaguiarism detectors will be able to use this tool to increase its efficiency. The development of this project consists in a previous field work in order to search the necessary information for its later realization, and a development work where the programming and the funcionality tests of the library will be held.
Resum: En el ámbito académico y profesional hay una corriente muy importante de plagios en los documentos, atentando contra la propiedad intelectual del autor original. Para combatirlos existen herramientas llamadas detectores de plagio, que permiten analizar documentos con posibles irregularidades. Estos detectores tienen una alta probabilidad de detección, pero pueden ser engañados utilizando los llamados métodos de ofuscación. Los métodos de ofuscación permiten al plagiador utilizar técnicas no visibles para el sistema visual humano que confunden a los detectores, haciendo que documentos plagiados no sean detectados por el detector. Este proyecto tiene como finalidad el desarrollo de una librería capaz de analizar documentos para detectar indicios de ofuscación en su contenido. Los detectores de plagio podrán utilizar esta herramienta para aumentar su eficacia. El desarrollo del proyecto consta de un trabajo de campo previo para la búsqueda de información necesaria para el desarrollo posterior, así como un trabajo de desarrollo donde se realizara la programación y las pruebas de funcionamiento de la librería.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Llengua: Català
Titulació: Grau en Enginyeria Informàtica [2502441]
Pla d'estudis: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Àrea temàtica: Menció Tecnologies de la Informació
Matèria: Ofuscació ; Java ; Alfabet ciríl·lic ; Alfabet llatí ; Tika ; Itext ; Detector ; Plagi ; Shuffling obfuscation ; Singleton ; ODT ; PDF ; TXT ; DOC ; DOCX ; Ofuscación ; Alfabeto cirílico ; Alfabeto latín ; Plagio ; Obfuscation ; Cyrilic alphabet ; Latin alphabet ; Plagiarism



14 p, 1.7 MB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de Fi de Grau > Escola d'Enginyeria. TFG

 Registre creat el 2016-09-30, darrera modificació el 2024-07-20



   Favorit i Compartir