Integración de un buscador con indexación en tiempo real en Bodas.net
Martínez Rubio, Àlex
Koster, Andrew, dir.
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Additional title: Integration of a search engine with real-time indexing in Bodas.net
Additional title: Integració d'un cercador amb indexació en temps real a Bodas.net
Date: 2018-07-02
Abstract: En la web y apps de Bodas. net se utiliza el motor de búsqueda Sphinx para calcular resultados de búsqueda, listados de información y contenido relacionado. En Bodas. net se quiere explorar la posibilidad de hacer que la actualización de los índices sea en tiempo real. Sphinx tiene el problema de que la indexación en tiempo real es limitada y que la comunidad de desarrolladores es pequeña. En este proyecto, se ha realizado una comparativa entre los dos buscadores y se ha desarrollado un prototipo de integración de ElasticSearch en Bodas. net. Se ha montado un cluster de ElasticSearch virtualizado, se ha configurado y se han cargado datos de la web. Se ha adaptado el código para la actualización de los índices de ElasticSearch en tiempo real y para las búsquedas en el cluster, por lo que se ha buscado una biblioteca para ese propósito. Posteriormente se han ejecutado unas pruebas de estrés para medir tiempos de respuesta y degradación del servicio con el incremento de carga, comparándolo con la solución actual basada en Sphinx. Se han analizado los resultados y se ha demostrado que, tanto a nivel cualitativo como cuantitativo, ElasticSearch es mejor que Sphinx y se ha recomendado su implantación en Bodas. net.
Abstract: On the web and apps of Bodas. net, the Sphinx search engine is used to calculate search results, lists of information and related content. The company Bodas. net wants to explore the possibility of updating the indexes in real time. Sphinx has the problem that real-time indexing has limitations and that the developer community is small. This project has done a qualitative comparison between the two search engines and has developed a prototype of ElasticSearch integration to Bodas. net. A virtualized ElasticSearch cluster has been assembled and configured, and data from the web has been loaded. The PHP code has been adapted to integrate ElasticSearch, testing the functionalities of real-time indexing and searching in the cluster, so the existence of a library for that purpose has been investigated. Subsequently, stress tests have been designed and executed to measure response times and degradation of the service with the load increase, comparing it with the current solution based on Sphinx. The results have been analyzed and it has been proven that, both quantitatively and quantitatively, ElasticSearch is better than Sphinx and an implantation in Bodas. net has been advised.
Abstract: Al web i apps de Bodas. net s'utilitza el motor de cerca Sphinx per calcular resultats de cerca, llistats d'informació i contingut relacionat. A Bodas. net es vol explorar la possibilitat de fer que l'actualització dels índexs sigui en temps real. Sphinx té el problema que la indexació en temps real és limitada i que la comunitat de desenvolupadors és petita. En aquest projecte, s'ha realitzat una comparativa entre els dos cercadors i s'ha desenvolupat un prototip d'integració de ElasticSearch a Bodas. net. S'ha muntat un clúster de ElasticSearch virtualitzat, s'ha configurat i s'han carregat dades de la web. S'ha adaptat el codi per a l'actualització dels índexs de ElasticSearch en temps real i per a les cerques en el clúster, per la qual cosa s'ha buscat una biblioteca per a aquest propòsit. Posteriorment s'han executat unes proves d'estrès per mesurar temps de resposta i degradació del servei amb l'increment de càrrega, comparant-lo amb la solució actual basada en Sphinx. S'han analitzat els resultats i s'ha demostrat que, tant a nivell qualitatiu com quantitatiu, ElasticSearch és millor que Sphinx i s'ha recomanat la seva implantació a Bodas. net.
Rights: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Language: Castellà
Studies: Grau en Enginyeria Informàtica [2502441]
Study plan: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Subject area: Menció Tecnologies de la Informació
Subject: ElasticSearch ; SphinxSearch ; Motor de cerca ; Docker ; Cluster ; Indexació ; JMeter ; Prova de rendimient ; Motor de búsqueda ; Indexación ; Prueba de rendimiento ; Search engine ; Indexing ; PHP ; Benchmark



10 p, 522.9 KB

The record appears in these collections:
Research literature > Bachelor's degree final project > School of Engineering. TFG

 Record created 2018-10-24, last modified 2023-07-22



   Favorit i Compartir