lenllac.jpg (4036 bytes)

Revista del Servei d'Informàtica de la UAB

Ricardo Baeza: Com recuperar informació d'Internet?


Ricardo Baeza-Yates és catedràtic en Ciències de la Computació de la Universitat de Xile i estudiós de la Internet. La seves investigacions, ara, es centren en la recuperació de la informació al Worl Wide Web a través dels cercadors. Baeza, en un acte organitzat per l'Oficina Autònoma Interactiva Docent, va impartir una conferència al Centre de Visió per Computador de la UAB en la que va fer una aproximació quantitativa i qualitativa a Internet.

Va parlar de la teoria del món petit, que explica que un individu que conegui a vuit o nou persones té accés a tota la població mundial utilitzant els seus contactes. En canvi, a Internet, per tenir accés a tota la informació "els contactes" oscil·len entre el coneixament d'entre 30 i 900 webs. A partir de les quals, i fent servir els enllaços que tinguin, podem arribar a navegar per totes les pàgines del Worl Wide Web.

Baeza també va centrar gran part de la seva conferència en exposar dades de la xarxa: sabíeu que el 30% dels webs que hi ha al World Wide Web estan repetits? I que cada mes desapareix també, un 30% de la informació? Altres dades interessants que va donar a conèixer Ricardo Baeza són:

- S'estima que al Worl Wide Web (WWW) hi ha entre 2.500 i 3.000 milions de pàgines web.

- De totes elles, el 96% corresponen a llocs comercials i 3.8 milions corresponen a pàgines personals.

- 27 milions d'elles són servidors; és a dir, una de cada cinc.

- Les visites a les pàgines web provenen en la seva immensa majoria de buscadors.

- A Espanya, el 60% dels llocs són ".com" enlloc de ser ".es"

Juntament amb Berthier Ribiero-Neto Baeza ha publicat el llibre Information retrieval (La recuperació de la informació) a l'editorial Addison-Wersley. El llibre explica els canvis que s'han produït en els últims temps a l'hora de recuperar la informació de la xarxa. Es pot trobar més informació sobre aquesta publicació, així com algun capítol a http://www.sunsite.dcc.uchile.cl/irbook/ i a http://www.awlonline.com/product/0,2627,020139829X,00.html

Si voleu saber més coses en relació al temes tractats en aquest article us podeu adreçar a la revista En.red.ando que conté diversos articles al respecte:

Portada
www.enredando.com
Un paseo por los mundos pequeños
www.enredando.com/cas/enredados/enredados166.html
Las mariposa en la red
www.enredando.com/cas/editorial/enredando212.html
Mitos de Internet:las aguas profundas y las islas perdidas de la web
www.enredando.com/cas/enredantes/enredantes107.html


Fitxa bibliogràfica

Nom llibre:
Information Retrieval
Autors:
Ricardo Baeza-Yates
Berthier Ribiero-Neto
Editorial:
Addison-Wersley
Any:
1999
Nº de pàgines:
464 páginas
ISBN:
0-201-39829-X

Ricardo Baeza és catedràtic en Ciències de la Computació de la Universitat de Xile. Es va llicenciar l'any 1983 en aquesta universitat, on també ha obtingut altres títols entre els que destaquen el d'Enginyeria Electrònica. Ha estat president de la Societat Xilena de Ciències de la Computació (SCCC) en el període de 1992 a 1995 i de 1997 a 1998, i l'any 1993 va rebre el premi que atorga la Organization of the American States als joves investigadors de les ciències exactes.
És el coautor de la segona edició del llibre Handbook of Algorithms and Data Structures, Addison-Wesley, 1991 i el coeditor de Information Retrieval: Algorithms and Data Structures, Prentice-Hall, 1992.
Les seves investigacions es basen en els algoritmes, la estructura de les dades i la recuperació de text i gràfics. Actualment coordina un projecte iberoamericà financiat per l'agència espanyola Cyted, relacionat amb les tècniques de búsqueda al web.

 

 

 


Elaborat pel Servei d'Informatica de la Universitat Autònoma de Barcelono
Edifici D 08193 Bellaterra (Cerdanyola del Vallès) Tel.: (93) 581 2100 Fax:(93) 581 20 94
Correu electrònic: enllac@si.uab.es
Data d'actualització: