L
Título: WikiGrep Distribuido: Búsquedas avanzadas en la Wikipedia
Autores: Varas Palomeque, Irene Carolina
Paladines Herrera, Gabriel Antonio
Abad, Cristina
Fecha: 2009-10-15
2009-10-15
2009-10-15
Publicador:
Fuente: Ver documento
Tipo: Article
Tema: Haddop
cloud computing
MapReduce
Elastic MapReduce
Simple storage service S3
Wikipedia
dataset
clúster EC2.
Descripción: In this project we created a regular expressions search engine that uses the Wikipedia database of articles. The system allows the use of to enter a regular expression and makes an asynchronous request to initialize an EC2 cluster; it searches for the pattern inside all the Wikipedia and then returns the result, displaying a list of all the occurrences of the pattern and a link to the Wikipedia Article. We used the Amazon Web Services, Java libraries to manipulate Wikipedia Articles, the Hadoop framework and a dataset of the Wikipedia Articles. We tested some regular expressions that couldn’t be searched for using neither traditional search engines nor the Wikipedia Search Engine. Our tests show that an advanced search engine could be cheap to implement providing high scalability through the use of cloud computing and data-intensive computing techniques.
Idioma: Español
Artículos similares:
Datawarehousing Y Su Aplicación Como Apoyo A La Toma De Decisiones En La Espol por Rodríguez Rojas, José Francisco,Bustamante Collaguazo, Juan Carlos,Echeverria Briones, Pedro Fabricio
Proyecto: Plan De Negocios Para La Creación De Una Microempresa De Instalaciones De Ultima Milla En La Ciudad De Guayaquil por Campoverde Peñaloza, Javier S.,Castro Balseca, Maria De L.,Lopez Rodriguez, Francisco X.,Salazar Meza, Enrique Genaro
Turismo Educativo: Propuesta De Creación De Un Programa De Enseñanza De Español Para Extranjeros, En Espol por Proaño Moreira, Jose Luis,Yepez Aviles, Mario Alberto,Gavilanes Valle, Julio Enrique
10