Título: String Distances for Near-duplicate Detection
Autores: Dănăilă,Iulia
Dinu,Liviu P.
Niculae,Vlad
Sulea,Octavia-Maria
Fecha: 2012-06-01
Publicador: SCIELO
Fuente:
Tipo: journal article
Tema: Near-duplicate detection
string similarity measures
database
data mining
Descripción: Near-duplicate detection is important when dealing with large, noisy databases in data mining tasks. In this paper, we present the results of applying the Rank distance and the Smith-Waterman distance, along with more popular string similarity measures such as the Levenshtein distance, together with a disjoint set data structure, for the problem of near-duplicate detection.
Idioma: Inglés

Artículos similares:

Fracturas maxilofaciales y factores asociados en derechohabientes del IMSS Campeche, México: Análisis retrospectivo 1994-1999 por Medina-Solis,Cario Eduardo,Córdova-González,José Luis,Casanova-Rosado,Alejandro José,Zazueta-Hernández,Maria Alejandra
Factores de riesgo de mortalidad en el hijo de madre toxémica por Gómez-Gómez,Manuel,Danglot-Banck,Cecilia,García-de la Torre,Guadalupe Silvia,Antonio-Ocampo,Abdiel,Fajardo-Gutiérrez,Arturo,Sánchez-García,Maria Luisa,Ahumada-Ramírez,Elias
Cerámicas mexicanas para cicatrización de piel por Piña-Barba,María Cristina,Tejeda-Cruz,Adriana,Regalado-Hernández,Miguel Ángel,Arenas-Reyes,María Isabel,Martín-Mandujano,Salvador,Montalvo,César
Seguimiento de egresados de un diplomado en enseñanza de la Medicina por Ponce de León-Castañeda,Ma. Eugenia,Ruíz-Alcocer,Ma. del Carmen,Lozano-Sánchez,J. Rogelio
Primer estudio de teledermatología en México: Una nueva herramienta de salud pública por Lepe,Verónica,Moneada,Benjamín,Castanedo-Cázares,Juan Pablo,Martínez-Rodríguez,Alejandra,Mercado-Ceja,Sergio M,Gordillo-Moscoso,Antonio
10