Algoritmo HPStream

  • View
    26

  • Download
    0

Embed Size (px)

Transcript

Algoritmo HPStreamPresentado por: Juan Camilo Bernier Castro

Tcnica: Es

Agrupamiento (Clustering) un algoritmo de ventanas deslizantes del flujo de datos ya que es incremental y capaz de olvidar el pasado

HPStream

Es aplicable para el Agrupamiento Proyectado sobre Flujos de Datos Altamente Dimensionales (Projected Clustering of High Dimensional Data Streams) Agrupamiento: Un conjunto de puntos (de datos) que se quieren repartir dentro de uno o ms grupos de objetos similares, donde la nocin de similitud est definida por una funcin de distancia.

HPStream(2)cada registro X de un conjunto de datos, existe un tiempo T relacionado con el registro X. Tiempo de vida media: f(t0) = f(0) (de tal forma que se reduce el peso de cada registro a la mitad por cada procesamiento) Utiliza distancia Manhattan.

Para

HPStream(3) Cada

cluster es especfico a un grupo de dimensiones, a esos clusters se refieren como projected clusters (agrupamiento proyectado). a la ejecucin del algoritmo, se realiza un proceso de normalizacin para pesar las diferentes dimensiones correctamente.

Previamente

HPStream(4)

HPStream(5)

Utiliza los algoritmos: FindProjectedDist (para encontrar la distancia proyectada). ComputeDimensions(para calcular las dimensiones proyectadas). FindLimitingRadius (para encontrar el radio lmite del cluster).

Bibliografa:

http://charuaggarwal.net/projstream.pdf http://sci2s.ugr.es/docencia/doctoM6/datas treams.pdf http://pwp.etb.net.co/femrojas/Documento s/estado_del_arte_v1.3.pdf