clustering

Autor: Lewis Jackson
Data Creației: 11 Mai 2021
Data Actualizării: 15 Mai 2024
Anonim
StatQuest: K-means clustering
Video: StatQuest: K-means clustering

Conţinut

Definiție - Ce înseamnă Clustering?

Clusteringul presupune gruparea unor obiecte similare într-un set cunoscut sub numele de cluster. Este posibil ca obiectele dintr-un cluster să fie diferite în comparație cu obiectele grupate sub un alt cluster. Clusteringul este una dintre principalele sarcini în exploatarea datelor miniere și este, de asemenea, o tehnică folosită în analiza statistică a datelor. Deși clusteringul nu este un algoritm specific, ci este o sarcină generală care poate fi rezolvată cu mai mulți algoritmi. Unele dintre cele mai populare metode de clustering utilizate sunt ierarhice, partiționare, bazate pe densitate și bazate pe model.


Clustering-ul este cunoscut și sub denumirea de analiză de clustering.

O introducere în Microsoft Azure și Microsoft Cloud | În acest ghid, veți afla despre ce este vorba despre cloud computing și despre cum Microsoft Azure vă poate ajuta să migrați și să conduceți afacerea din cloud.

Techopedia explică Clustering

Clusteringul este actul de a crea diferite clustere care au toate obiectele sub setul de date. În plus, clusteringul poate fi distins în clustering dur și moale. În clustering dur, un obiect fie aparține unui cluster, fie nu. Cu toate acestea, cu clustering soft (clustering fuzzy) un obiect poate aparține multor cluster-uri. Scopul final al clusteringului este de a grupa intrinsec datele fără marcaj. Găsește aplicații în cercetarea de piață, recunoașterea modelelor, analiza și analiza datelor, compresia datelor, recunoașterea imaginilor și multe altele.

Conceptul de cluster nu poate fi ușor definit și acesta este motivul pentru care sunt disponibili mai mulți algoritmi pentru clustering. Acești algoritmi diferă prin proprietățile lor și, prin urmare, cercetătorii sunt cunoscuți că aplică diferite modele de cluster pe baza datelor setate în cauză și, de asemenea, la ce este destinat să fie utilizat. De exemplu, gruparea ierarhică se bazează pe conectivitatea la distanță, în timp ce modelele de distribuție se bazează pe distribuții statistice.


Această definiție a fost scrisă în versiunea Google Analytics