Иерархиялық кластерлеу - әлеуметтік желі деректерін талдаудың ең танымал және кеңінен қолданылатын әдісі. Бұл әдісте түйіндер ұқсастығы негізінде бір-бірімен салыстырылады. Үлкенірек топтар ұқсастығына қарай түйіндер топтарын біріктіру арқылы жасалады.
Иерархиялық кластерлеуді қашан пайдалану керек және K дегенді білдіреді?
Иерархиялық кластерлеу - бұл ағаш түрінде реттелген кірістірілген кластерлер жиынтығы. K кластерлердің құрылымы гипер сфералық болғанда кластерлеу жақсы жұмыс істейтінін білдіреді (2D-дегі шеңбер, 3D-дегі сфера сияқты). Иерархиялық кластерлеу де жұмыс істемейді, k кластерлердің пішіні гипер сфералық болғанын білдіреді.
Иерархиялық кластерлеуді қашан пайдалануым керек?
Иерархиялық кластерлеу деректер ұқсастықтарынан ағаш құрылымдарын құруға мүмкіндік беретін қуатты әдіс. Енді әртүрлі ішкі кластерлердің бір-бірімен байланысын және деректер нүктелерінің бір-бірінен қаншалықты алыс екенін көре аласыз.
Иерархиялық кластерлеуді қашан қолданбайсыз?
Әлсіз жақтары – ол ең жақсы шешімді сирек береді, ол көптеген ерікті шешімдерді қамтиды, жетпеген деректермен жұмыс істемейді, аралас деректер түрлерімен нашар жұмыс істейді, ол өте үлкен деректер жиындарында жақсы жұмыс істемейді және оның негізгі шығысы, дендрограмма әдетте қате түсіндіріледі.
Иерархиялық кластерлеудің қандай артықшылықтары бар?
Иерархиялық кластерлеудің күшті жақтары
- Бұлтүсіну және жүзеге асыру.
- Кластерлердің нақты санын алдын ала көрсетудің қажеті жоқ. …
- Олар мағыналы классификацияға сәйкес келуі мүмкін.
- Дендрограммаға қарап кластерлердің санын анықтау оңай.