Jednym z narzędzi rozwiązywania problemów ekonomicznych jest analiza skupień. Używając go, klastry i inne obiekty w tablicy danych są podzielone na grupy. Ta metoda może być używana w programie Excel. Zobaczmy, jak to się dzieje w praktyce.
Korzystanie z analizy skupień
Za pomocą analizy skupień można próbkować na podstawie tego, co jest badane. Jego głównym zadaniem jest podział wielowymiarowych tablic na jednorodne grupy. Jako kryterium grupowania stosuje się współczynnik korelacji pary lub odległość euklidesową między obiektami zgodnie z danym parametrem. Najbliższe wartości są pogrupowane razem.
Chociaż najczęściej tego rodzaju analiza stosowana jest w gospodarce, może być również wykorzystywana w biologii (do klasyfikacji zwierząt), psychologii, medycynie i wielu innych obszarach ludzkiej działalności. Analiza klastra może być zastosowana w tym celu przy użyciu standardowego zestawu narzędzi programu Excel.
Przykład użycia
Mamy pięć obiektów, które charakteryzują dwa badane parametry - x i y .
- Zastosuj do tych wartości formułę odległości euklidesowej, która jest obliczana z szablonu:
=КОРЕНЬ((x2-x1)^2+(y2-y1)^2)
- Ta wartość jest obliczana między każdym z pięciu obiektów. Wyniki obliczeń umieszczane są w macierzy odległości.
- Patrzymy, między którymi wartościami jest najmniejsza odległość. W naszym przykładzie są to obiekty 1 i 2 . Odległość między nimi wynosi 4,123106, czyli mniej niż między dowolnymi innymi elementami danej populacji.
- Łączymy te dane w grupę i tworzymy nową macierz, w której wartości 1,2 są osobnym elementem. Podczas komponowania macierzy pozostawiamy najmniejsze wartości z poprzedniej tabeli dla połączonego elementu. Znowu patrzymy, pomiędzy jakie elementy odległość jest minimalna. Tym razem jest to 4 i 5 , a także obiekt 5 i grupa obiektów 1,2 . Odległość wynosi 6708204.
- Dodajemy określone elementy do ogólnego klastra. Tworzymy nową matrycę na tej samej zasadzie, co w poprzednim czasie. Oznacza to, że szukamy najniższych wartości. Widzimy więc, że nasz zestaw danych można podzielić na dwa klastry. W pierwszym skupieniu najbliższymi elementami są 1 , 2 , 4 , 5 . W drugim klastrze w naszym przypadku reprezentowany jest tylko jeden element - 3 . Jest stosunkowo daleko od innych obiektów. Odległość między klastrami wynosi 9,84.
To kończy procedurę podziału kolekcji na grupy.
Jak widać, chociaż ogólnie analiza skupień może się wydawać skomplikowaną procedurą, nietrudno zrozumieć niuanse tej metody. Najważniejsze jest zrozumienie podstawowego schematu grupowania.