Analiza regresji jest jedną z najpopularniejszych metod badań statystycznych. Za jego pomocą można określić stopień wpływu zmiennych niezależnych na zmienną zależną. W funkcjonalności Microsoft Excel istnieją narzędzia zaprojektowane do wykonywania tego typu analiz. Przeanalizujmy, czym są i jak z nich korzystać.
Spis treści
Aby jednak skorzystać z funkcji umożliwiającej przeprowadzenie analizy regresji, należy najpierw aktywować pakiet analityczny. Dopiero wtedy narzędzia potrzebne do tej procedury pojawią się na taśmie Excel.
Teraz, gdy przejdziemy do zakładki "Dane" , zobaczysz nowy przycisk na wstążce w polu narzędzia "Analiza" - "Analiza danych" .
Istnieje kilka rodzajów regresji:
O implementacji ostatniego typu analizy regresji w programie Excel omówimy później bardziej szczegółowo.
Poniżej przedstawiono tabelę, która pokazuje średnią dzienną temperaturę powietrza na ulicy oraz liczbę kupujących w danym dniu roboczym. Przekonajmy się przy pomocy analizy regresji, w jaki sposób warunki pogodowe w postaci temperatury powietrza mogą wpłynąć na obecność instytucji handlowej.
Ogólne równanie regresji liniowej postaci jest następujące: У = а0 + а1х1 +…+акхк
. W tej formule Y oznacza zmienną, wpływ czynników, na których próbujemy się uczyć. W naszym przypadku jest to liczba kupujących. Wartość x to różne czynniki wpływające na zmienną. Parametry a są współczynnikami regresji. Oznacza to, że określają znaczenie tego lub tego czynnika. Indeks k oznacza całkowitą liczbę tych czynników.
W polu "Interwał wejściowy Y" określamy adres zakresu komórek, w którym znajdują się dane zmienne, wpływ czynników, na których próbujemy się ustalić. W naszym przypadku będą to komórki w kolumnie "Liczba kupujących". Adres można wprowadzić ręcznie z klawiatury lub po prostu wybrać żądaną kolumnę. Ta ostatnia opcja jest znacznie prostsza i wygodniejsza.
W polu "Interwał wejściowy X" wpisujemy adres zakresu komórek, w którym znajdują się dane czynnika, którego wpływ na zmienną, którą chcemy ustanowić. Jak wspomniano powyżej, musimy ustalić wpływ temperatury na liczbę kupujących, a zatem wpisać adres komórek w kolumnie "Temperatura". Można to zrobić w taki sam sposób, jak w polu "Liczba kupujących".
Za pomocą innych ustawień można ustawić etykiety, poziom niezawodności, stałe zero, wyświetlić wykres normalnego prawdopodobieństwa i wykonać inne czynności. Jednak w większości przypadków tych ustawień nie trzeba zmieniać. Jedyną rzeczą, na którą należy zwrócić uwagę, są parametry wyjściowe. Domyślnie wyniki analizy są wyprowadzane na innym arkuszu, ale zmieniając przełącznik, można ustawić dane wyjściowe w określonym zakresie na tym samym arkuszu, co tabela zawierająca oryginalne dane lub w osobnej książce, czyli w nowym pliku.
Po ustawieniu wszystkich ustawień kliknij przycisk "OK" .
Wyniki analizy regresji są wyświetlane w formie tabeli w miejscu wskazanym w ustawieniach.
Jednym z głównych wskaźników jest kwadrat R. Wskazuje jakość modelu. W naszym przypadku współczynnik ten wynosi 0,705 lub około 70,5%. Jest to akceptowalny poziom jakości. Zależność poniżej 0,5 jest słaba.
Kolejny ważny wskaźnik znajduje się w komórce na przecięciu linii "przecięcie Y" i kolumny "Współczynniki" . Wskazuje, jaka wartość będzie w Y, a w naszym przypadku jest to liczba kupujących, przy wszystkich innych czynnikach równych zero. W tej tabeli wartość ta wynosi 58,04.
Wartość na przecięciu wykresu "Variable X1" i "Coefficients" pokazuje poziom zależności Y na X. W naszym przypadku jest to stopień uzależnienia liczby klientów sklepu od temperatury. Współczynnik 1,31 jest uważany za dość wysoki wskaźnik oddziaływania.
Jak widać, za pomocą programu Microsoft Excel można łatwo utworzyć tabelę analizy regresji. Ale aby pracować z danymi otrzymanymi na wyjściu i zrozumieć ich istotę, może to zrobić tylko osoba przeszkolona.