Powrót

Model prognozy - metoda regresji liniowej

Teoria

Regresja[1] − metoda statystyczna umożliwiająca badanie powiązań pomiędzy wielkościami danych oraz przewidywanie nieznanych wartości jednych wartości na podstawie znanych wartości innych.   

W ujęciu formalnym pod pojęciem regresji rozumiemy dowolną metodę statystyczną, która pozwala oszacować warunkową wartość oczekiwaną zmiennej losowej, określaną czasem zmienną objaśnianą, dla zadanych wartości innej zmiennej lub wektora zmiennych losowych (tzw. zmiennych objaśniających).

W praktyce regresję używamy w dwóch fazach:  

  • konstruowanie modelu – czyli budowanie tzw. modelu regresyjnego – funkcji, która opisuje zależność pomiędzy wartością oczekiwaną zmiennej objaśnianej a zmiennymi objaśniającymi. Funkcja ta może być przedstawiona poprzez wzór matematyczny, ale również poprzez cały algorytm, np. w postaci sieci neuronowej czy drzewa regresyjnego. Model należy skonstruować tak aby dopasować go do danych z próby, która zawiera zmienne objaśniające oraz objaśniane.
  • stosowanie modelu (tzw. scoring) – faza, w której należy użyć już wyliczonego modelu aby wyznaczyć wartość oczekiwanej zmiennej objaśnianej.

Regresja z więcej niż jedną zmienną objaśniająca, zwana jest regresją wieloraką (ang. multiple regression).

Regresja liniowa[2] – zakłada, że istnieje zależność liniowa pomiędzy zmienną objaśnianą a objaśniającą oraz że jeżeli jedna wartość wzrasta to towarzyszy jej wzrost lub spadek drugiej zmiennej. Regresja przyjmuje postać funkcji liniowej:

Głównym celem analizy regresji liniowej jest wyliczenie takich współczynników regresji, aby możliwe było jak najlepsze przewidzenie wartości zmiennej zależnej w taki sposób aby błąd oszacowania był jak najmniejszy. 

W ogólnym przypadku zadanie prowadzi do oszacowania współczynników modelu statystycznego:

gdzie:

to zmienna objaśniana

 to zmienne objaśniające

to współczynniki modelu

 to błąd o wartości oczekiwanej zero

Najczęściej wykorzystywana metoda to klasyczna metoda najmniejszych kwadratów oraz jej pochodne. Jest to najstarsza i jednocześnie najłatwiejsza z metod. Niestety posiada wady (np. nie jest odporna na elementy odstające), które zostały usuniętę w innych mniej popularnych metodach (np. regresja medianowa, należąca do odpornych metod statystycznych).

Niedoskonałości tej metody w ogólnym przypadku pokazuje m.in. kwartet Anscombe'a – specjalnie przygotowany zestaw czterech zbiorów danych, które mają niemal tożsame wskaźniki statystyczne (średnią i wariancję w kierunku X i Y, współczynnik korelacji oraz prostą regresji) pomimo znacząco różnego charakteru danych.

 

 

Zasada działania

Po wprowadzeniu danych wejściowych:

  • Rachunek zysków i strat za 3 okresy
  • Bilans za 3 okresy

system opracuje raport przedstawiający w formie tabeli i wykresu prognozę na 7 przyszłych okresów.

Interpretacja wyniku

Na podstawie analizy 3 okresów system opracowuje za pomocą metody regresji liniowej prognozę sprawozdania finansowego na przyszłe okresy.


  • Analiza dynamiki sprawozdania finansowego

    Analiza dynamiki sprawozdania finansowego

    ok
  • Analiza rentowności przedsiębiorstwa

    Analiza rentowności przedsiębiorstwa

    ok
  • Dzienny raport sprzedaży

    Dzienny raport sprzedaży

    ok
  • Analiza form opodatkowania

    Analiza form opodatkowania

    ok
  • Wycena opcji walutowych

    Wycena opcji walutowych

    ok
  • Analiza wskaźnikowa dla KPiR

    Analiza wskaźnikowa dla KPiR

    ok
  • Model prognozy - metoda regresji liniowej

    Model prognozy - metoda regresji liniowej

    ok
  • Kalkulator dla umowy o pracę

    Kalkulator dla umowy o pracę

    ok
  • Rachunek przepływów

    Rachunek przepływów

    ok
  • Analiza ryzyka kredytowego

    Analiza ryzyka kredytowego

    ok
  • Wycena metoda likwidacyjna

    Wycena metoda likwidacyjna

    ok
  • Model Millera-Orra

    Model Millera-Orra

    ok