Co to jest system analizy statystycznej?

Termin „system analizy statystycznej” jest używany w odniesieniu do oprogramowania, które pozwala użytkownikowi przeprowadzać analizę statystyczną zbiorów danych. Innym powszechnie używanym terminem dla tego typu oprogramowania jest język programowania statystycznego. Pisząc wielką literą, Statistical Analysis System (SAS) jest również właściwą nazwą jednego z najbardziej znanych pakietów oprogramowania tego typu.

System analizy statystycznej zapewnia automatyzację i moc obliczeniową niezbędną do ułatwienia manipulacji i analizy zbiorów danych. Pakiety te ułatwiają obliczanie zarówno statystyk opisowych, jak i indukcyjnych. Powszechnie używane opisowe obliczenia statystyczne obejmują obliczanie tendencji centralnej, rozkładu częstości i asocjacji. Indukcyjna analiza statystyczna, którą można przeprowadzić za pomocą systemu analizy statystycznej, obejmuje testowanie hipotez statystycznych, takich jak test t, test z i test chi-kwadrat. Wiele systemów analizy statystycznej obsługuje również inne testy, takie jak analiza wariancji (ANOVA) i jej pokrewnych oraz różne rodzaje testów regresji.

Systemy analizy statystycznej są używane w wielu różnych ustawieniach. Najczęstszymi użytkownikami tego typu pakietów oprogramowania są przyrodnicy i naukowcy zajmujący się badaniami naukowymi i komercyjnymi. Firmy mogą również korzystać z systemu analizy statystycznej do badań operacyjnych, zarządzania projektami i innych aplikacji Business Intelligence.

W przypadku niektórych pakietów oprogramowania częściej używany jest interfejs wiersza poleceń (CLI), podczas gdy inne zawierają głównie graficzny interfejs użytkownika (GUI), często z rozwijanymi menu. Większość pakietów oprogramowania zapewnia zarówno funkcje CLI, jak i GUI, chociaż użytkownik może nie mieć dostępu do wszystkich funkcji z obu interfejsów. Podczas gdy graficzny interfejs użytkownika jest bardziej znany użytkownikom nietechnicznym, korzystanie z interfejsu CLI do tworzenia programów umożliwia łatwiejszą replikację analiz.

Wiele pakietów oprogramowania statystycznego wykorzystuje języki programowania czwartej generacji (4GL). Ze względu na wyższy poziom abstrakcji i bardziej naturalną składnię, manipulacja danymi i ich analiza w 4GL są szybsze i łatwiejsze niż w językach programowania niższego poziomu. Przed opracowaniem 4GL wspomagana komputerowo analiza statystyczna była kłopotliwa i wymagała większej wiedzy programistycznej.

Dostępna jest duża liczba aplikacji do analizy statystycznej z różnymi interfejsami, możliwościami i rozszerzeniami. Zastrzeżone aplikacje oprogramowania pozostają popularne, ale wiele aplikacji o otwartym kodzie źródłowym jest również szeroko stosowanych. Praktycznie wszystkie pakiety oprogramowania statystycznego będą działać w systemach operacyjnych Windows®, a większość z nich ma również wersje dla komputerów Macintosh® i Linux®. Kilka aplikacji jest również kompatybilnych z systemami operacyjnymi Unix®.