Termenul „sistem de analiză statistică” este folosit pentru a se referi la software-ul care permite utilizatorului să efectueze analize statistice pe seturi de date. Un alt termen frecvent utilizat pentru acest tip de software este limbajul de programare statistică. Când este scris cu majuscule, Statistical Analysis System (SAS) este și numele propriu al unuia dintre cele mai cunoscute pachete software de acest tip.
Un sistem de analiză statistică oferă puterea de automatizare și procesare necesară pentru a facilita manipularea și analiza seturilor de date. Aceste pachete facilitează calculul statisticilor descriptive și inductive. Calculele statistice descriptive utilizate în mod obișnuit includ calculul tendinței centrale, distribuția frecvenței și asocierea. Analiza statistică inductivă care poate fi efectuată cu un sistem de analiză statistică include testarea ipotezelor statistice, cum ar fi testul t, testul z și testul chi-pătrat. Multe sisteme de analiză statistică acceptă și alte teste, cum ar fi analiza varianței (ANOVA) și rudele acesteia și diferite tipuri de testare de regresie.
Sistemele de analiză statistică sunt utilizate într-o mare varietate de setări. Oamenii de științe naturale și sociale din mediile de cercetare academică și comercială sunt cei mai frecventi utilizatori ai acestor tipuri de pachete software. Întreprinderile pot utiliza, de asemenea, un sistem de analiză statistică pentru cercetarea operațională, managementul proiectelor și alte aplicații de business intelligence.
Cu unele pachete software, interfața de linie de comandă (CLI) este folosită mai des, în timp ce altele prezintă în principal o interfață grafică cu utilizatorul (GUI), adesea cu meniuri derulante. Majoritatea pachetelor software oferă atât capabilități CLI, cât și GUI, deși este posibil ca utilizatorul să nu poată accesa toate caracteristicile de la ambele interfețe. În timp ce un GUI este mai familiar pentru utilizatorii non-tehnici, utilizarea unui CLI pentru a crea programe permite o replicare mai ușoară a analizelor.
Multe pachete de software de statistică folosesc limbaje de programare din a patra generație (4GL). Datorită nivelului lor mai ridicat de abstractizare și a sintaxei mai naturale, manipularea și analiza datelor în 4GL este mai rapidă și mai ușoară decât în limbajele de programare de nivel inferior. Înainte de dezvoltarea 4GL, analiza statistică asistată de computer era greoaie și necesita mai multă expertiză în programare.
Sunt disponibile un număr mare de aplicații software de analiză statistică cu interfețe, capabilități și extensii variate. Aplicațiile software proprietare rămân populare, dar multe aplicații software open-source sunt, de asemenea, utilizate pe scară largă. Practic, toate pachetele software de statistică vor rula pe sistemele de operare Windows® și majoritatea au, de asemenea, versiuni Macintosh® și Linux®. Câteva aplicații sunt compatibile și cu sistemele de operare Unix®.