Největším nepřítelem procesu učení se (kromě vlastní neochoty) je jednoznačně nepochopené slovo. Pokud se opravdu chcete statistiku naučit a text skutečně vnímat, nesmíte přejít bez povšimnutí slovo, kterému nerozumíte, ale naopak - musíte zjistit jeho význam. Pokud ho jen tak přeletíte, je sice možné, že text pochopíte, ale s mnohem větší pravděpodobností se probudíte za 10 řádků s tím, že nevíte, o čem čtete. Já se vám to budu snažit ještě ulehčit, a to tak, že každý pojem, který tu budu používat vám podrobně a srozumitelně definuji - moje oblíbené slovo je například. Tento úvod by měl definovat základní pojmy, se kterými ve statistice pracujeme. Samotná statistika je věda, která se zjednodušeně řečeno zabývá jednak pravděpodobností a na druhé straně tím, že analyzuje velké množství shromážděných dat (údaje o počasí za poslední dva roky, průzkum o nanucích na vzorku 2000 osob). Tato data třídí, hledá mezi nimi souvislosti, vyjadřuje se k pravděpodobnému budoucímu vývoji a tak podobně. Díky statistice dokážeme na základě velkého množství nic neříkajících čísel vyslovit nějaký závěr, který může mít pro nás větší či menší užitek. Například předpovědi počasí na období vzdálenější než čtrnáct dní jsou prakticky založené na statistických údajích o počasí a historických křivkách teplot a jen minimálně na aktuální situaci v atmosféře.
Ve statistice tedy pracujeme s opravdu velkým množstvím dat (statistický úřad se například zabývá většinou zkoumáním celého národa nebo celého průmyslového odvětví), většinou ale zkoumáme stejné znaky, které má mnoho stejných subjektů - například příjem domácností, zisk podniků chemické výroby atp. Subjekt, který zkoumáme, nazýváme statistickou jednotkou (to je ta domácnost, podnik) a jeho znak, vlastnost nazýváme statistický znak (příjem, zisk, velikost atp.). Tyto znaky mohou mít různý charakter, pro začátek mohou být číselné nebo slovní. Ty číselné se potom liší podle toho, zda je možné, aby nabývaly jakékoli hodnoty v určitém rozsahu (například chleba může vážit od 0 gramů přes 124,5432 gramů až do jakéhokoli čísla) - ty jsou spojité, nebo nabývají jen určité hodnoty (počet dětí jen 1, 2, 3, 4...; výsledek zápasu len 0, ½, 1) - ty jsou nespojité. Slovní znaky zase dělíme na nominální, u kterých neumíme určit, co je lepší, resp. co je víc (jako například místo bydliště - Praha, Brno, Olomouc - nedá se určit pořadí) a na pořadové, kde můžeme určit nějaké pořadí (známka ve škole ve slovním vyjádření - dobrý je určitě lepší, než nevyhověl).