8 pași ca să proiectezi un eșantion - Partea I

În primele două articole (1, 2) m-am concentrat pe a aduce argumente de ce eșantionarea pentru un studiu F2F în RO se face pe regulile/ metodologia unei eșantionări multi-stratificate combinată cu cea cluster. În fapt, am răspuns la întrebarea “Cum ajung la respondent?”.

Eu când gândesc eșantionarea, indiferent de studiu, caut să-mi răspund la următoarele întrebări, care nu sunt altceva decât pașii pe care îi parcurg eu în minte, ca o schema logică:

1. Cine este respondentul eligibil? Respondentul eligibil este echivalent cu target sau populație țintă, target-ul de interes pentru studiu.

Să dau definiția în detaliu, chiar în sensul de vizualizare a lui, urmărind să dau valori/ sens unor variabile socio-demografice de bază (sex, vârstă, mediul de rezidență sau mărimea de localitate – am să mă refer sporadic la ambele noțiuni, regiune). Dacă la aceste variabile socio-demografice, despre care putem spune că există statistici oficiale, se mai adaugă și alte variabile, deja pot spune că am o definiție complicată.

Din acest prim punct pot să constat că unitatea de eșantionare va fi populația/ consumatorul, gospodăria, compania(iile), școlile/ unitățile de învățământ, elevi/ studenți, etc...

2. Știu câți oameni/ entități/ unități îndeplinesc condițiile din definiția populației țintă din total populație?

În alți termeni, ar fi vorba de incidența target-ului/ populației țintă la nivel total. Poate părea de necrezut cât de importantă este această informație... e de bine când este mare și de rău când este mică. Știu, vă bag în ceață cu intenție... ce înseamnă o incidență mică – mare.

A) Să spunem că avem de făcut un studiu în rândul angajaților unei bănci, un studiu de satisfacție a angajaților. Banca are 3000 de angajați din care 2800 au și adresă de e-mail și sunt de interes în acțiunea băncii. Intenția este de a invita la sondaj pe toți cei 2800 de angajați. Populația țintă este dată de lista de angajați pe care banca i-a considerat relevanți pentru acțiunea lor și sunt 2800, deci vorbim de o incidență de 100%.

B) Avem o companie farmaceutică care face medicamente pentru bolile oncologice, indiferent de specializare (exercițiu imaginativ), și are ca obiectiv de research să măsoare notorietatea mărcii și percepția despre marcă. Target-ul țintă sunt toți medicii oncologi din România. Am spune că avem, din nou, o incidență de 100%. Am nevoie de medici oncologi, deci mă duc la toți, indiferent de specializare. Dacă am fi avut nevoie doar de oncologi din aria dermatologie, să spunem, atunci incidența ar fi arătat altfel, cu siguranță – formula de calcul ar fi oncologi din specializarea de interes împărțit la numărul total oncologi. Probabil vorbim de o rată sub 20%, poate mai degrabă spre 10%.

C) Un furnizor de servicii avansate de tehnologie vrea să știe ce are de făcut pentru a-și crește notorietatea și ulterior market share-ul (cota de piață) în rândul companiilor din segmentul IMM, care au mai mult de 10 angajați.

Definiția categoriei IMM: “este alcătuită din întreprinderi care angajează mai puţin de 250 de persoane şi care au o cifră de afaceri anuală care nu depăşeşte 50 de milioane de euro şi/ sau un bilanț contabil anual care nu depășește 43 de milioane de euro.” - aici ghid complet.

INS spune că în 2020 erau ușor peste 600.000 companii în RO, 91% din ele fiind în segmentul 0-9 angajați, pe care, conform definiției pentru target-ul țintă (dat de client), trebuie să-l eliminăm.

Distribuția companiilor după număr angajați:

Definiția IMM-urilor ne impune să eliminăm și ultimul segment, al companiilor cu 250 angajați sau mai mulți. Înseamnă că rămânem cu 9%, fără să mai luăm în considerare și condiția de cifră de afaceri.

Rata de incidență poate dicta multe decizii privind metodologia de research potrivită pentru studiul de cercetare de piață pe care îl gândești.

3. Există/ am date despre profilarea target-ului țintă?

Când target-ul țintă este definit prin populație + 18 ani, național, atunci mă pot baza, cert, pe datele pe care le pune la dispoziție INS.

Datele de profilare sunt importante pentru a ști distribuția la nivel de regiune și mărimea de localitate. Apoi, oricât te-ai strădui să faci eșantion probabilistic și să iei toate precauțiile din lume privind corectitudinea completării, erorile sunt reale și inerente, fie că vin din eșantionare – mod de selecție a punctelor de eșantionare, a respondentului, din completarea interviului, etc.. Rata de refuz (refuzul de a participa la sondaj) are o influență foarte mare în calitatea eșantionării pentru că poate schimba profilul target-ului țintă, existând riscul să nu acoperi bine populația de interes. Și, crede-mă, rata de refuz a crescut foarte mult în timp (în rău pentru cercetători, în sensul că a crescut considerabil) și sigur este în schimbare chiar acum, după anii de pandemie și nesiguranță economică și de pace. Este foarte diferită între femei vs. bărbați, între tineri și cei în vârstă, între București/ orașe mari și rural sau urban mic.

Ai nevoie de aceste date de profilare pentru a verifica structura eșantionului pe variabilele socio-demografice. Să știi cât de mari sunt abaterile, unde/ pe ce straturi se întâmplă. Se prea poate să iei în calcul ponderarea datelor pentru a aduce eșantionul la structura oficială. Aici intervine noțiunea de reprezentativitate a eșantionului – să respecte structura populației ținte. Să ai certitudinea (adică un prag de încredere mare) că dacă generai/ făceai un număr infinit de eșantioane, respectând metodologia aleasă de tine, ai fi ajuns la aceleași rezultate, cu abateri în limitele erorii maxime de eșantionare.

Dacă răspunsul este da, atunci poți sta liniștit/ă. Dacă nu, ar fi bine să te asiguri încă din acest moment că există o sursă și ai acces la ea (bine, ideal din momentul ofertării). Dacă ești foarte ghinionist/ă și chiar nu există nicăieri o sursă, ar fi bine să ai un buget separat pentru a rezolva această lipsă de date.

Vezi care sunt următorii pași aici.

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram