מדגם - הגודל כן קובע!

מדגם – הגודל כן קובע!

קביעת גודל המדגם הנה אחת ההחלטות המהותיות בתכנון מחקר שוק, היות שגודל המדגם משפיע על מידת הדיוק של התוצאות. כדי להפיק רמת דיוק נאותה, שהולמת את מטרות המחקר, יש להתחשב, בין השאר, בקבוצות האוכלוסייה הרלוונטיות לניתוח, ובמונחים סטטיסטיים המאפיינים את רמת הדיוק.

מספר הקבוצות באוכלוסיה שאליהן מתייחסים בניתוח ממצאי המחקר

על פי רוב, בעת ניתוח הממצאים לא מסתפקים רק בממצאי כלל המדגם, אלא ניתנת התייחסות ספציפית לממצאים בקרב קבוצות רלוונטיות במדגם. למשל, במחקר בנושא אתרי אינטרנט, מסווגים את המשתתפים על פי תדירות הגלישה שלהם, ומתייחסים בנפרד לתשובותיהם של "הגולשים הכבדים", "הגולשים הבינוניים" ו- "הגולשים הקלים". כדי לאפשר ניתוח בקרב כל קבוצה, המדגם צריך להיות מספיק גדול, כך שלאחר סיווג המשתתפים לקבוצות, יהיו בכל קבוצה מספיק משתתפים. כלל אצבע לגודל הקבוצה הנו כ- 100 משתתפים. היות שהקבוצות אינן בהכרח פרופורציוניות בגודל, יש להעריך מהי הקבוצה הקטנה ביותר, ולקבוע מדגם שגודלו יבטיח השגת כמות משתתפים מספקת בקבוצה זו. 

לעיתים חלקה של אחת הקבוצות הרלוונטיות באוכלוסייה קטן מאד. במקום לקבוע מדגם גדול מאד שיבטיח מספר משתתפים מספיק בקבוצה זו, ניתן לבצע "עיבוי" של המדגם במשתתפים השייכים לאותה קבוצה קטנה: לאחר השגת מספר כלשהו של משתתפים לקבוצה באמצעות הדגימה הכללית, משלימים את הקבוצה עד לגודל הרצוי, על ידי גיוס משתתפים מתאימים. למשל, אם לאחר הדגימה הכללית התקבלה קבוצה של 20 גולשים "כבדים", ניתן להשלים את גודל הקבוצה ל- 100 ע"י גיוס 80 "גולשים כבדים" נוספים. בשלב זה בדגימה, מי שאיננו משתייך לקבוצת "הגולשים הכבדים" לא ישתתף במחקר.

בנוסף לניתוח בקרב הקבוצות הרלוונטיות במדגם, נבחנים ממצאי המחקר גם ברמת תתי-קבוצות. למשל, מקובל לחלק את הקבוצות לפי מאפיינים סוציו-דמוגרפיים, כגון: גיל, הכנסה, השכלה, וכיו"ב. כלל אצבע לגודלה של תת-קבוצה הנו בין 20 ל- 50 משתתפים.

מונחים סטטיסטיים לאפיון מידת הדיוק של תוצאות המחקר

בקביעת גודל המדגם נלקחת בחשבון, בין השאר, טעות התקן של הדגימה. נגדיר מונח זה באופן כללי, מבלי להיכנס לעומק התיאוריה הסטטיסטית:

נניח שאנו מודדים ציון לשביעות רצון הלקוחות: אנו בוחרים מדגם לקוחות בגודל 200, ומחשבים את הציון הממוצע של שביעות הרצון. נניח כעת שאנו מבצעים פעולה זו מספר פעמים במקביל: בכל פעם בוחרים מדגם של 200 לקוחות, ומחשבים את הציון הממוצע שהתקבל באותו מדגם. סביר מאד שבכל מדגם יתקבל ציון ממוצע אחר. היות שהציונים הממוצעים שהתקבלו אינם זהים, הם יוצרים התפלגות. ההתפלגות מאופיינת במידת פיזור מסוימת, המתוארת מספרית ע"י טעות התקן. כלומר, טעות התקן הנה מדד לפיזור התפלגות הציונים הממוצעים שהתקבלו במדגמים שונים בעלי גודל זהה. 

התפלגות הציונים הממוצעים שיצרנו הנה תיאורטית. במציאות אנו עושים שימוש במדגם יחיד, והציון הממוצע שמתקבל במדגם הנו רק נקודה אחת על גבי אותה התפלגות תיאורטית. אולם, ככל שטעות התקן קטנה יותר, קיים סיכוי גדול יותר שהציון הממוצע שקיבלנו ייפול בטווח מצומצם של ציונים ממוצעים, וקרוב יותר לציון הממוצע באוכלוסיה. ככל שנדרשת מידת דיוק רבה יותר, כלומר שהציון הממוצע במדגם יהיה קרוב יותר לציון הממוצע באוכלוסיה, טעות התקן צריכה להיות קטנה יותר.

קיים קשר הפוך בין גודל המדגם לבין טעות התקן. כלומר, ככל שהמדגם גדול יותר טעות התקן קטנה יותר. על כן, ככל שנזדקק לדיוק רב יותר, נרצה להקטין את טעות התקן, ולכן נקבע מדגם גדול יותר.

היות שגודל המדגם הנאות הנו פונקציה של טעות התקן (וגם של השונות באוכלוסייה ושל רמת הביטחון הנדרשת, שאינם משתנים לצורך דיון זה), גודלו של המדגם ביחס לגודל האוכלוסייה איננו רלוונטי בבחינת מידת הדיוק הנדרשת.

מאמרים נוספים שיכולים לעניין אותך