למד מה רגרסיה ליניארית פשוטה האם וכיצד היא עובדת

גישה סטטיסטית בסיסית לניתוח נתונים כמותיים

באדיבות קולין בראוג, צלם. © 10, 2010 Stock.xchng

מודלים רגרסיה ליניארית משמשים כדי להראות או לחזות את הקשר בין שני משתנים או גורמים . גורם זה הוא ניבא (הגורם שבו המשוואה פותר ) נקרא משתנה תלוי. הגורמים המשמשים לחיזוי הערך של המשתנה התלוי נקראים המשתנים הבלתי תלויים.

נתונים טובים לא תמיד מספרים את הסיפור המלא. ניתוח רגרסיה הוא נפוץ במחקר כפי שהוא קובע כי קיים מתאם בין משתנים.

אבל המתאם אינו זהה לסיבתיות . אפילו קו ברגרסיה לינארית פשוטה שמתאימה לנתוני הנתונים היטב, לא יכול לומר משהו סופי על הקשר סיבה ותוצאה.

ברגרסיה ליניארית פשוטה, כל תצפית מורכבת משני ערכים. ערך אחד הוא עבור המשתנה התלוי וערך אחד הוא עבור המשתנה הבלתי תלוי.

מודל רגרסיה לינארית פשוטה

מודל רגרסיה ליניארית פשוטה מיוצגת כך: y = ( β 0 + β 1 + Ε

על ידי אמנה מתמטית, שני הגורמים המעורבים בניתוח רגרסיה ליניארית פשוטה מיועדים x ו- y .

המשוואה המתארת ​​כיצד y קשורה ל- x ידועה כמודל הרגרסיה . מודל רגרסיה ליניארית גם מכיל מונח שגיאה המיוצג על ידי Ε , או את האות היוונית epsilon. מונח השגיאה משמש כדי להסביר את השונות ב- y שלא ניתן להסביר על ידי הקשר הליניארי בין x ו- y .

יש גם פרמטרים המייצגים את האוכלוסייה הנלמדת. פרמטרים אלה של המודל המיוצגים על ידי ( β 0 + β 1 x ).

מודל רגרסיה לינארית פשוטה

משוואת הרגרסיה הקווית הפשוטה מיוצגת כך: Ε ( y ) = ( β 0 + β 1 x ).

משוואה רגרסיה ליניארית פשוטה היא גרפה כקו ישר.

( β 0 הוא יירוט y של קו הרגרסיה.

β 1 הוא המדרון.

Σ ( y ) הוא הערך הממוצע או הצפוי של y עבור ערך נתון של x .

קו רגרסיה יכול להראות קשר ליניארי חיובי, יחסים ליניאריים שליליים, או שום מערכת יחסים. אם קו הגרף ברגרסיה לינארית פשוטה הוא שטוח (לא משופע), אין קשר בין שני המשתנים. אם קו הרגרסיה מתרומם כלפי מעלה עם הקצה התחתון של השורה בציר y (גרף) של הגרף, וקצהו העליון של השורה מתרחב כלפי מעלה אל שדה הגרף, הרחק מהירט x (ציר) קיים קשר ליניארי חיובי . אם קו הרגרסיה יורד כלפי מטה עם הקצה העליון של השורה בציר y (גרף) של הגרף, וקצה השורה התחתונה מתרחב כלפי מטה אל שדה הגרף, לכיוון x יורט (ציר) קיים קשר ליניארי שלילי.

משוואת רגרסיה ליניארית משוערת

אם פרמטרים של האוכלוסייה היו ידועים, משוואת רגרסיה ליניארית פשוטה (להלן) ניתן להשתמש כדי לחשב את הערך הממוצע של y עבור ערך ידוע של x .

Σ ( y ) = ( β 0 + β 1 x ).

עם זאת, בפועל, ערכי הפרמטרים אינם ידועים ולכן יש לאמוד אותם באמצעות נתונים מדגם של האוכלוסייה. הפרמטרים של האוכלוסייה נאמדים באמצעות סטטיסטיקה מדגמית . הנתונים הסטטיסטיים של המדגם מיוצגים על ידי b 0 + b 1. כאשר הנתונים הסטטיסטיים של המדגם מוחלפים עבור הפרמטרים של האוכלוסייה, משוואת הרגרסיה המשוערת נוצרת.

משוואת הרגרסיה המשוערת מוצגת להלן.

( ŷ ) = ( β 0 + β 1 x

( ŷ ) מבוטא y כובע .

התרשים של משוואת הרגרסיה הפשוטה המשוערת נקרא קו הרגרסיה המשוער.

ב 0 הוא יירוט y.

ב 1 הוא המדרון.

Ŷ ) הוא הערך המשוער של y לערך נתון של x .

הערה חשובה: ניתוח רגרסיה אינו משמש לפרש יחסי סיבה ותוצאה בין משתנים. ניתוח רגרסיה יכול, עם זאת, להצביע על קשר בין משתנים או עד כמה משתנים קשורים זה לזה.

בדרך זו, ניתוח רגרסיה נוטה ליצור יחסים בולטים המצדיקים חוקר בעל ידע מתבונן .

ידוע גם בשם: רגרסיה bivariate, ניתוח רגרסיה

דוגמאות: שיטת ריבועים לפחות היא הליך סטטיסטי לשימוש בנתוני מדגם כדי למצוא את הערך של משוואת הרגרסיה המשוערת. שיטת ריבועים לפחות הוצע על ידי קרל פרידריך גאוס, שנולד בשנת 1777 ומת בשנת 1855. השיטה ריבועים לפחות עדיין בשימוש נרחב.

מקורות:

אנדרסון, ד"ר, סוויני, DJ, וויליאמס, ת"א (2003). יסודות הסטטיסטיקה של עסקים וכלכלה (3rd ed.) מייסון, אוהיו: דרום מערב, תומפסון למידה.

______. (2010). הסבר: ניתוח רגרסיה. חדשות MIT.

McIntyre, L. (1994). שימוש בנתוני סיגריות למבוא לריבוי רגרסיה. כתב עת לסטטיסטיקה של החינוך, 2 (1).

מנדנאל, וו, וסינקיך, ט. (1992). סטטיסטיקה להנדסה ומדעים (מהדורה שלישית), ניו יורק, ניו יורק: דלן הוצאה לאור

Panchenko, D. 184343 סטטיסטיקה עבור יישומים, סתיו 2006, סעיף 14, רגרסיה לינארית פשוטה. (המכון הטכנולוגי של מסצ 'וסטס: MIT OpenCourseWare)