همبستگی پیرسون
📊 همبستگی پیرسون در آمار 📈
Pearson correlation
همبستگی پیرسون یک معیار آماری است که میزان رابطه خطی بین دو متغیر پیوسته را کمی می کند. نام آن از کارل پیرسون گرفته شده است که این روش را در اواخر قرن نوزدهم به عنوان راهی برای خلاصه کردن قدرت و جهت یک رابطه خطی بین دو متغیر توسعه داد.
درک همبستگی پیرسون:
ضریب همبستگی پیرسون که اغلب با نماد ‘r’ نشان داده می شود، از ۱- تا ۱+ متغیر است. مقدار ۱+ نشان دهنده رابطه خطی مثبت کامل، ۱- نشان دهنده رابطه خطی منفی کامل و ۰ نشان دهنده عدم وجود رابطه خطی بین متغیرها است.
از نظر ریاضی، ضریب همبستگی پیرسون به عنوان کوواریانس دو متغیر تقسیم بر حاصل ضرب انحراف معیار آنها محاسبه می شود.
خواص و تفسیر همبستگی پیرسون:
۱٫ **استحکام رابطه**:
– بزرگی ضریب همبستگی نشان دهنده قدرت رابطه بین متغیرها است. نزدیکتر به +۱ یا -۱ نشان دهنده یک رابطه قوی تر است، در حالی که نزدیکتر به ۰ نشان دهنده یک رابطه ضعیف است.
۲٫ **مسیر رابطه**:
– علامت ضریب همبستگی (+/-) جهت رابطه را نشان می دهد. مقادیر مثبت یک رابطه مثبت را نشان می دهد که در آن هر دو متغیر در یک جهت حرکت می کنند، در حالی که مقادیر منفی نشان دهنده یک رابطه منفی است که در جهت مخالف حرکت می کنند.
۳٫ **غیر خطی**:
– همبستگی پیرسون فقط روابط خطی را اندازه گیری می کند. اگر رابطه بین متغیرها غیر خطی باشد، همبستگی پیرسون ممکن است ارتباط را به درستی نشان ندهد.
۴٫ **خطاها**:
– نقاط پرت می توانند به شدت بر ضریب همبستگی پیرسون تأثیر بگذارند، به خصوص در حجم نمونه کوچک.
استفاده از همبستگی پیرسون در تحقیق و عمل:
۱٫ **تحلیل همبستگی**:
– محققان از همبستگی پیرسون برای کشف روابط بین متغیرها در زمینه های مختلف مانند روانشناسی، اقتصاد، زیست شناسی و غیره استفاده می کنند. این به درک اینکه چگونه تغییرات در یک متغیر با تغییرات در متغیر دیگر مرتبط است کمک می کند.
۲٫ **مدل سازی پیش بینی کننده**:
– در مدل سازی پیش بینی، تحلیل همبستگی در انتخاب ویژگی ضروری است. متغیرهای بسیار همبسته ممکن است در یک مدل اضافی باشند و منجر به مسائل چند خطی شوند.
۳٫ **کنترل کیفیت**:
– در فرآیندهای ساخت و کنترل کیفیت می توان از همبستگی پیرسون برای بررسی رابطه بین متغیرهای ورودی و کیفیت محصول استفاده کرد.
۴٫ **تحلیل مالی**:
– در امور مالی، از تحلیل همبستگی برای مطالعه رابطه بین طبقات مختلف دارایی برای ایجاد پرتفوی سرمایه گذاری متنوع استفاده می شود.
مفروضات و محدودیت های همبستگی پیرسون:
۱٫ **خطی بودن**:
– همانطور که قبلا ذکر شد، همبستگی پیرسون یک رابطه خطی بین متغیرها را فرض می کند. اگر رابطه غیر خطی باشد، سایر معیارهای همبستگی مانند همبستگی رتبه اسپیرمن ممکن است مناسب تر باشند.
۲٫ **همسانی**:
– متغیرها باید یک واریانس ثابت در مقادیر مختلف پیش بینی داشته باشند.
۳٫ **خطاها**:
– نقاط پرت می توانند نتایج تجزیه و تحلیل همبستگی را تحریف کنند و منجر به تفسیرهای نادرست شوند.
۴٫ **اندازه نمونه**:
– همبستگی پیرسون با حجم نمونه بزرگ به خوبی کار می کند. با حجم نمونه کوچک، نتایج ممکن است قابل اعتماد نباشد.