ماتریس کوواریانس
در نظریه احتمال و آمار ، یک ماتریس کوواریانس (همچنین به عنوان ماتریس کوواریانس خودکار، ماتریس پراکندگی ، ماتریس واریانس ، یا ماتریس واریانس کوواریانس نیز شناخته میشود) یک ماتریس مربعی است که کوواریانس بین هر جفت از عناصر یک بردار تصادفی معینی را نشان میدهد. هر ماتریس کوواریانس متقارن و نیمه معین مثبت است و قطر اصلی آن دارای مقادیر واریانس است.
ماتریس کوواریانس مفهوم واریانس را به ابعاد چندگانه تعمیم می دهد. برای مثال، تغییر در مجموعه ای از نقاط تصادفی در فضای دو بعدی را نمی توان به طور کامل با یک عدد مشخص کرد، همچنین لازم به ذکر است واریانس های موجود در و دستورالعمل ها حاوی تمام اطلاعات لازم هستند. ماتریس برای توصیف کامل تغییرات دو بعدی ضروری است.
ماتریس کوواریانس یک بردار تصادفی است که با علامت یا نشان داده می شود.
تعریف
ویرایشدر سرتاسر این مقاله، با و برای ارجاع به بردارهای تصادفی استفاده میشوند و و برای اشاره به متغیرهای تصادفی اسکالر استفاده می شود.
اگر مقادیر ورودی در بردار ستونی
متغیرهای تصادفی که هر کدام دارای واریانس محدود و مقدار مورد انتظار هستند در نظر گرفته شوند سپس ماتریس کوواریانس ماتریسی است که ورودی کوواریانس است.
جایی که اپراتور مقدار مورد انتظار (میانگین یا همان expected) آرگومان خود را نشان می دهد.
نامگذاری ها و نمادهای متناقض
ویرایشنامگذاری ها متفاوت است. برخی از آماردانان، به پیروی از ویلیام فلر احتمال گرا در کتاب دو جلدی خود، مقدمه ای بر نظریه احتمال و کاربردهای آن ، ماتریس را واریانس بردار تصادفی می نامند، زیرا تعمیم طبیعی به ابعاد بالاتر واریانس 1 بعدی است. دیگران آن را ماتریس کوواریانس می نامند، زیرا ماتریس کوواریانس بین اجزای اسکالر بردار است.
هر دو فرم کاملا استاندارد هستند و هیچ ابهامی بین آنها وجود ندارد. ماتریس اغلب ماتریس واریانس کوواریانس نیز نامیده می شود، زیرا عبارات مورب (روی قطر اصلی) در واقع واریانس هستند.
همچنین در پایین نماد ماتریس کوواریانس متقاطع بین دو بردار را مشاهده می کنید.
خواص
ویرایشارتباط با ماتریس خودهمبستگی
ویرایشماتریس کوواریانس خودکار مربوط به ماتریس خودهمبستگی است توسط
که در آن ماتریس خودهمبستگی به صورت تعریف شده است.
رابطه با ماتریس همبستگی
ویرایشماتریسی نزدیک به ماتریس کوواریانس از لحاظ مفهومی، ماتریس ضرایب همبستگی محصول- لحظه پیرسون بین هر یک از متغیرهای تصادفی در بردار تصادفی است، که می تواند به صورت زیر نوشته شود:
جایی که ماتریس قطری است که عناصر روی قطر آن مقادیر هستند (یعنی یک ماتریس مورب از واریانس های برای ).
به طور مشابه ماتریس همبستگی را می توان به عنوان ماتریس کوواریانس متغیرهای تصادفی استاندارد شده مشاهده کرد.
هر عنصر روی قطر اصلی یک ماتریس covariance، همبستگی یا همان correlation یک متغیر تصادفی با خودش است که همیشه برابر با 1 است. همچنین هر عنصر خارج از مورب موجود بین 1- تا 1+ است.
معکوس ماتریس کوواریانس
ویرایشمعکوس این ماتریس، اگر وجود داشته باشد، ماتریس کوواریانس معکوس (طبیعتا)نامیده می شود که به عنوان ماتریس غلظت یا ماتریس دقت نیز شناخته می شود.
خواص اساسی
ویرایشبرای و ، جایی که یک متغیر تصادفی n بعدی است، ویژگی های اساسی زیر اعمال می شود:
- مثبت-نیمه معین (PSD) است، به عبارتی
- متقارن است (symmetric)، یعنی
- برای هر ثابت (غیر تصادفی) ماتریس و ثابت بردار ، یک x وجود دارد که :
- اگر یک بردار تصادفی دیگر با ابعاد مشابه است، سپس جایی که ماتریس کوواریانس متقابل برای و است.
ماتریس های بلوک
ویرایشمعنی مشترک و ماتریس کوواریانس مشترک از و را می توان به صورت بلوک نوشت:
جایی که ، و .
همجنین و را می توان به عنوان ماتریس های واریانس توزیع های حاشیه ای (marginal) برای و دانست.
اگر و jointly normally distributed باشند،
سپس توزیع شرطی برای به شرط (Y|X) از رابطه زیر بدست می آید:
امید ریاضی شرطی (conditional mean) تعریف شده است:
و واریانس شرطی
ماتریس به عنوان ماتریس ضرایب رگرسیون شناخته می شود، در حالی که در جبر خطی Schur complement در است.
ماتریس ضرایب رگرسیون اغلب ممکن است به شکل انتقال داده شود. مناسب برای ضرب یک بردار ردیفی از متغیرهای توضیحی است به جای اینکه یک بردار ستونی را از قبل ضرب کنیم. در این شکل آنها با ضرایب به دست آمده با معکوس کردن ماتریس معادلات نرمال حداقل مربعات معمولی (OLS) مطابقت دقیق دارند.
ماتریس کوواریانس جزئی
ویرایشیک ماتریس کوواریانس با همه عناصر غیر صفر می گوید که همه متغیرهای تصادفی فردی به هم مرتبط هستند. این بدان معنی ست که متغیرها نه تنها مستقیماً همبستگی دارند، بلکه از طریق سایر متغیرها نیز حتی به طور غیرمستقیم همبستگی دارند. اغلب چنین همبستگیهای غیرمستقیم و معمولی بیاهمیت و غیر کاربردی هستند. آنها را می توان با محاسبه ماتریس کوواریانس جزئی، که بخشی از ماتریس کوواریانس است که تنها بخش جالب همبستگی ها را نشان می دهد، سرکوب و خلا سلاح کرد.
اگر دو بردار از متغیرهای تصادفی و از طریق بردار دیگری مثل همبستگی دارند، همبستگی های اخیر در یک ماتریس سرکوب یا به اصطلاح suppressed می شوند [۱]
ماتریس کوواریانس جزئی به طور مؤثر ماتریس کوواریانس ساده است که مثل اینکه متغیرهای تصادفی غیر جالب هستند که ثابت نگه داشته شدند.
ماتریس کوواریانس به عنوان پارامتر یک توزیع
ویرایشاگر بردار ستونی از متغیرهای تصادفی احتمالاً همبسته به طور مشترک به طور نرمال یا به طور کلی بیضوی توزیع شوند ، سپس تابع چگالی احتمال آن را می توان بر حسب ماتریس کوواریانس به شرح زیر بیان کرد
جایی که و دترمینان است.
ماتریس کوواریانس به عنوان یک عملگر خطی
ویرایشبا اعمال بر یک بردار، ماتریس کوواریانس یک ترکیب خطی c از متغیرهای تصادفی X را روی بردار کوواریانس با آن متغیرها ترسیم می کند: . با در نظر گرفتن یک فرم دو خطی ، کوواریانس بین دو ترکیب خطی به دست میآید: . در نتیجه واریانس یک ترکیب خطی است، که کوواریانس آن با خودش است.
به طور مشابه، ماتریس کوواریانس معکوس (شبه) یک محصول درونی ارائه می دهد ، که فاصله Mahalanobis را القا می کند، معیاری برای "عدم احتمال" c .
کدام ماتریس ها ماتریس کوواریانس هستند؟
ویرایشطبق مفاهیم بالا فرض کنید یک بردار است پس ارزش واقعی بردار زیر
همیشه باید غیرمنفی باشد، زیرا واریانس یک متغیر تصادفی با ارزش واقعی است، بنابراین یک ماتریس کوواریانس همیشه یک ماتریس مثبت-نیمه معین است.
استدلال فوق را می توان به صورت زیر گسترش داد: که در آن آخرین نابرابری از مشاهده که اسکالر است.
برعکس، هر ماتریس نیمه معین مثبت متقارن یک ماتریس کوواریانس است. برای دیدن این، فرض کنید یک ماتریس متقارن مثبت-نیمه معین است. حال از حالت بعد محدود قضیه طیفی (spectral theorem)، نتیجه می شود که دارای یک جذر متقارن غیر منفی است که می توان آن را با M 1/2 نشان داد . اجازه دهید هر گونه وکتور با ارزش بردار ستونی که ماتریس کوواریانس آن ماتریس هویت است باشد.
بردارهای تصادفی پیچیده
ویرایشواریانس یک متغیر تصادفی مختلط با ارزش اسکالر به همراه امید ریاضی به طور معمول طبق قرارداد با استفاده از مزدوج مختلط تعریف می شود:
که در آن مزدوج مختلط یک عدد مختلط است نشان داده شده است ; بنابراین واریانس یک متغیر تصادفی مختلط یک عدد واقعی است.
اگر یک بردار ستونی متشکل از متغیرهای تصادفی با اعداد مختلط باشد، سپس ترانهاده مزدوج (conjugate transpose) از هر دو جابجایی و مزدوج شدن تشکیل می شود. در عبارت زیر، حاصل ضرب یک بردار با جابهجایی مزدوج آن، یک ماتریس مربعی به نام ماتریس کوواریانس به عنوان انتظار آن ایجاد میکند:
- ،
ماتریس بهدستآمده هرمیتی مثبت-نیمه معین (PSD Hermitian)، با اعداد حقیقی در مورب اصلی و اعداد مختلط خارج از قطر خواهد بود.
- خواص
- ماتریس کوواریانس یک ماتریس هرمیتی(Hermitian matrix) است، یعنی .
- عناصر قطری ماتریس کوواریانس واقعی هستند.
ماتریس شبه کوواریانس
ویرایشبرای بردارهای تصادفی پیچیده، نوع دیگری از گشتاور مرکزی دوم، ماتریس شبه کوواریانس pseudo-covariance matrix(همچنین ماتریس رابطه نامیده می شود) به صورت زیر تعریف می شود:
برخلاف ماتریس کوواریانس تعریف شده در بالا، جابجایی hermitian با جابجایی در تعریف جایگزین میشود. عناصر مورب آن ممکن است دارای ارزش پیچیده باشند. این یک ماتریس متقارن پیچیده است.
برآورد کردن
ویرایشاگر و ماتریس های داده مرکزی به ابعاد و باشند، یعنی با n ستون مشاهدات ردیف های p و q از متغیرها که میانگین ردیف از آنها کم شده است، اگر میانگین ردیف ها از داده ها برآورد شد، ماتریس های کوواریانس نمونه و را می توان تعریف کرد:
یا اگر میانگین ردیف از قبل شناخته شده بود،
این ماتریسهای کوواریانس نمونه تجربی سادهترین و اغلب مورد استفادهترین تخمینگر ها برای ماتریسهای کوواریانس هستند، اما تخمینگر های دیگری نیز وجود دارند، از جمله تخمینگر های منظم یا انقباضی که ممکن است ویژگیهای بهتری داشته باشند.
برنامه های کاربردی
ویرایشماتریس کوواریانس ابزار مفیدی در زمینه های مختلف است. از آن می توان یک ماتریس تبدیل(transformation matrix) به دست آورد که به آن تبدیل سفیدکننده (whitening transformation) نیز گویند که به فرد اجازه می دهد تا داده ها را به طور کامل مرتبط کند. یا از دیدگاهی متفاوت، برای یافتن مبنایی بهینه برای نمایش داده ها به روشی فشرده (برای اثبات رسمی و خواص اضافی ماتریس های کوواریانس به ضریب ریلی مراجعه کنید). که PCA و (KL-transform) نامیده می شود.
ماتریس کوواریانس نقش کلیدی در اقتصاد مالی به ویژه در نظریه پرتفوی و قضیه تفکیک وجوه متقابل آن و در مدل قیمت گذاری دارایی های سرمایه ای ایفا می کند. ماتریس کوواریانسها بین بازده داراییهای مختلف برای تعیین مقادیر نسبی داراییهای مختلف که سرمایهگذاران باید (در یک تحلیل هنجاری یا در یک تحلیل مثبت ) انتخاب کنند، تحت مفروضات خاصی تعیین و پیش بینی می شوند.
نقشه برداری کوواریانس
ویرایشدر نگاشت کوواریانس مقادیر یا ماتریس به صورت یک نقشه دو بعدی رسم می شود. زمانی که بردارها و توابع تصادفی گسسته هستند، نقشه روابط آماری بین مناطق مختلف توابع تصادفی را نشان می دهد. مناطق مستقل آماری توابع بر روی نقشه به صورت زمین مسطح سطح صفر نشان داده می شوند، در حالی که همبستگی های مثبت یا منفی به ترتیب به صورت تپه ها یا دره ها نشان داده می شوند.
در عمل بردارهای ستون ، و به صورت تجربی به عنوان ردیف هایی از نمونه های nتایی به دست می آیند، به عنوان مثال
جایی که i امین مقدار گسسته در نمونه j تابع تصادفی است. مقادیر مورد نیاز در فرمول کوواریانس با استفاده از میانگین نمونه تخمین زده می شود، به عنوان مثال
و ماتریس کوواریانس توسط ماتریس کوواریانس نمونه تخمین زده می شود:
در جایی که براکتهای زاویهای نشاندهنده میانگینگیری نمونه هستند، به جز اینکه اصلاح بسل باید برای جلوگیری از سوگیری (BIAS) انجام شود . با استفاده از این تخمین ماتریس کوواریانس جزئی را می توان به صورت محاسبه کرد:
که در آن علامت backslash عملگر تقسیم ماتریس سمت چپ (LMD)را نشان می دهد که شرط معکوس کردن یک ماتریس را دور می زند و در برخی بسته های محاسباتی مانند Matlab موجود است . [۲]
شکل 1 نشان می دهد که چگونه یک نقشه کوواریانس جزئی بر روی نمونه ای از آزمایش انجام شده در لیزر الکترون آزاد FLASH در هامبورگ ساخته شده است. تابع تصادفی طیف زمان پرواز یونهای حاصل از انفجار کولنی از مولکولهای نیتروژن است که توسط یک پالس لیزر یونیزه شدهاند. از آنجایی که تنها چند صد مولکول در هر پالس لیزر یونیزه می شوند، طیف های تک شات به شدت در نوسان هستند. با این حال، جمع آوری به طور معمول چنین طیف هایی، ، و میانگین آنها را بیش از حد یک طیف صاف تولید می کند توجه کنید به که با رنگ قرمز در پایین شکل 1 نشان داده شده است. طیف متوسط چندین یون نیتروژن را به شکل پیک هایی که توسط انرژی جنبشی آنها گسترش یافته است نشان می دهد، اما برای یافتن همبستگی بین مراحل یونیزاسیون و گشتاور یونی نیاز به محاسبه یک نقشه کوواریانس است.
در مثال شکل 1 طیف و یکسان هستند، با این تفاوت که محدوده زمان پرواز متفاوت است. پنل a نشان می دهد ، پنل b را نشان می دهد و پنل c تفاوت آنها را نشان می دهد که است (به تغییر در مقیاس رنگ توجه کنید). متأسفانه، این نقشه توسط همبستگیهای غیر جالب و معمولی که توسط شدت لیزر در نوسان از عکسی به عکس دیگر ایجاد میشود، غرق شده است. برای سرکوب چنین همبستگی هایی شدت لیزر در هر شات ثبت می شود، قرار داده می شود و و به عنوان پانل های d و e محاسبه می شود. با این حال، سرکوب همبستگیهای جالب ناقص است زیرا منابع دیگری از نوسانات حالت معمولی غیر از شدت لیزر وجود دارد و در اصل همه این منابع باید به صورت بردار بررسی شوند. با این حال در عمل اغلب کافی است که اصلاح کوواریانس جزئی را جبران کنیم همانطور که پانل f نشان می دهد، جایی که همبستگی های جالب لحظه ای یون اکنون به وضوح به صورت خطوط مستقیم متمرکز بر مراحل یونیزاسیون نیتروژن اتمی قابل مشاهده است.
طیف سنجی دو بعدی مادون قرمز
ویرایشطیفسنجی دو بعدی مادون قرمز از تجزیه و تحلیل همبستگی برای بدست آوردن طیفهای دوبعدی فاز متراکم استفاده می کند. دو نسخه از این تحلیل وجود دارد: همزمان و ناهمزمان . از نظر ریاضی، اولی بر حسب ماتریس کوواریانس نمونه بیان میشود و این تکنیک معادل نگاشت کوواریانس است. [۴]
همچنین ببینید
ویرایش- آمار چند متغیره
- ماتریس گرین
- تجزیه ویژه (eigendecomposition)
- فرم درجه دوم (آمار)
- تحلیل مولفه های اصلی PCA
منابع
ویرایش- "Covariance matrix", Encyclopedia of Mathematics, EMS Press, 2001 [1994]
- Weisstein, Eric W. "Covariance Matrix". MathWorld.
- ↑ W J Krzanowski "Principles of Multivariate Analysis" (Oxford University Press, New York, 1988), Chap. 14.4; K V Mardia, J T Kent and J M Bibby "Multivariate Analysis (Academic Press, London, 1997), Chap. 6.5.3; T W Anderson "An Introduction to Multivariate Statistical Analysis" (Wiley, New York, 2003), 3rd ed., Chaps. 2.5.1 and 4.3.1.
- ↑ L J Frasinski "Covariance mapping techniques" J. Phys. B: At. Mol. Opt. Phys. 49 152004 (2016), open access
- ↑ O Kornilov, M Eckstein, M Rosenblatt, C P Schulz, K Motomura, A Rouzée, J Klei, L Foucar, M Siano, A Lübcke, F. Schapper, P Johnsson, D M P Holland, T Schlatholter, T Marchenko, S Düsterer, K Ueda, M J J Vrakking and L J Frasinski "Coulomb explosion of diatomic molecules in intense XUV fields mapped by partial covariance" J. Phys. B: At. Mol. Opt. Phys. 46 164028 (2013), open access
- ↑ I Noda "Generalized two-dimensional correlation method applicable to infrared, Raman, and other types of spectroscopy" Appl. Spectrosc. 47 1329–36 (1993)