فاصله ماهالانوبیس

فاصله ماهالانوبیس (به انگلیسی: Mahalanobis distance) یک مقیاس فاصله بین یک نقطه P و یک توزیع D است که اولین بار توسط آقای پراسانتا چاندرا ماهالانوبیس در سال ۱۹۳۶ معرفی شد.[۱] انگیزه اولیه از این تعریف، حل مسئله تعیین مشابهت جمجمه‌ها بر اساس اندازه‌گیری‌ها بود که در سال ۱۹۲۷ مطرح شد.[۲]

این تعریف یک تعمیم چند-بعدی از ایده «نقطه P از میانگین D چند انحراف معیار دور است» می‌باشد. این فاصله برای P در میانگین D صفر است، و هر قدر P از میانگین در طول هر محور مولفه اصلی دور شود، افزایش می‌یابد. اگر هر کدام از این محورها تغییر مقیاس دهند تا واریانس واحد داشته باشند، آنوقت فاصله ماهالانوبیس با فاصله اقلیدسی استاندارد در فضای تبدیل یافته متناظر هست. از این‌رو فاصله ماهالانوبیس بدون واحد، مستقل از مقیاس است، و همبستگی مجموعه داده را درنظر می‌گیرد.

تعریف

ویرایش

اگر یک توزیع احتمال   در   با میانگین   و ماتریس کوواریانس مثبت-معین   را داشته باشیم، فاصله ماهالانوبیس برای یک نقطه   از   برابر است با:[۳]

 

اگر دو نقطه   و   در   را داشته باشیم، فاصله ماهالانوبیس بین آن‌ها با توجه به   برابر است با:

 

که این یعنی  .

به این دلیل که   مثبت-معین است،   نیز همین‌طور هست و در نتیجه ریشه دوم همیشه تعریف شده‌است.

پانویس

ویرایش
  1. Mahalanobis, Prasanta Chandra (1936). "On the generalised distance in statistics" (PDF). Proceedings of the National Institute of Sciences of India. 2 (1): 49–55. Retrieved 2016-09-27.
  2. Mahalanobis, Prasanta Chandra (1927); Analysis of race mixture in Bengal, Journal and Proceedings of the Asiatic Society of Bengal, 23:301–333.
  3. De Maesschalck, R.; Jouan-Rimbaud, D.; Massart, D.  L. (2000). "The Mahalanobis distance". Chemometrics and Intelligent Laboratory Systems. 50 (1): 1–18. doi:10.1016/s0169-7439(99)00047-7.

منابع

ویرایش

مشارکت‌کنندگان ویکی‌پدیا. «https://en.wiki.x.io/wiki/Mahalanobis_distance». در دانشنامهٔ ویکی‌پدیای انگلیسی، بازبینی‌شده در ۲۱ اوت ۲۰۲۳.