وراثت چامسکی
وراثت چامسکی یا سلسلهمراتب چامسکی یا سلسلهمراتب چامسکی-شوتزنبرگر (به انگلیسی: Chomsky hierarchy) در زمینههای علوم کامپیوتر و زبانشناسی، به خصوص در زمینهٔ زبانهای صوری، یک سلسله مراتب نگهدارندهٔ کلاسهای دستور زبان صوری است. سلسلهمراتب گرامرها توسط نوآم چامسکی در سال ۱۹۵۶ توصیف شده است. در نام گذاری این سلسله مراتب، از اسم مارسل-پل شوتزنبرگر (به انگلیسی: Marcel-Paul Schützenberger) نیز به پاس نقش اساسی وی در توسعهٔ نظریهٔ زبانهای رسمی (زبان صوری)، استفاده شده است. سلسلهمراتب چامسکی در اصل امکان درک و بکارگیری مدل علوم کامپیوتر را فراهم میکند. این مدل به برنامهنویسها اجازه میدهد که اهداف زبانشناسی مفهومدار را به صورت سیستماتیک به انجام برسانند.
دستور زبانهای رسمی (صوری)
ویرایش- مقالهٔ اصلی: دستور زبان صوری
دستور زبانی رسمی از این نوع، از یک مجموعهای متناهی از قواعد تولید تشکیل شده است (سمت چپ سمت راست) که هر سمت آن، خود شامل رشتهای از نمادهای زیر میباشد:
- مجموعهای متناهی از نمادهای ناپایانه (که نشاندهندهٔ این است که هنوز برخی از قواعد تولید را میتوان اعمال نمود)
- مجموعهای متناهی از نمادهای پایانه (که نشاندهندهٔ این است که هیچ قاعدهٔ تولیدی را نمیتوان اعمال نمود)
- یک نماد آغازین (یک نماد ناپایانهٔ متمایز)
گرامر رسمی یک زبان رسمی را تعریف (یا تولید) میکند، که مجموعهای (معمولاً متناهی) از رشتههایی با طول متناهی از نمادها هستند، که ممکن است با اعمال قواعد تولید به رشتهای دیگر از نمادها که از ابتدا فقط حاوی نماد آغازین بودهاند، ساخته شوند. یک قاعده میتواند با جایگزین کردن یک رخداد از نمادها در سمت چپ قاعده با رخدادی که در سمت راست ظاهر میشود، به رشتهای از نمادها اعمال شود. رشتهای از کاربردهای قاعده را «اشتقاق» میخوانند. چنین گرامری زبان رسمی را تعریف میکند: همهٔ واژههایی که تنها از نمادهای پایانهای تشکیل شده باشند که با اشتقاقی از نماد آغازین، قابل دسترسی باشند. ناپایانهها معمولاً با حروف بزرگ، پایانهها با حروف کوچک، و نماد آغازین با نمایش داده میشوند، مثلاً گرامری با پایانههای ، ناپایانههای ، قواعد تولید:
- ε (where ε is the empty string)
و نماد آغازین ، زبان همهٔ واژههایی با شکل را تعریف میکند (یعنی نسخه از و به دنبال آن کپی از ). مورد بعدی گرامر سادهتری است که زبان مشابهی را تعریف میکند: پایانههای ، ناپایانهٔ ، نماد آغازین ، قواعد تولید
- ε
به عنوان مثالی دیگر، گرامری برای یک زیرمجموعهٔ سرگرمی از زبان انگلیسی، به صورت زیر داده شده است: پایانههای ، ناپایانههای ، قواعد تولید
و نماد آغازین . مثالی از اشتقاق این است:
- SENTENCE NOUNPHRASE VERBPHRASE ADJ NOUNPHRASE VERBPHRASE ADJ NOUN VERBPHRASE ADJ NOUN VERB NOUNPHRASE ADJ NOUN VERB ADJ NOUNPHRASE ADJ NOUN VERB ADJ ADJ NOUNPHRASE ADJ NOUN VERB ADJ ADJ NOUN great NOUN VERB ADJ ADJ NOUN great linguists VERB ADJ ADJ NOUN great linguists generate ADJ ADJ NOUN great linguists generate great ADJ NOUN great linguists generate great green NOUN great linguists generate great green ideas.
سایر رشتههایی که میتوانند از این گرامر مشتق شوند "ideas hate greate linguists" و "ideas generate" هستند. این جملات بیمعنی هستند، اما از لحاظ ساختاری صحیحند. جملهای که از لحاظ ساختاری نادرست باشد، مثل "ideas ideas great hate"، نمیتواند از گرامر مشتق شود. به عنوان مثالی مشابه، “Colorless green ideas sleep furiously” از چامسکی در سال ۱۹۵۷ را ببینید؛ برای یافتن مثالهای زبانی طبیعیتر و مسائل گرامرهای رسمی در این زمینه، بخشهای گرامر ساختار عبارت و قواعد ساختار عبارت را ببینید.
وراثت
ویرایشسلسه مراتب چامسکی شامل سطحهای زیر است؛
- گرامر نوع صفر (گرامر نامحدود) شامل تمام گرامرهای رسمی است. آنها تمامی زبانهایی که به عنوان ماشین تورینگ شناخته میشوند را تولید میکنند. این زبانها همچنین به عنوان زبان شمارش پذیر بازگشتی هم شناخته شدهاند. لازم است ذکر شود که با زبان بازگشتی که با تورینگ ماشین همیشه ایستا تشخیص داده میشود، متفاوت است.
- گرامر نوع اول (گرامر حساس به متن) گرامر حساس به متن را تولید میکند. این گرامرها قوانینی به صورت با غیر پایانه و ، و رشتهای از پایانهها یا\و غیر پایانهها است. رشتههای و ممکن است تهی باشند ولی نمیتواند تهی باشد. قانون مجاز است اگر S در سمت راست هیچکدام از قوانین ظاهر نشود. زبانهای توصیف شده با این گرامر، دقیقاً زبانهایی هستند که بعنوان آتاماتای خطی کراندار شناخته میشوند(ماشین تورینگ غیر قطعی ای که نوار آن به وسیله زمان ثابت طول ورودی آن کران دار است)
- گرامر نوع دوم(گرامر مستقل از متن) گرامر مستقل از متن را تولید میکند. اینها با قوانینی به فرم با غیر پایانه و رشتهای از پایانهها یا\و غیر پایانهها است. این زبانها همانهایی هستند که به عنوان اتوماتون پشتهای غیرقطعی شناخته میشوند. گرامر مستقل از متن - یا ترجیحاًٰ زیر مجموعه زبان مستقل از متن قطعی - پایه تئوری برای ساخت عبارتی بیشتر زبانهای برنامهنویسی است، اگرچه گرامر آنها شامل تبدیل نام به آدرس حساس به متن بر طبق اعلامها و طرح نهایی است. اغلب یک زیر مجموعه از گرامرها برای راحت تجزیه کردن استفاده میشود، مانند یک تجزیهکنندهٔ الال.
- گرامر نوع سوم (دستور زبان منظم) گرامر منظم را تولید میکند. چنین گرامری قوانین محدود به یک غیر پایانه در سمت چپ و یک ترمینال در سمت راست دارد، احتمالاً به دنبال یک غیر پایانه (راست منظم). متناوباً، سمت راست گرامر میتواند شامل یک پایانه باشد، احتمالاً قبل از یک غیر پایانه (چپ منظم)؛ این همان زبان را تولید میکند - اگر چه، اگر قوانین چپ و قوانین راست به طور منظم با هم ترکیب شوند، زبان نیازی ندارد منظم باشد. قانون مجاز است اگر در سمت راست هیچکدام از قوانین ظاهر نشود. زبانهای توصیف شده با این گرامر، دقیقاً زبانهایی هستند که بعنوان ماشین حالات متناهی تصمیمگیری میشوند. علاوه بر این، این خانواده از زبانهای رسمی را میتوان به وسیله عبارت باقاعده به دست آورد.
توجه داشته باشید که مجموعه گرامرهای متناظر با زبانهای بازگشتی عضو این سلسله مراتب نمیباشد؛ میتواند به درستی بین نوع صفر و نوع اول باشد.
هر زبان به طور منظم مستقل از متن است، هر زبان مستقل از متن (شامل رشته تهی نباشد) حساس به متن است، هر زبان حساس به متن بازگشتی است و هر زبان بازگشتی به صورت بازگشتی شمارش پذیر است. این شمولها مناسب همه هستند، به این معنی که زبانهای شمارش پذیر بازگشتی ای وجود دارند که حساس به متن نیستند، زبانهای حساس به متن ای که مستقل از متن نیست و زبانهای مستقل از متن که منظم نیست.
خلاصه
ویرایشجدول زیر خلاصه هر یک از چهار نوع چامسکی از گرامرها، کلاسی که آن زبان تولید میکند، نوع اتوماتی که تشخیص میدهد و شکل قوانینی که دارد است.
دستور زبان | زبان | خودکارسازی | قاعدهٔ تولید |
---|---|---|---|
نوع صفر | زبان شمارشپذیر بازگشتی | ماشین تورینگ | (no restrictions) |
نوع اول | حساس به متن | آتاماتای خطی کراندار | |
نوع دوم | مستقل از متن | اتوماتون پشتهای | |
نوع سوم | زبان منظم | ماشین حالات متناهی | و |
منابع
ویرایش- «Chomsky.info». The Noam Chomsky website. بایگانیشده از اصلی در ۱۳ سپتامبر ۲۰۱۸. دریافتشده در تیرماه ۱۳۸۷. تاریخ وارد شده در
|تاریخ بازدید=
را بررسی کنید (کمک) - «The Chomsky Hierarchy». National University of Ireland, Maynooth. بایگانیشده از اصلی در ۲۳ نوامبر ۲۰۰۷. دریافتشده در ۳ تیر ۱۳۸۷.
- https://web.archive.org/web/20080317131322/http://coral.lili.uni-bielefeld.de/Classes/Winter97/IntroCompPhon/compphon/node66.html
- http://www.staff.ncl.ac.uk/hermann.moisl/ell236/lecture5.htm
- Chomsky hierarchy. (2008, June 18). In Wikipedia, The Free Encyclopedia. Retrieved 18:30, July 3, 2008, from http://en.wiki.x.io/w/index.php?title=Chomsky_hierarchy&oldid=220223801
- Chomsky, Noam (1959). "On certain formal properties of grammars" (PDF). Information and Control. 2 (2): 137–167. doi:10.1016/S0019-9958(59)90362-6. Archived from the original (PDF) on 23 September 2015. Retrieved 27 June 2015.
- Chomsky, Noam; Schützenberger, Marcel P. (1963). "The algebraic theory of context free languages". In Braffort, P.; Hirschberg, D. (eds.). Computer Programming and Formal Languages. Amsterdam: North Holland. pp. 118–161.
- Davis, Martin D.; Sigal, Ron; Weyuker, Elaine J. (1994). Computability, Complexity, and Languages: Fundamentals of Theoretical Computer Science (2nd ed.). Boston: Academic Press, Harcourt, Brace. p. 327. ISBN 0-12-206382-1.