مینیمسازی دیافای
در نظریه اتوماتا (شاخهای از علوم کامپیوتر)، مینیممسازی کار انتقال یک اتوماتای متناهی قطعی (دیافای) به یک دیافای معادل است که دارای تعداد وضعیتهای مینیمم است. در اینجا، دو دیافای معادل نامیده میشوند اگر آنها یک زبان منظم یکسان را مشخص کنند. چند الگوریتم مختلف که این کار را انجام میدهند شناخته شدهاند و در متون استاندارد در مورد نظریهٔ اتوماتا توضیح داده میشوند.[۱]
دی اف ای مینیمم
ویرایشبرای هر زبان منظم که به وسیلهٔ یک دیافای میتواند پذیرفته شود، یک دیافای با تعداد وضعیتهای مینیمم وجود دارد و این دیافای منحصر بفرد است (مگر اینکه به آن وضعیتها نامهای مختلفی بتوان داد)[۲]. دیافای مینیمم، مینیمم هزینهٔ محاسبات برای کارهایی مانند تطبیق الگو را تضمین میکند.
دو دسته از وضعیتها وجود دارند که بدون اینکه روی زبان اثر بگذارند میتوانند از دیافای اصلی حذف/ادغام شوند تا مینیممسازی آن را بپذیرد.
- وضعیتهای دست نیافتنی آنهایی هستند که برای هر رشتهٔ ورودی دور از دسترس وضعیتهای اولیهٔ دیافای باشند.
- وضعیتهای غیرقابل تمیز آنهایی هستند که برای هر رشتهٔ ورودی از یکدیگر تمیز داده نشوند.
مینیممسازی دیافای، در ارتباط با حذف/ ادغام وضعیتهای مربوط معمولاً در سه مرحله انجام میشود. چون حذف وضعیتهای غیرقابل تمیز از جنبهٔ محاسبات گرانترین است، معمولاً در آخرین مرحله انجام میشود.
وضعیتهای غیر قابل دسترس
ویرایشوضعیت p از دیافای (M=(Q, Σ, δ, q0, F غیرقابل دسترس است اگر هیچ رشتهای چون w در *∑ وجود نداشته باشد که برای آن (p=δ(q0, w باشد. وضعیتهای قابل دسترس از الگوریتم زیر میتواند به دست آیند:
let reachable_states:= {q0};
let new_states:= {q0};
do {
temp := the empty set;
for each q in new_states do
for all c in ∑ do
temp := temp ∪ {p such that p=δ(q,c)};
end;
end;
new_states := temp \ reachable_states;
reachable_states := reachable_states ∪ new_states;
} while(new_states ≠ the empty set);
unreachable_states := Q \ reachable_states;
وضعیتهای غیرقابل دسترس از دیایاف میتوانند حذف شوند بدون اینکه روی زبانی که میپذیرد اثر بگذارد.
وضعیتهای غیر قابل تشخیص
ویرایشالگوریتم هوپکرافت
ویرایشیک الگوریتم برای ادغام کردن وضعیتهای غیرقابل تشخیص از یک دیافای، بر طبق (هوپکرافت ۱۹۷۱)، بر اساس تصفیهٔ بخشی است، بخشکردن وضعیتهای دیافای به گروهها بوسیلهٔ رفتارشان. این گروهها کلاسهای همارزی از رابطه همارزی مایهیل-نرود را بیان میکنند، که به موجب آن هر دو وضعیت از یک بخش همارزند اگر برای هر رشتهٔ ورودی رفتار مشابه داشته باشند. یعنی، برای هر دو وضعیت p1 و p2 که به یک کلاس همارزی در بخش P متعلق باشند، حالتی خواهد بود که برای هر ورودی کلمهٔ w، اگر فردگذارهای تعیین شده با w از دو وضعیت p1 و p2 را دنبال کند یا به قبول وضعیتها در دو حالت میرسد یا به رد دو وضعیت در هر دو حالت میرسد؛ ممکن نیست برای w که p1 را یک وضعیت پذیرش بگیرد و p2 رایک وضعیت رد بگیرد یا برعکس.
شبهکد زیر الگوریتم را توضیح میدهد:
P := {F, Q \ F};
W := {F};
while (W is not empty) do
choose and remove a set A from W
for each c in ∑ do
let X be the set of states for which a transition on c leads to a state in A
for each set Y in P for which X ∩ Y is nonempty and Y \ X is nonempty do
replace Y in P by the two sets X ∩ Y and Y \ X
if Y is in W
replace Y in W by the same two sets
else
if |X ∩ Y| <= |Y \ X|
add X ∩ Y to W
else
add Y \ X to W
end;
end;
end;
الگوریتم بایک بخش که خیلی زمخت است شروع میشود: هر جفت وضعیت که معادل باشند بر طبق رابطهٔ مای هیل- نرود به یک مجموعهٔ یکسان در بخش متعلق است، ولی جفتهایی که نامعادلند نیز ممکن است به یک مجموعه تعلق داشته باشند. این به تدریج بخش را به تعداد زیادتری از مجموعههای کوچکتر تصفیه میکند، در هر گام مجموعههای وضعیتها را به جفتهای زیر مجموعه تفکیک میکند که لزوماً نامعادلند. بخش اولیه تفکیک وضعیتها به دو زیر مجموعه از وصعیتهاست که به وضوح یک رفتار مشابه یکدیگر ندارند: پذیرش وضعیتها و رد وضعیتها. سپس الگوریتم بهطور تکراری مجموعهٔ از بخش جاری و یک علامت ورودی را انتخاب میکند، و هر مجموعه از بخش را به دو زیر مجموعهٔ(احتمالاً خالی) تقسیم میکند: زیر مجموعهٔ وضعیتها که به روی علامت ورودی منجر میشود، و زیر مجموعهٔ وضعیتها که به منجر نمیشود. چون تاکنون به داشتن رفتارهای متفاوت نسبت به مجموعههای دیگر بخش مشخص میشود، زیر مجموعههایی که به منجر میشوند نیز رفتار متفاوتی از آنهایی که به منجر نمیشوند دارند. وقتی که هیچ تقسیمی از این نوع نمیتوان یافت، الگوریتم لم را خاتمه میدهد.
با داشتن یک کاراکتر ثابت و یک کلاس همارزی که به کلاسهای همارزی و تقسیم میشود، فقط یکی از یا لازم است تا کل بخش را تصیفیه کند. [۳]
مثال: فرض کنید یک کلاس همارزی داریم که به کلاسهای همارزی و تقسیم میشود. فرض کنید کلاسهای ، و نیز داریم ؛ و وضعیتها یی باانتقال به روی کاراکتر دارند، در حالیکه انتقالهایی به روی کاراکتر دارد. به موجب لم، میتوانیم یا یا را به عنوان تمیزدهنده انتخاب کنیم، بگذارید بگوییم . سپس وضعیتهای و با انتقالهایشان به تقسیم میشوند. ولی ، که به اشاره ندارد، به سادگی در هنگام تکرار جاری الگوریتم تقسیم نمیشود؛به وسیلهٔ تمیز دهندههای دیگر تصفیه خواهد شد.
هر یا لازم است که به کلاسهای مورد اشارهٔ مانند ، و بهطورصحیح تقسیم شود-- زیر مجموعهها مشاهده انجام نخواهند داد.
غایت هدف جملهٔ اگر(اگر در باشد) وصله کردن ، مجموعهٔ تمیز دهندههاست. در جملهٔ قبل در الگوریتم میبینیم که فقط تقسیم شدهاست. اگر در باشد، فقط کنار گذاشته شدهاست به عنوان وسیلهای که کلاسها را در تکرارهای آینده تقسیم کند. بنابراین بایستی بوسیلهٔ هردو تقسیمات جایگزین شود به علت مشاهدهٔ بالا. امااگر در نباشد، تنها یکی از دو تقسیم، نه هر دو، لازم است که به اضافه شود به علت لم بالا. انتخاب کوچکترین از دو تقسیم تضمین میکند که اضافهکردن جدید به بیشتر از نصف اندازهٔ نیست؛ این هستهٔ الگوریتم هوپکرافت است: چگونه سرعت میگیرد، چنانچه در پاراگراف بعد میآید.
بدترین حالت زمان اجرای این الگوریتم است ، که تعداد وضعیتها و اندازهٔ الفباست. این محدودیت از این حقیقت ناشی میشود که، برای هر یک از انتقالهای از اتوماتا، مجموعههایی که از گرفته شدهاست که شامل وضعیت هدف از انتقال است اندازههایی دارد که نسبت به یکدیگر با ضریب یک یا دو کاهش می یابد، بنابراین هر انتقال در از گامهای تقسیم الگوریتم شرکت میکند. ساختمان دادهٔ تصفیهٔ بخش به هر گام تقسیمکننده اجازه میدهد که در زمانی متناسب باتعداد انتقالهایی که در آن شرکت میکند اجرا شود.[۴]این کاراترین الگوریتم شناخته شده را برای حل مسئله به جا میگذارد، و برای توزیعهای خاصی از ورودیها متوسط حالت پیچیدگی حتی بهتر است، . [۵]
یکبار الگوریتم هوپکرافت بکار رفتهاست تا وضعیت ورودی دیافای به کلاسهای همارزی گروه شوند، مینیمم دیافای میتواندبا تشکیل یک وضعیت برای هر کلاس همارزی ساخته شود. اگر مجموعهای وضعیتها در ، و یک وضعیت در ، و یک کاراکتر ورودی باشد، انتقال در مینیمم دیافای از وضعیت برای ، روی ورودی ، میرود به سوی مجموعهای شامل وضعیتی که اتومات ورودی برود از وضعیت روی ورودی . وضعیت اولیهٔ دیافای مینیمم آنی است که شامل وضعیت اولیهٔ ورودی دیرافای است، و وضعیتهای پذیرفتهٔ دیافای مینیمم آنهایی هستند که اعضایشان وضعیتهای پذیرفتهٔ دیافای مینیمم هستند.
الگوریتم مور
ویرایشالگوریتم مور برای دیافای مینیمم مربوط به ادوارد اف مور( ۱۹۵۶) است. مانند الگوریتم هوپکرافت، بخشی را حفظ میکند که جداسازی پذیرش از وضعیتهای رد شروع میکند، و پیوسته بخش راتصفیه میکند تا وقتی که هیج تصفیهٔ دیگری بتوان انجام داد. در هر گام، این جایگزین بخش جاری با تصفیهٔ معمول زمخت از بخش میشود، یکی از آنها جاری است و دیگران پیش تصویرهایی هستند از بخش جاری تحت توابع انتقال برای علامتهای ورودی. وقتی این جایگزینی بخش جاری راتغییر ندهد الگوریتم پایان میپذیرد.
بدترین حالت پیچیدگی زمانش O(n2s): هر گام از الگوریتم میتواند در زمان با بکار بردن تنوعی از مرتبسازی مبنا برای دوباره تنظیم کردن وضعیتهااجرا شود طوریکه وضعیتها در یک مجموعه از بخش جدید به ترتیب متوالی هستند، و حداکثر گام وجود دارند چون هر کدام به جز آخری تعداد مجموعهها در بخش را افزایش میدهد. مثالهایی از مسئلهٔ مینیممسازی دیافای که رفتار حالت بدتر را موجب میشود مشابه آنها برای الگوریتم هوپکرافت است.
تعداد گامهایی که الگوریتم اجرا میشود میتواند خیلی کوچکتر از شود، بنابراین بهطور متوسط (برای ثابت ) اجرایش روی یا حتی بستگی دارد به توزیع تصادفی روی اتومات که انتخاب شدهاست تا رفتار حالت متوسط الگوریتم را مدل سازی کند.[۵]
الگوریتم برزوزسکی
ویرایشچنانچه برزوزسکی(۱۹۶۳)مشاهده کرد، با وارون کردن لبههای یک دیافای یک اتوماتای متناهی غیر قطعی(NFA) برای وارون کردن زبان اصلی ایجاد میکند، و با تبدیل این انافای را با بکار بردن ساختار مجموعۀ توانی استاندارد به یک دیافای (ساختن تنها وضعیتهای در دسترس از دیافای تبدیل شده)برای همان زبان وارون شده به یک دیافای مینیمم منجر میشود. با تکرار این عمل برای بار دوم یک دیافای مینیمم برای زبان اصلی ایجاد میشود. بدترین حالت پیچیدگی الگوریتم برزورسکی نمایی است، چون زبانهای منظمی وجود دارند که برای آنها دیافای مینیمم وارون بهطور نمایی بزرگتر از دیافای مینیمم زبان است،[۶] ولی بهطور مکرر اجرا میشود بهتر از این که حالت بدتر که پیشنهاد میکند.[۵]
مینیممسازی انافای
ویرایشدر حالیکه روندهای بالا برای دیافایها ایجاد میشوند، روش بخش کردن برای اتوماتای متناهی غیرقطعی (انافایها) کار نمیکند. در حالیکه یک جستجوی جامع ممکن است یک انافای را مینیمم سازد، یافتن یک الگوریتم با زمان چند جملهای برای مینیممسازی انافایها غیرممکن است، مگر اینکه حدس حل نشدۀ در تئوری پیچیدگی محاسباتی درست باشد.[۷] باور بر این است که این حدس بهطور گسترده اشتباه است.
پانویس
ویرایش- ↑ Hopcroft, Ullman (1979)
- ↑ (Hopcroft، Motwani و Ullman 2001), Section 4.4.3, "Minimization of DFA's", p. 159.
- ↑ Based on Corollary 10 of (Knuutila 2001)
- ↑ (Hopcroft 1971); (Aho، Hopcroft و Ullman 1974)
- ↑ ۵٫۰ ۵٫۱ ۵٫۲ (Berstel و دیگران 2010).
- ↑ For instance, the language of binary strings whose nth symbol is a one requires only n + 1 states, but its reversal requires 2n states. (Leiss 1981) provides a ternary n-state DFA whose reversal requires 2n states, the maximum possible. For additional examples and the observation of the connection between these examples and the worst-case analysis of Brzozowski's algorithm, see (Câmpeanu و دیگران 2001).
- ↑ (Hopcroft، Motwani و Ullman 2001), Section 4.4, Figure labeled "Minimizing the States of an NFA", p. 163.
منابع
ویرایش- Aho, Alfred V; Hopcroft, John E; Ullman, Jeffrey D (1974), "4.13 Partitioning", The Design and Analysis of Computer Algorithms (به انگلیسی), Addison-Wesley, pp. 157–162.
- Berstel, Jean; Boasson, Luc; Carton, Olivier; Fagnot, Isabelle (2010), "Minimization of Automata", Automata: from Mathematics to Applications, European Mathematical Society, arXiv:1010.5318
- Brzozowski, J. A. (1963), "Canonical regular expressions and minimal state graphs for definite events", Proc. Sympos. Math. Theory of Automata (New York، 1962), Polytechnic Press of Polytechnic Inst. of Brooklyn، Brooklyn، N.Y., pp. 529–561, MR 0175719.
- Câmpeanu, Cezar; Culik, Karel، II; Salomaa, Kai; Yu, Sheng (2001), "State Complexity of Basic Operations on Finite Languages", 4th International Workshop on Automata Implementation (WIA '99), Lecture Notes in Computer Science, vol. 2214, Springer-Verlag, pp. 60–70, doi:10.1007/3-540-45526-4_6.
- Hopcroft, John (1971), "An n log n algorithm for minimizing states in a finite automaton", Theory of machines and computations (Proc. Internat. Sympos.، Technion، Haifa، 1971), New York: Academic Press, pp. 189–196, MR 0403320
- John Hopcroft (1971). An n log n algorithm for minimizing states in a finite automaton (PDF) (Technical Report). Stanford Univ.، CS Dept.
{{cite report}}
: Unknown parameter|month=
ignored (help) - Hopcroft, John E.; Motwani, Rajeev; Ullman, Jeffrey D. (2001), Introduction to Automata Theory، Languages، and Computation (2nd ed.), Addison-Wesley.
- Knuutila, Timo (2001), "Re-describing an algorithm by Hopcroft", Theoretical Computer Science, 250 (1–2): 333–363, doi:10.1016/S0304-3975(99)00150-4, MR 1795249.
- Leiss, Ernst (1981), "Succinct representation of regular languages by Boolean automata" (PDF), Theoretical Computer Science, 13 (3): 323–330, doi:10.1016/S0304-3975(81)80005-9, MR 0603263.
- Leiss, Ernst (1985), "Succinct representation of regular languages by Boolean automata II" (PDF), Theoretical Computer Science, 38: 133–136
- Moore, Edward F. (1956), "Gedanken-experiments on sequential machines", Automata studies, Annals of mathematics studies، no. 34, Princeton، N. J.: Princeton University Press, pp. 129–153, MR 0078059.
- Sakarovitch, Jacques (2009), Elements of automata theory, Translated from the French by Reuben Thomas, Cambridge University Press, ISBN 978-0-521-84425-3, Zbl 1188.68177