भाषाहरूको चोम्स्की पदानुक्रम एक वर्गीकरण प्रणाली हो जसले तिनीहरूको उत्पादन शक्तिको आधारमा औपचारिक व्याकरणहरूलाई वर्गीकृत गर्दछ। यो सन् १९५० को दशकमा प्रख्यात भाषाविद् र कम्प्युटर वैज्ञानिक नोआम चोम्स्कीले प्रस्ताव गरेका थिए। पदानुक्रममा चार स्तरहरू हुन्छन्, प्रत्येकले औपचारिक भाषाहरूको फरक वर्गलाई प्रतिनिधित्व गर्दछ। यी स्तरहरू Type-1950 (नियमित), Type-3 (context-free), Type-2 (context-sensitive), र Type-1 (अप्रतिबंधित) को रूपमा चिनिन्छन्।
पदानुक्रमको तल्लो तहमा, हामीसँग टाइप-३ भाषाहरू छन्, जसलाई नियमित भाषाहरू पनि भनिन्छ। यी भाषाहरू परिमित अटोमेटा द्वारा पहिचान गर्न सकिन्छ, जस्तै निर्धारात्मक र गैर-निर्धारित परिमित अटोमेटा। नियमित भाषाहरू नियमित अभिव्यक्ति र नियमित व्याकरणद्वारा विशेषता हुन्छन्। नियमित अभिव्यक्तिहरू बीजगणितीय अभिव्यक्तिहरू हुन् जसले तारहरूको ढाँचाहरू वर्णन गर्दछ, जबकि नियमित व्याकरणहरूले उत्पादन नियमहरू समावेश गर्दछ जसले नियमित भाषामा स्ट्रिङहरू उत्पन्न गर्दछ। नियमित भाषाको उदाहरण भनेको दिइएको रेगुलर एक्सप्रेशनसँग मेल खाने सबै स्ट्रिङहरूको सेट हो, जस्तै ० सेकेन्डको बराबर संख्या भएका सबै बाइनरी स्ट्रिङहरूको भाषा।
पदानुक्रम माथि सार्दै, हामीले टाइप-२ भाषाहरू भेट्छौं, जसलाई सन्दर्भ-मुक्त भाषाहरू पनि भनिन्छ। यी भाषाहरू पुशडाउन अटोमेटा द्वारा पहिचान गर्न सकिन्छ, जुन स्ट्याकको साथ परिमित अटोमेटा हो। सन्दर्भ-मुक्त भाषाहरू सन्दर्भ-रहित व्याकरणहरूद्वारा वर्णन गरिन्छ, जसमा उत्पादन नियमहरू समावेश हुन्छन् जसले सन्दर्भ-रहित भाषामा स्ट्रिङहरू उत्पन्न गर्दछ। सन्दर्भ-रहित व्याकरणहरूमा गैर-टर्मिनल प्रतीकहरू, टर्मिनल प्रतीकहरू, र उत्पादन नियमहरू छन् जसले निर्दिष्ट गर्दछ कि गैर-टर्मिनलहरूलाई प्रतीकहरूको अनुक्रमले कसरी प्रतिस्थापन गर्न सकिन्छ। सन्दर्भ-रहित भाषाको उदाहरण सबै राम्रोसँग बनेको अंकगणितीय अभिव्यक्तिहरूको सेट हो, जहाँ कोष्ठकहरू सन्तुलित हुन्छन् र अपरेटरहरू सही रूपमा लागू हुन्छन्।
पदानुक्रमको अर्को स्तर टाइप-१ भाषाहरू हुन्, जसलाई सन्दर्भ-संवेदनशील भाषाहरू पनि भनिन्छ। यी भाषाहरू रैखिक-बाउन्ड गरिएको अटोमेटाद्वारा पहिचान गर्न सकिन्छ, जुन दुवै दिशामा सार्न सक्ने टेपको साथ सीमित अटोमेटा हुन्। सन्दर्भ-संवेदनशील भाषाहरू सन्दर्भ-संवेदनशील व्याकरणहरूद्वारा वर्णन गरिन्छ, जसमा उत्पादन नियमहरू समावेश हुन्छन् जसले सन्दर्भ-संवेदनशील भाषामा स्ट्रिङहरू उत्पन्न गर्दछ। सन्दर्भ-संवेदनशील व्याकरणहरूमा अतिरिक्त बाधा छ कि उत्पादन नियमको दायाँ-हातको लम्बाइ बायाँ-हातको लम्बाइ भन्दा छोटो हुन सक्दैन। सन्दर्भ-संवेदनशील भाषाको उदाहरण भनेको सबै प्यालिन्ड्रोमहरूको सेट हो, जहाँ स्ट्रिङले अगाडि र पछाडि उस्तै पढ्छ।
अन्तमा, पदानुक्रमको शीर्षमा, हामीसँग टाइप-० भाषाहरू छन्, जसलाई अप्रतिबंधित भाषाहरू पनि भनिन्छ। यी भाषाहरू ट्युरिङ मेसिनहरूद्वारा पहिचान गर्न सकिन्छ, जुन कुनै पनि कम्प्युटर एल्गोरिथ्म सिमुलेट गर्न सक्षम अमूर्त कम्प्युटेशनल यन्त्रहरू हुन्। अप्रतिबंधित भाषाहरू अप्रतिबंधित व्याकरणहरूद्वारा वर्णन गरिन्छ, जसमा उत्पादन नियमहरूमा कुनै प्रतिबन्ध छैन। एक अप्रतिबंधित भाषाको उदाहरण सबै पुनरावर्ती गणनयोग्य भाषाहरूको सेट हो, जसमा सबै गणनायोग्य भाषाहरू समावेश छन्।
भाषाहरूको चोम्स्की पदानुक्रमले तिनीहरूको उत्पादन शक्तिको आधारमा औपचारिक व्याकरणहरूलाई वर्गीकरण गर्न व्यवस्थित रूपरेखा प्रदान गर्दछ। यो नियमित भाषाहरूबाट सुरु हुन्छ, जुन सबैभन्दा कम शक्तिशाली हुन्छ, र सन्दर्भ-रहित, सन्दर्भ-संवेदनशील, र अप्रतिबन्धित भाषाहरूमा बढ्छ, जुन बढ्दो शक्तिशाली हुन्छ। यो पदानुक्रम कम्प्युटेशनल जटिलता सिद्धान्त को क्षेत्र मा एक मौलिक अवधारणा हो र औपचारिक भाषाहरु र automata को अध्ययन को लागी महत्वपूर्ण प्रभाव छ।
अन्य भर्खरका प्रश्न र उत्तरहरू सम्बन्धमा चम्स्की हाइरार्ची र प्रस S्ग संवेदनशील भाषाहरू:
- Type-0 पहिचान गर्ने हालका विधिहरू छन्? के हामी क्वान्टम कम्प्युटरहरूले यसलाई सम्भव बनाउने आशा गर्छौं?
- एक, दुई र तीनको बराबर संख्यामा स्ट्रिङहरू समावेश भएको भाषाको लागि सन्दर्भ-संवेदनशील व्याकरण डिजाइन गर्ने प्रक्रियाको वर्णन गर्नुहोस्।
- सन्दर्भ-संवेदनशील भाषाको उदाहरण दिनुहोस् र यसलाई सन्दर्भ-संवेदनशील व्याकरणद्वारा कसरी पहिचान गर्न सकिन्छ भनेर व्याख्या गर्नुहोस्।
- कसरी टाइप 0 भाषाहरू, जसलाई पुनरावर्ती गणनयोग्य भाषाहरू पनि भनिन्छ, कम्प्युटेसनल जटिलताको सन्दर्भमा अन्य प्रकारका भाषाहरू भन्दा फरक छ?
- सन्दर्भ-मुक्त भाषाहरू र सन्दर्भ-संवेदनशील भाषाहरू बीचको भिन्नतालाई तिनीहरूको गठनलाई नियन्त्रण गर्ने नियमहरूको सन्दर्भमा व्याख्या गर्नुहोस्।