कन्भोलुसनल न्यूरल नेटवर्कहरू (CNNs) पहिले कम्प्युटर दृष्टिको क्षेत्रमा छवि पहिचानको उद्देश्यका लागि डिजाइन गरिएको थियो। यी नेटवर्कहरू एक विशेष प्रकारको कृत्रिम तंत्रिका सञ्जाल हुन् जुन दृश्य डेटाको विश्लेषणमा अत्यधिक प्रभावकारी साबित भएको छ। CNN को विकास छविहरूलाई सही रूपमा वर्गीकरण र वर्गीकरण गर्न सक्ने मोडेलहरू सिर्जना गर्ने आवश्यकताद्वारा संचालित थियो, र यस डोमेनमा तिनीहरूको सफलताले वस्तु पत्ता लगाउने, छवि विभाजन, र प्राकृतिक भाषा प्रशोधन जस्ता अन्य विभिन्न अनुप्रयोगहरूमा व्यापक प्रयोगको नेतृत्व गरेको छ।
सीएनएनहरू मानव मस्तिष्कमा भिजुअल कोर्टेक्सको संरचना र कार्यक्षमताबाट प्रेरित हुन्छन्। भिजुअल कोर्टेक्स जस्तै, CNN हरू अन्तरसम्बन्धित न्यूरोन्सका बहु तहहरू हुन्छन् जसले इनपुट डेटाका विभिन्न पक्षहरूलाई प्रशोधन गर्दछ। CNN को मुख्य नवीनता म्यानुअल सुविधा इन्जिनियरिङको आवश्यकतालाई हटाउँदै छविहरूबाट सान्दर्भिक सुविधाहरू स्वतः सिक्ने र निकाल्ने क्षमतामा निहित छ। यो कन्भोलुसनल लेयरहरूको प्रयोग मार्फत प्राप्त हुन्छ, जसले विभिन्न भिजुअल ढाँचा र सुविधाहरू, जस्तै किनारा, कुना र बनावटहरू पत्ता लगाउन इनपुट छविमा फिल्टरहरू लागू गर्दछ।
CNNs मा पहिलो सफलता Yann LeCun et al द्वारा LeNet-5 वास्तुकला को परिचय संग आयो। 1998 मा। LeNet-5 विशेष रूपमा हस्तलिखित अंक पहिचानको लागि डिजाइन गरिएको थियो र MNIST डेटासेटमा उल्लेखनीय प्रदर्शन हासिल गर्यो, छवि पहिचान एल्गोरिदमहरूको मूल्याङ्कन गर्न व्यापक रूपमा प्रयोग हुने बेन्चमार्क डेटासेट। LeNet-5 ले छविहरूबाट पदानुक्रमिक सुविधाहरू क्याप्चर गर्नमा CNNs को शक्ति प्रदर्शन गर्यो, स्केल, रोटेशन, र अनुवादमा भिन्नताहरूको उपस्थितिमा पनि सही वर्गीकरण सक्षम पार्दै।
त्यसबेलादेखि, सीएनएनहरू महत्त्वपूर्ण रूपमा विकसित भएका छन्, गहिरो र थप जटिल वास्तुकलाहरू विकास भइरहेका छन्। एउटा उल्लेखनीय प्रगति एलेक्स क्रिजेभस्की एट अल द्वारा एलेक्सनेट वास्तुकलाको परिचय थियो। 2012 मा। एलेक्सनेटले अघिल्लो दृष्टिकोणको तुलनामा उल्लेखनीय रूपमा कम त्रुटि दरको साथ ImageNet लार्ज स्केल भिजुअल रिकग्निसन चुनौती (ILSVRC) जितेर छवि वर्गीकरणमा सफलता हासिल गर्यो। यो सफलताले छवि पहिचान कार्यहरूमा CNN को व्यापक रूपमा अपनाउने मार्ग प्रशस्त गर्यो।
सीएनएनहरू अन्य कम्प्युटर दृष्टि कार्यहरूमा पनि सफलतापूर्वक लागू गरिएको छ। उदाहरणका लागि, वस्तु पत्ता लगाउने क्रममा, CNNs लाई छवि भित्र वस्तुहरू स्थानीयकरण र वर्गीकरण गर्न थप तहहरूसँग जोड्न सकिन्छ। प्रसिद्ध क्षेत्र-आधारित कन्भोलुसनल न्यूरल नेटवर्क (R-CNN) Ross Girshick et al द्वारा प्रस्तुत। 2014 मा यस्तो वास्तुकला को एक उदाहरण हो। R-CNN ले फिचर एक्स्ट्र्याक्सनका लागि CNN को शक्ति प्रयोग गरेर र क्षेत्रीय प्रस्ताव विधिहरूसँग संयोजन गरेर वस्तु पत्ता लगाउने बेन्चमार्कहरूमा अत्याधुनिक नतिजाहरू हासिल गर्यो।
कन्भोलुसनल न्यूरल नेटवर्कहरू पहिले कम्प्युटर दृष्टिको क्षेत्रमा छवि पहिचान कार्यहरूको लागि डिजाइन गरिएको थियो। तिनीहरूले स्वचालित रूपमा छविहरूबाट सान्दर्भिक सुविधाहरू सिकेर, म्यानुअल सुविधा इन्जिनियरिङको आवश्यकतालाई हटाएर क्षेत्रमा क्रान्तिकारी परिवर्तन गरेका छन्। CNN को विकासले छवि वर्गीकरण, वस्तु पत्ता लगाउने, र अन्य विभिन्न कम्प्युटर दृष्टि कार्यहरूमा महत्त्वपूर्ण प्रगति गरेको छ।
अन्य भर्खरका प्रश्न र उत्तरहरू सम्बन्धमा EITC/AI/ADL उन्नत गहन शिक्षा:
- हामीले मेसिन लर्निङमा किन अप्टिमाइजेसनहरू लागू गर्नुपर्छ?
- ओभरफिटिंग कहिले हुन्छ?
- के कन्भोलुसनल न्युरल नेटवर्कहरूले कन्भोलुसनल सिक्वेन्स टु सिक्वेन्स मोडेलहरूमा प्रयोग गरिएझैं समयसँगै कन्भोल्युसनहरू समावेश गरेर क्रमिक डेटा ह्यान्डल गर्न सक्छन्?
- जेनेरेटिभ एडभर्सरियल नेटवर्कहरू (GANs) जेनेरेटर र भेदभाव गर्ने विचारमा भर पर्छन्?