एपीआईको प्रतिक्रियाबाट आर्टिफिसियल इन्टेलिजेन्सको क्षेत्रमा सबै वस्तु एनोटेसनहरू निकाल्न - गुगल भिजन एपीआई - उन्नत छविहरू बुझ्ने - वस्तुहरू पत्ता लगाउन, तपाईंले API द्वारा प्रदान गरिएको प्रतिक्रिया ढाँचा प्रयोग गर्न सक्नुहुन्छ, जसमा पत्ता लगाइएको वस्तुहरूको सूची समावेश छ। बाउन्डिङ बक्स र आत्मविश्वास स्कोर। यो प्रतिक्रिया पार्स गरेर, तपाईं इच्छित वस्तु एनोटेसनहरू निकाल्न सक्नुहुन्छ।
API प्रतिक्रिया सामान्यतया JSON वस्तु समावेश गर्दछ विभिन्न क्षेत्रहरू, "localizedObjectAnnotations" फिल्ड सहित, जसले पत्ता लगाइएका वस्तुहरू समावेश गर्दछ। प्रत्येक वस्तु एनोटेसनले वस्तुको नाम, यसको बाउन्डिङ बाकस समन्वयहरू, र पहिचानमा API को विश्वासलाई संकेत गर्ने विश्वास स्कोर जस्ता जानकारी समावेश गर्दछ।
वस्तु एनोटेसनहरू निकाल्न, तपाइँ यी चरणहरू पालना गर्न सक्नुहुन्छ:
1. API प्रतिक्रिया पार्स गर्नुहोस्: API बाट प्राप्त JSON प्रतिक्रिया पार्स गरेर सुरु गर्नुहोस्। यो JSON पार्सिङ लाइब्रेरी वा तपाइँको प्रोग्रामिङ भाषा द्वारा प्रदान गरिएको बिल्ट-इन प्रकार्यहरू प्रयोग गरेर गर्न सकिन्छ।
2. "localizedObjectAnnotations" फिल्डमा पहुँच गर्नुहोस्: प्रतिक्रियालाई पार्स गरेपछि, "localizedObjectAnnotations" फिल्डमा पहुँच गर्नुहोस्, जसमा पत्ता लगाइएका वस्तुहरू छन्। यो फिल्ड सामान्यतया वस्तु एनोटेसनहरूको एर्रे हो।
3. वस्तु एनोटेसनहरू मार्फत पुनरावृत्ति गर्नुहोस्: एरेमा प्रत्येक वस्तु एनोटेसन मार्फत पुनरावृत्ति गर्नुहोस्। प्रत्येक एनोटेसनले छविमा पत्ता लगाइएको वस्तुलाई प्रतिनिधित्व गर्दछ।
4. सान्दर्भिक जानकारी निकाल्नुहोस्: प्रत्येक वस्तु एनोटेसनबाट सान्दर्भिक जानकारी निकाल्नुहोस्, जस्तै वस्तुको नाम, बाउन्डिङ बाकस समन्वयहरू, र विश्वास स्कोर। यी विवरणहरू प्रत्येक वस्तु एनोटेसन भित्र छुट्टै क्षेत्रहरूको रूपमा पहुँच गर्न सकिन्छ।
5. निकालिएको जानकारी भण्डारण वा प्रशोधन गर्नुहोस्: तपाईंको आवश्यकताहरूमा निर्भर गर्दै, तपाईंले निकालिएको जानकारीलाई डाटा संरचनामा भण्डारण गर्न सक्नुहुन्छ वा विश्लेषण वा अन्य उद्देश्यका लागि यसलाई थप प्रशोधन गर्न सक्नुहुन्छ। उदाहरणका लागि, तपाईँले वस्तुको नामहरू र तिनीहरूको सम्बन्धित बाउन्डिङ बाकस समन्वयहरू डाटाबेसमा भण्डारण गर्न वा थप छवि बुझ्ने कार्यहरूको लागि प्रयोग गर्न सक्नुहुन्छ।
निकासी प्रक्रिया चित्रण गर्न यहाँ एक सरल उदाहरण हो:
python import json # Assume 'response' contains the API response in JSON format response =
{
"localizedObjectAnnotations": [
{
"mid": "/m/01g317",
"नाम": "बिरालो",
"स्कोर": ०.८९२७१३५५,
"boundingPoly": {
"normalized Vertices": [
{"x": ०.१२३४, "y": ०.५६७८},
{"x": ०.५६७८, "y": ०.१२३४}
] }
},
{
"mid": "/m/04rky",
"नाम": "कुकुर",
"स्कोर": ०.८९२७१३५५,
"boundingPoly": {
"normalized Vertices": [
{"x": ०.१२३४, "y": ०.५६७८},
{"x": ०.५६७८, "y": ०.१२३४}
] }
}
] }
# Parse the API response response_data = json.loads(response) # Access the object annotations annotations = response_data['localizedObjectAnnotations'] # Iterate through the object annotations for annotation in annotations: # Extract relevant information object_name = annotation['name'] bounding_box = annotation['boundingPoly']['normalizedVertices'] confidence = annotation['score'] # Process or store the extracted information print(f"Object: {object_name}, Bounding Box: {bounding_box}, Confidence: {confidence}") # Output: # Object: cat, Bounding Box: [{'x': 0.1234, 'y': 0.5678}, {'x': 0.5678, 'y': 0.1234}], Confidence: 0.89271355 # Object: dog, Bounding Box: [{'x': 0.4321, 'y': 0.8765}, {'x': 0.8765, 'y': 0.4321}], Confidence: 0.8132468
यस उदाहरणमा, हामी दुईवटा पत्ता लगाइएका वस्तुहरू समावेश भएको JSON प्रतिक्रिया मान्दछौं: एउटा बिरालो र कुकुर। कोडले प्रतिक्रियालाई पार्स गर्दछ, "स्थानीयकृत वस्तु एनोटेसनहरू" फिल्डमा पहुँच गर्दछ, प्रत्येक वस्तु एनोटेसन मार्फत दोहोर्याउँछ, र वस्तुको नाम, बाउन्डिङ बक्स समन्वयहरू, र आत्मविश्वास स्कोर निकाल्छ। अन्तमा, निकालिएको जानकारी छापिएको छ, तर तपाईले आफ्नो विशिष्ट आवश्यकताहरू अनुरूप कोड परिमार्जन गर्न सक्नुहुन्छ।
यी चरणहरू पछ्याएर, तपाईंले एपीआईको प्रतिक्रियाबाट आर्टिफिसियल इन्टेलिजेन्स - गुगल भिजन एपीआई - उन्नत छविहरू बुझ्ने - वस्तु पत्ता लगाउने क्षेत्रमा प्रभावकारी रूपमा सबै वस्तु एनोटेसनहरू निकाल्न सक्नुहुन्छ।
अन्य भर्खरका प्रश्न र उत्तरहरू सम्बन्धमा उन्नत छविहरू बुझ्दै:
- Google Vision API मा वस्तु पहिचानका लागि केही पूर्वनिर्धारित कोटीहरू के हुन्?
- अन्य मध्यस्थता प्रविधिहरूसँग संयोजनमा सुरक्षित खोज पत्ता लगाउने सुविधा प्रयोग गर्न सिफारिस गरिएको दृष्टिकोण के हो?
- हामी कसरी सुरक्षित खोज एनोटेसनमा प्रत्येक श्रेणीको लागि सम्भाव्यता मानहरू पहुँच गर्न र प्रदर्शन गर्न सक्छौं?
- पाइथनमा Google Vision API प्रयोग गरेर हामी कसरी सुरक्षित खोज एनोटेसन प्राप्त गर्न सक्छौं?
- सुरक्षित खोज पत्ता लगाउने सुविधामा समावेश गरिएका पाँच कोटीहरू के के हुन्?
- Google Vision API को सुरक्षित खोज सुविधाले छविहरू भित्र स्पष्ट सामग्री कसरी पत्ता लगाउँछ?
- तकिया पुस्तकालय प्रयोग गरेर हामी कसरी छविमा पत्ता लगाइएका वस्तुहरूलाई दृश्यात्मक रूपमा पहिचान र हाइलाइट गर्न सक्छौं?
- हामी कसरी पाण्डा डेटा फ्रेम प्रयोग गरेर निकालिएको वस्तु जानकारीलाई तालिका ढाँचामा व्यवस्थित गर्न सक्छौं?
- गुगल भिजन API को कार्यक्षमता प्रदर्शन गर्न कुन पुस्तकालय र प्रोग्रामिङ भाषा प्रयोग गरिन्छ?
- Google Vision API ले छविहरूमा वस्तु पत्ता लगाउने र स्थानीयकरण कसरी गर्छ?
उन्नत तस्बिर बुझाइमा थप प्रश्न र उत्तरहरू हेर्नुहोस्