भिजुअल डाटामा पाठ बुझ्न र छविहरूबाट पाठ पत्ता लगाउन र निकाल्नको लागि Google Vision API को सन्दर्भमा फाइल मार्गहरूको सट्टा छवि URL हरू ह्यान्डल गर्न "detect_text" प्रकार्य परिमार्जन गर्न, हामीले अवस्थित कोडमा केही समायोजनहरू गर्न आवश्यक छ। यो परिमार्जनले हामीलाई छवि URL हरू सिधै प्रकार्यमा इनपुट गर्न अनुमति दिनेछ, छविहरू प्रशोधन गर्न र पाठ निकाल्न API लाई सक्षम पार्दै।
पहिले, हामीले अवस्थित "detect_text" प्रकार्यको संरचना बुझ्न आवश्यक छ। सामान्यतया, प्रकार्यले इनपुट प्यारामिटरको रूपमा फाइल मार्ग लिन्छ र छविबाट निकालिएको पाठ फर्काउँछ। कोड केहि यस्तो देखिन सक्छ:
python def detect_text(file_path): # Code to load the image from the file path # Code to call the Google Vision API and process the image # Code to extract and return the text from the processed image return extracted_text
छवि URL हरू ह्यान्डल गर्न यो प्रकार्य परिमार्जन गर्न, हामीले आवश्यक परिवर्तनहरू समावेश गर्न आवश्यक छ। यहाँ प्रकार्यको अद्यावधिक संस्करण हो:
python import requests from PIL import Image from io import BytesIO def detect_text(image_url): # Download the image from the URL response = requests.get(image_url) image = Image.open(BytesIO(response.content)) # Code to call the Google Vision API and process the image # Code to extract and return the text from the processed image return extracted_text
परिमार्जित कोडमा, हामी प्रदान गरिएको URL बाट छवि डाउनलोड गर्नको लागि `अनुरोध` पुस्तकालय प्रयोग गर्छौं। PIL (Python इमेजिङ लाइब्रेरी) मोड्युलबाट 'Image.open' विधि त्यसपछि थप प्रक्रियाको लागि छवि खोल्न प्रयोग गरिन्छ।
छवि लोड भएपछि, हामी Google Vision API लाई कल गर्न र पाठ निकाल्न छविलाई प्रशोधन गर्न अगाडि बढ्न सक्छौं। यस चरणको लागि निर्दिष्ट कोड API कार्यान्वयन र प्रयोग भइरहेको प्रोग्रामिङ भाषाको आधारमा भिन्न हुन सक्छ। यद्यपि, सामान्य दृष्टिकोणले छवि डेटा प्रयोग गरेर एपीआई अनुरोधहरू गर्ने र निकालिएको पाठ समावेश गर्ने प्रतिक्रिया प्राप्त गर्ने समावेश गर्दछ।
अन्तमा, हामी आउटपुटको रूपमा प्रकार्यबाट निकालिएको पाठ फिर्ता गर्छौं।
यहाँ परिमार्जित प्रकार्यको प्रयोगको उदाहरण हो:
python image_url = "https://example.com/image.jpg" extracted_text = detect_text(image_url) print(extracted_text)
यस उदाहरणमा, हामीले छवि URL लाई `detect_text` प्रकार्यमा इनपुटको रूपमा प्रदान गर्छौं, जसले छवि डाउनलोड गर्छ, Google Vision API प्रयोग गरेर यसलाई प्रशोधन गर्छ, र निकालिएको पाठ फिर्ता गर्छ।
फाइल पथको सट्टा छवि URL हरू ह्यान्डल गर्न "detect_text" प्रकार्य परिमार्जन गर्न, हामीले कोड समावेश गर्न आवश्यक छ जसले प्रदान गरिएको URL बाट छवि डाउनलोड गर्छ र त्यसपछि Google Vision API प्रयोग गरेर यसलाई प्रशोधन गर्छ। यी समायोजनहरू गरेर, हामी प्रभावकारी रूपमा छवि URL हरू इनपुटको रूपमा प्रयोग गरेर छविहरूबाट पाठ निकाल्न सक्छौं।
अन्य भर्खरका प्रश्न र उत्तरहरू सम्बन्धमा छविबाट पाठ पत्ता लगाउँदै र निकाल्दै:
- पाठ निकासीको लागि Google Vision API प्रयोग गर्ने केही सम्भावित अनुप्रयोगहरू के हुन्?
- हामी कसरी पान्डा पुस्तकालय प्रयोग गरेर निकालिएको पाठलाई थप पढ्न योग्य बनाउन सक्छौं?
- छविबाट पाठ निकाल्नको लागि Google Vision API प्रयोग गर्ने चरणहरू के के हुन्?
- हामी कसरी छविहरूबाट पाठ पत्ता लगाउन र निकाल्न Google Vision API प्रयोग गर्न सक्छौं?