छवि के भीतर पाठ ढूँढना

मैं वर्तमान में एक परियोजना पर काम कर रहा हूं और मेरा लक्ष्य किसी छवि में पाठ का पता लगाना है। टेक्स्ट का ओसीआर करना अभी तक मेरा इरादा नहीं है। मैं मूल रूप से एक छवि के भीतर पाठ की सीमा प्राप्त करना चाहता हूं। मैं हेरफेर के लिए AForge.Net इमेजिंग घटक का उपयोग कर रहा हूँ। किसी अर्थ या किसी अन्य में कोई सहायता?

2/5/09 अपडेट करें: मैं तब से अपनी परियोजना में एक और मार्ग के साथ चला गया है। हालांकि मैंने MODI (माइक्रोसॉफ्ट ऑफिस दस्तावेज़ इमेजिंग) का उपयोग करके टेक्स्ट प्राप्त करने का प्रयास किया। यह आपको एक छवि को ओसीआर करने और कुछ आसानी से टेक्स्ट खींचने की अनुमति देता है।

0
जोड़ा संपादित
विचारों: 1

4 उत्तर

यह अनुसंधान का एक सक्रिय क्षेत्र है। इस विषय पर अकादमिक पत्रों के सचमुच अयस्क हैं। आपको विशेष रूप से सहायता प्रदान करना मुश्किल होगा। क्या आप विशिष्ट प्रकार के टेक्स्ट की तलाश में हैं? फोंट्स? सिर्फ अंग्रेजी? क्या आप अकादमिक साहित्य से परिचित हैं?

"टेक्स्ट डिटेक्शन" किसी भी ओसीआर (ऑप्टिकल कैरेक्टर रिकॉग्नाइजेशन) सिस्टम में एक मानक समस्या है और इसके परिणामस्वरूप इंटरवब्स पर कोड के बहुत सारे बिट्स हैं जो इससे निपटते हैं।

मैं Google से लिंक की ढेर सूचीबद्ध करना शुरू कर सकता हूं लेकिन मेरा सुझाव है कि आप "टेक्स्ट डिटेक्शन" की खोज करें और पढ़ना शुरू करें :)। पर्याप्त उदाहरण कोड भी उपलब्ध है।

0
जोड़ा

यदि आप इसके लिए ऑनलाइन एपीआई का उपयोग करने के ठीक हैं, तो एपीआई http: //www.wisetrend पर है। कॉम / wisetrend_ocr_cloud.shtml केवल ओसीआर के अलावा टेक्स्ट डिटेक्शन कर सकता है।

0
जोड़ा

किसी छवि के अंदर पाठ को पहचानना वास्तव में उस क्षेत्र के शोधकर्ताओं के लिए एक गर्म विषय है, लेकिन केवल कैप्चा की स्पैम बॉट के खिलाफ रक्षा के मामले में "मानक" बन गई। कैप्चा को सुरक्षा के रूप में क्यों उपयोग करें? अच्छी तरह से क्योंकि यह एक छवि के अंदर पाठ (और पढ़ने) पाठ को खोजने के लिए बहुत मुश्किल था!

कैप्चा का उल्लेख करने का कारण यह है कि सबसे प्रगति * उस छोटे से क्षेत्र में बनाई गई है, और मुझे लगता है कि आपका समाधान वहां सबसे अच्छा पाया जा सकता है। विशेष रूप से क्योंकि कैप्चा वास्तव में एक अव्यवस्थित छवि के अंदर टेक्स्ट (या टेक्स्ट जैसा दिखता है) ढूंढने के बारे में हैं और बाद में अक्षरों को सही ढंग से पढ़ने की कोशिश कर रहे हैं।

इसलिए यदि आप स्वयं को एक अच्छा ओपन सोर्स कैप्चा ब्रेकिंग टूल ढूंढ सकते हैं, तो शायद आपको बस इतना ही चाहिए अपनी खोज जारी रखें ...
आप संभवतः चरित्र पहचान को संभालने वाले सबसे भिन्न कोड को भी फेंक सकते हैं, क्योंकि उन ओसीआर का विकृत पाठ पढ़ने के लिए उपयोग किया जाता है, जो आपको करने की ज़रूरत नहीं है।

*: "गैर-शोधकर्ता" के लिए दृश्यमान, प्रयोग योग्य, और व्यावहारिक जानकारी के संदर्भ में प्रगति

0
जोड़ा
कैप्चा का उल्लेख करने का दूसरा कारण यह है कि शायद उनकी "परियोजना" क्या है। :-)
जोड़ा लेखक T.E.D., स्रोत

Stroke width transform can do that for you. That's at least what MS developed for their mobile phone OS. A discussion on the implementation is here at https://stackoverflow.com/

0
जोड़ा