• 光学字符识别(OCR)是一种视觉识别过程,把印刷或编写文本的电子文字的文件。 文件扫描和转换成PDF文件提供了基础,其文字识别软件可以解释每个字图像在PDF并将它分配一个电子性格基础文件,然后可以进入一个编辑格式,诸如文字或文件。

    VeryPDF的PDF TXT OCR转换器的开发是一个命令行程序,使用光学字符识别技术OCR PDF格式的扫描文件和图像(TIFF,BMP,PNG,JPG,迷你免费析,等等)。 TXT文件。

    下命令行会OCR所有的PDF文件D:emp文件夹中的文字的文件:

    对%F(D:emp*.pdf)做pdf2txtocr.exe ocr-lang deu"F""%~dpnF.txt"

    下命令行会OCR所有的PDF文件D:emp文件夹和子目录以文本文件:

    为/r D:emp%F在(*.pdf)做pdf2txtocr.exe ocr"F""%~dpnF.txt"

    下命令行会OCR所有的PDF格式文件D:emp文件夹和输出文本的文件C:est文件夹:

    对%F(D:emp*.pdf)做pdf2txtocr.exe ocr"F""C:est\%~nF.txt""

  • ऑप्टिकल कैरेक्टर पहचान (ओसीआर) एक दृश्य मान्यता की प्रक्रिया बदल जाता है कि मुद्रित या लिखित पाठ में एक इलेक्ट्रॉनिक चरित्र-आधारित फ़ाइल. एक दस्तावेज़ है कि स्कैन और एक में परिवर्तित पीडीएफ दस्तावेज़ के लिए आधार प्रदान करता है, जो कैरेक्टर मान्यता सॉफ्टवेयर हो सकता है की व्याख्या प्रत्येक चरित्र छवि पर पीडीएफ और आवंटित यह एक इलेक्ट्रॉनिक चरित्र-आधारित फ़ाइल है कि कर सकते हैं तो प्रवेश किया जा सकता एक संपादन प्रारूप में, इस तरह के रूप में एक पाठ या दस्तावेज़ को Word.

    VeryPDF के पीडीएफ के लिए TXT ओसीआर कनवर्टर विकसित किया गया था होना करने के लिए एक कमांड लाइन आवेदन का उपयोग करता है कि ऑप्टिकल कैरेक्टर मान्यता प्रौद्योगिकी के लिए ओसीआर स्कैन पीडीएफ दस्तावेजों और छवियों (TIFF, BMP, PNG, JPG, PCX, TGA, आदि.) करने के लिए TXT फ़ाइलें ।

    निम्नलिखित कमांड लाइन ओसीआर सभी पीडीएफ फाइलों में D: emp फ़ोल्डर के लिए पाठ फ़ाइलों:

    %F में (डी: emp*.पीडीएफ) pdf2txtocr.exe -ओसीआर -लैंग deu "%च" "%~dpnF.txt"

    निम्नलिखित कमांड लाइन ओसीआर सभी पीडीएफ फाइलों में D: emp फ़ोल्डर और subdirectories करने के लिए पाठ फ़ाइलें:

    के लिए /आर डी: emp %F में (*.पीडीएफ) pdf2txtocr.exe -ओसीआर "%च" "%~dpnF.txt"

    निम्नलिखित कमांड लाइन ओसीआर सभी पीडीएफ फाइलों से D: emp और आउटपुट फ़ोल्डर के लिए पाठ फ़ाइलों C: est फ़ोल्डर:

    %F में (डी: emp*.पीडीएफ) pdf2txtocr.exe -ओसीआर "%च" "C: est\%~nF.txt""

  • Optical Character Recognition (OCR) is a visual recognition process that turns printed or written text into an electronic character-based file. A document that is scanned and converted into a PDF document provides the basis for which character recognition software may interpret each character image on the PDF and assign it an electronic character-based file that can then be entered into an editable format, such as a Text or Word document.

    VeryPDF's PDF to TXT OCR Converter was developed to be a Command Line application that uses Optical Character Recognition technology to OCR scanned PDF documents and images (TIFF, BMP, PNG, JPG, PCX, TGA, etc.) to TXT files.

    Following command line will OCR all PDF files in D: emp folder to text files:

    for %F in (D: emp*.pdf) do pdf2txtocr.exe -ocr -lang deu "%F" "%~dpnF.txt"

    Following command line will OCR all PDF files in D: emp folder and subdirectories to text files:

    for /r D: emp %F in (*.pdf) do pdf2txtocr.exe -ocr "%F" "%~dpnF.txt"

    Following command line will OCR all PDF files from D: emp folder and output text files to C: est folder:

    for %F in (D: emp*.pdf) do pdf2txtocr.exe -ocr "%F" "C: est\%~nF.txt""