itext.pdfocr.tesseract4 3.0.2
Prefix Reserved
dotnet add package itext.pdfocr.tesseract4 --version 3.0.2
NuGet\Install-Package itext.pdfocr.tesseract4 -Version 3.0.2
This command is intended to be used within the Package Manager Console in Visual Studio, as it uses the NuGet module's version of Install-Package.
<PackageReference Include="itext.pdfocr.tesseract4" Version="3.0.2" />
For projects that support PackageReference, copy this XML node into the project file to reference the package.
paket add itext.pdfocr.tesseract4 --version 3.0.2
The NuGet Team does not provide support for this client. Please contact its maintainers for support.
#r "nuget: itext.pdfocr.tesseract4, 3.0.2"
#r directive can be used in F# Interactive and Polyglot Notebooks. Copy this into the interactive tool or source code of the script to reference the package.
// Install itext.pdfocr.tesseract4 as a Cake Addin #addin nuget:?package=itext.pdfocr.tesseract4&version=3.0.2 // Install itext.pdfocr.tesseract4 as a Cake Tool #tool nuget:?package=itext.pdfocr.tesseract4&version=3.0.2
The NuGet Team does not provide support for this client. Please contact its maintainers for support.
iText pdfOCR offers Optical Character Recognition functionality to convert your scanned documents, PDFs and images into fully ISO-compliant PDF or PDF/A-3u files making it possible to access and process the text they contain. The output can be configured to be text, a PDF consisting of separate layers for the source image data and a layer containing all recognized text, or as a flattened PDF with the layers merged.
功能特性
- 由开源的 Tesseract 4 引擎驱动
- 简单的 API,同时具有灵活性。它还可以抽象化,以允许对不同的 OCR 引擎提供支持,无需用户进行太多或没有努力
- 支持多种输入图像(BMP、PNM、PNG、JFIF、JPEG 或 TIFF 格式)
- 仅文本提取选项:iText pdfOCR 能够识别文档中的文本并将其导出为文本文件。这对于填充外部数据库或使用其他工具非常有用。
访问我们的 知识库 以获取代码示例、用户手册、文档等。
您还可以在这里找到其API:此处。
在我们的开发者沙盒中尝试我们的代码,或使用我们的免费应用,所有这些都可在我公司iText演示实验室找到。
产品 | 版本 兼容和额外的计算目标框架版本。 |
---|---|
.NET Framework | net461兼容。 net462已计算。 net463已计算。 net47已计算。 net471已计算。 net472已计算。 net48已计算。 net481已计算。 |
-
.NETFramework 4.6.1
- itext.pdfocr.api (≥3.0.2)
NuGet包 (2)
显示依赖itext.pdfocr.tesseract4的顶级2个NuGet包
包 | 下载 |
---|---|
itext7.pdfocr.tesseract4 pdfOCR是iText的附加组件,用于识别和提取扫描文档和图像中的文本。它还可以将它们转换为完全符合ISO标准的PDF或PDF/A-3u文件,这些文件易于访问、可搜索且适用于归档 |
|
itext.pdf2data Apryse的pdf2Data让您能够提取和加工被锁定在PDF文件内部的数据。 |
GitHub仓库
这个包未被任何流行的GitHub仓库使用。