itext7.pdfocr.tesseract4 3.0.2
前缀已保留
dotnet add package itext7.pdfocr.tesseract4 --version 3.0.2
NuGet\Install-Package itext7.pdfocr.tesseract4 -Version 3.0.2
该命令旨在在 Visual Studio 的包管理器控制台中使用,因为它使用了 NuGet 模块的 Install-Package 版本。
<PackageReference Include="itext7.pdfocr.tesseract4" Version="3.0.2" />
对于支持 PackageReference 的项目,将此 XML 节点复制到项目文件中,以引用此软件包。
paket add itext7.pdfocr.tesseract4 --version 3.0.2
NuGet 团队不提供对该客户端的支持。请联系其 维护者 以获得支持。
#r "nuget: itext7.pdfocr.tesseract4, 3.0.2"
#r 指令可以用于 F# Interactive 和多语言笔记本。将其复制到交互工具或脚本的源代码中,以引用该软件包。
// Install itext7.pdfocr.tesseract4 as a Cake Addin #addin nuget:?package=itext7.pdfocr.tesseract4&version=3.0.2 // Install itext7.pdfocr.tesseract4 as a Cake Tool #tool nuget:?package=itext7.pdfocr.tesseract4&version=3.0.2
NuGet 团队不提供对该客户端的支持。请联系其 维护者 以获得支持。
iText pdfOCR 提供光学字符识别功能,可将扫描的文档、PDF 和图像转换为完全符合 ISO 标准的 PDF 或 PDF/A-3u 文件,从而访问和处理其中包含的文本。输出可以配置为纯文本、包含源图像数据单独层和包含所有识别文本的层的 PDF,或合并层后的平铺 PDF。
功能
- 由开源的 Tesseract 4 引擎驱动
- 简单但灵活的 API。它还进行了抽象,使用户能够以较少或不需要的努力支持不同的 OCR 引擎
- 支持多种输入图像(BMP、PNM、PNG、JFIF、JPEG 或 TIFF 格式)
- 纯文本提取选项:iText pdfOCR 可识别文档中的文本并将其导出为文本文件。这可用于填充外部数据库或与其他工具一起使用。
访问我们的 知识库,查找代码示例、手册、文档等内容。
您还可以在此处找到其 API 此处。
在开发沙箱中试用我们的代码或使用我们的免费应用程序,所有这些都在我们的 iText Demo Lab 中。
-
.NETFramework 4.6.1
- itext.pdfocr.tesseract4 (>= 3.0.2)
NuGet 包
此包没有被任何 NuGet 包使用。
GitHub 仓库
此包没有被任何流行的 GitHub 仓库使用。