itext7.pdfocr.tesseract4 3.0.2

前缀已保留
dotnet add package itext7.pdfocr.tesseract4 --version 3.0.2                
NuGet\Install-Package itext7.pdfocr.tesseract4 -Version 3.0.2                
该命令旨在在 Visual Studio 的包管理器控制台中使用,因为它使用了 NuGet 模块的 Install-Package 版本。
<PackageReference Include="itext7.pdfocr.tesseract4" Version="3.0.2" />                
对于支持 PackageReference 的项目,将此 XML 节点复制到项目文件中,以引用此软件包。
paket add itext7.pdfocr.tesseract4 --version 3.0.2                
#r "nuget: itext7.pdfocr.tesseract4, 3.0.2"                
#r 指令可以用于 F# Interactive 和多语言笔记本。将其复制到交互工具或脚本的源代码中,以引用该软件包。
// Install itext7.pdfocr.tesseract4 as a Cake Addin
#addin nuget:?package=itext7.pdfocr.tesseract4&version=3.0.2

// Install itext7.pdfocr.tesseract4 as a Cake Tool
#tool nuget:?package=itext7.pdfocr.tesseract4&version=3.0.2                

iText pdfOCR 提供光学字符识别功能,可将扫描的文档、PDF 和图像转换为完全符合 ISO 标准的 PDF 或 PDF/A-3u 文件,从而访问和处理其中包含的文本。输出可以配置为纯文本、包含源图像数据单独层和包含所有识别文本的层的 PDF,或合并层后的平铺 PDF。

功能

  • 由开源的 Tesseract 4 引擎驱动
  • 简单但灵活的 API。它还进行了抽象,使用户能够以较少或不需要的努力支持不同的 OCR 引擎
  • 支持多种输入图像(BMP、PNM、PNG、JFIF、JPEG 或 TIFF 格式)
  • 纯文本提取选项:iText pdfOCR 可识别文档中的文本并将其导出为文本文件。这可用于填充外部数据库或与其他工具一起使用。

访问我们的 知识库,查找代码示例、手册、文档等内容。

您还可以在此处找到其 API 此处

在开发沙箱中试用我们的代码或使用我们的免费应用程序,所有这些都在我们的 iText Demo Lab 中。

此软件包中没有提供支持的框架资产。

了解有关 目标框架.NET Standard 的更多信息。

NuGet 包

此包没有被任何 NuGet 包使用。

GitHub 仓库

此包没有被任何流行的 GitHub 仓库使用。

版本 下载 最后更新
3.0.2 1,054 2/7/2024
3.0.1 1,127 10/25/2023
3.0.0 1,011 5/10/2023
2.0.2 2,544 10/25/2022
2.0.1 1,523 1/11/2022
2.0.0 664 10/25/2021
1.0.3 796 7/5/2021
1.0.2 2,308 10/22/2020
1.0.1 690 7/23/2020
1.0.0 645 6/26/2020