itext.pdfocr.tesseract4 3.0.2

Prefix Reserved
dotnet add package itext.pdfocr.tesseract4 --version 3.0.2                
NuGet\Install-Package itext.pdfocr.tesseract4 -Version 3.0.2                
This command is intended to be used within the Package Manager Console in Visual Studio, as it uses the NuGet module's version of Install-Package.
<PackageReference Include="itext.pdfocr.tesseract4" Version="3.0.2" />                
For projects that support PackageReference, copy this XML node into the project file to reference the package.
paket add itext.pdfocr.tesseract4 --version 3.0.2                
#r "nuget: itext.pdfocr.tesseract4, 3.0.2"                
#r directive can be used in F# Interactive and Polyglot Notebooks. Copy this into the interactive tool or source code of the script to reference the package.
// Install itext.pdfocr.tesseract4 as a Cake Addin
#addin nuget:?package=itext.pdfocr.tesseract4&version=3.0.2

// Install itext.pdfocr.tesseract4 as a Cake Tool
#tool nuget:?package=itext.pdfocr.tesseract4&version=3.0.2                

iText pdfOCR offers Optical Character Recognition functionality to convert your scanned documents, PDFs and images into fully ISO-compliant PDF or PDF/A-3u files making it possible to access and process the text they contain. The output can be configured to be text, a PDF consisting of separate layers for the source image data and a layer containing all recognized text, or as a flattened PDF with the layers merged.

功能特性

  • 由开源的 Tesseract 4 引擎驱动
  • 简单的 API,同时具有灵活性。它还可以抽象化,以允许对不同的 OCR 引擎提供支持,无需用户进行太多或没有努力
  • 支持多种输入图像(BMP、PNM、PNG、JFIF、JPEG 或 TIFF 格式)
  • 仅文本提取选项:iText pdfOCR 能够识别文档中的文本并将其导出为文本文件。这对于填充外部数据库或使用其他工具非常有用。

访问我们的 知识库 以获取代码示例、用户手册、文档等。

您还可以在这里找到其API:此处

在我们的开发者沙盒中尝试我们的代码,或使用我们的免费应用,所有这些都可在我公司iText演示实验室找到。

产品 兼容和额外的计算目标框架版本。
.NET Framework net461兼容。 net462已计算。 net463已计算。 net47已计算。 net471已计算。 net472已计算。 net48已计算。 net481已计算。
兼容目标框架
包含的目标框架(在包内)
了解更多关于目标框架.NET Standard的信息。

NuGet包 (2)

显示依赖itext.pdfocr.tesseract4的顶级2个NuGet包

下载
itext7.pdfocr.tesseract4

pdfOCR是iText的附加组件,用于识别和提取扫描文档和图像中的文本。它还可以将它们转换为完全符合ISO标准的PDF或PDF/A-3u文件,这些文件易于访问、可搜索且适用于归档

itext.pdf2data

Apryse的pdf2Data让您能够提取和加工被锁定在PDF文件内部的数据。

GitHub仓库

这个包未被任何流行的GitHub仓库使用。

版本 下载 最后更新
3.0.2 946 2/7/2024
3.0.1 889 10/25/2023