OFD转TXT工具
将OFD文档转换为纯文本格式,支持自定义页面分隔符、换行格式、输出编码和页面范围选择
ब्राउज़र में स्थानीय निष्पादन
पुराने ऑनलाइन उपकरण सीधे वर्तमान पृष्ठ में एम्बेड हो जाएंगे। अधिकांश छवियाँ, पाठ, PDF, छोटी फ़ाइल प्रसंस्करण सर्वर पर अपलोड नहीं होंगे।
उपयोग निर्देश
软件使用说明
- 选择转换模式:工具提供两种模式:
- 单文件转换:适合转换单个OFD文件,可预览提取的文本内容并复制
- 批量转换:适合同时转换多个OFD文件,处理完成后打包下载
- 选择OFD文件:点击文件选择按钮,选择需要转换的OFD文件。单文件模式选择一个文件,批量模式可选择多个文件。
- 配置转换参数:
- 页面分隔符:设置不同页面之间的分隔方式,可选无分隔、空行、横线、页码标记或自定义
- 换行符格式:选择输出文本的换行符类型,Windows系统推荐CRLF,Linux/Mac推荐LF
- 输出编码:选择文本文件的字符编码,推荐UTF-8
- 页面范围:指定要提取的页面,如"1-5, 8, 10-12",留空表示全部页面
- 文本排序方式:按位置排序会根据文字在页面上的坐标重新排列
- 移除空行:删除提取文本中的空白行
- 去除行首尾空格:清理每行开头和结尾的多余空格
- 合并连续空格:将多个连续空格合并为一个
- 开始转换:点击"开始转换"按钮,等待处理完成。
- 获取结果:单文件模式可预览文本、复制到剪贴板或下载TXT文件;批量模式会将所有文件打包为ZIP下载。
常见问题
答:OFD文档中的文字可能以不同顺序存储。建议使用"按位置排序"选项,工具会根据文字在页面上的实际位置(从上到下、从左到右)重新排列文本,使输出更符合阅读习惯。
答:可能的原因包括:1)OFD文件中的内容是扫描图片而非文字;2)文档使用了特殊的文字编码或嵌入字体;3)文件结构不符合OFD标准规范。对于扫描件类型的OFD,需要使用OCR识别工具进行处理。
答:Windows系统使用CRLF(回车+换行)作为换行符,Linux和新版Mac使用LF(换行),旧版Mac使用CR(回车)。如果在Windows记事本中打开文件显示为一行,说明换行符格式不匹配,请选择CRLF格式重新转换。
答:BOM(字节顺序标记)是文件开头的特殊字符,用于标识文件编码。某些旧版软件(如Excel)需要BOM才能正确识别UTF-8编码。如果打开文件出现乱码,可以尝试使用UTF-8 with BOM格式。
答:在"页面范围"输入框中指定需要提取的页面。支持多种格式:单个页码如"5",连续范围如"1-10",多个范围如"1-5, 8, 10-12"。页码从1开始计数,留空则提取全部页面。
答:如果批量转换时遇到同名文件,工具会自动在文件名后添加数字后缀进行区分,例如"文档.txt"和"文档_1.txt",确保所有文件都能正确保存和下载。
答:可以启用以下选项优化输出:1)"移除空行"删除多余的空白行;2)"去除行首尾空格"清理每行的多余空格;3)"合并连续空格"将多个空格合并为一个。这些选项可以组合使用,获得更整洁的文本输出。