OFD转TXT工具
将OFD文档转换为纯文本格式,支持自定义页面分隔符、换行格式、输出编码和页面范围选择
ツール情報と操作を確認してください。
記事とカテゴリ情報を確認してください。
この項目は現在の言語で表示されています。
软件使用说明
- 选择转换模式:工具提供两种模式:
- 单文件转换:适合转换单个OFD文件,可预览提取的文本内容并复制
- 批量转换:适合同时转换多个OFD文件,处理完成后打包下载
- 选择OFD文件:点击文件选择按钮,选择需要转换的OFD文件。单文件模式选择一个文件,批量模式可选择多个文件。
- 配置转换参数:
- 页面分隔符:设置不同页面之间的分隔方式,可选无分隔、空行、横线、页码标记或自定义
- 换行符格式:选择输出文本的换行符类型,Windows系统推荐CRLF,Linux/Mac推荐LF
- 输出编码:选择文本文件的字符编码,推荐UTF-8
- 页面范围:指定要提取的页面,如"1-5, 8, 10-12",留空表示全部页面
- 文本排序方式:按位置排序会根据文字在页面上的坐标重新排列
- 移除空行:删除提取文本中的空白行
- 去除行首尾空格:清理每行开头和结尾的多余空格
- 合并连续空格:将多个连续空格合并为一个
- 开始转换:点击"开始转换"按钮,等待处理完成。
- 获取结果:单文件模式可预览文本、复制到剪贴板或下载TXT文件;批量模式会将所有文件打包为ZIP下载。
常见问题
答:OFD文档中的文字可能以不同顺序存储。建议使用"按位置排序"选项,工具会根据文字在页面上的实际位置(从上到下、从左到右)重新排列文本,使输出更符合阅读习惯。
答:可能的原因包括:1)OFD文件中的内容是扫描图片而非文字;2)文档使用了特殊的文字编码或嵌入字体;3)文件结构不符合OFD标准规范。对于扫描件类型的OFD,需要使用OCR识别工具进行处理。
答:Windows系统使用CRLF(回车+换行)作为换行符,Linux和新版Mac使用LF(换行),旧版Mac使用CR(回车)。如果在Windows记事本中打开文件显示为一行,说明换行符格式不匹配,请选择CRLF格式重新转换。
答:BOM(字节顺序标记)是文件开头的特殊字符,用于标识文件编码。某些旧版软件(如Excel)需要BOM才能正确识别UTF-8编码。如果打开文件出现乱码,可以尝试使用UTF-8 with BOM格式。
答:在"页面范围"输入框中指定需要提取的页面。支持多种格式:单个页码如"5",连续范围如"1-10",多个范围如"1-5, 8, 10-12"。页码从1开始计数,留空则提取全部页面。
答:如果批量转换时遇到同名文件,工具会自动在文件名后添加数字后缀进行区分,例如"文档.txt"和"文档_1.txt",确保所有文件都能正确保存和下载。
答:可以启用以下选项优化输出:1)"移除空行"删除多余的空白行;2)"去除行首尾空格"清理每行的多余空格;3)"合并连续空格"将多个空格合并为一个。这些选项可以组合使用,获得更整洁的文本输出。