当前位置: 首页 > news >正文

如何在 C# 中将文本转换为 Word 以及将 Word 转换为文本 - 教程

在现代软件开发中,处理文档内容是一个非常常见的需求。无论是生成报告、存储日志,还是处理用户输入,开发者都可能需要在纯文本与 Word 文档之间进行转换

  • 有时需要将文本转换为 Word,以便生成结构化的 .docx 文件,使内容更易于阅读、打印或分享。
  • 有时需要将 Word 文档转换为文本,以便进行内容分析、搜索索引或数据处理。

通过掌握这两种转换方法,开发者可以更高效地处理各种文档场景,提高应用程序的灵活性。

本文将介绍如何使用 Free Spire.Doc for .NET 在 C# 中完成以下操作:

  • 将文本字符串转换为 Word 文档
  • 将文本文件转换为 Word 文档
  • 将 Word 文档转换为文本文件

前提条件

  • 开发环境:Visual Studio 或任意 C# IDE
  • :Free Spire.Doc for .NET

可以通过 NuGet 安装 Free Spire.Doc:

Install-Package FreeSpire.Doc

提示:Free Spire.Doc 适合基本文档处理需求(每个文档不超过500个段落和25个表格),如果需要处理更大的文档,可选择商业版本。


在 C# 中将文本转换为 Word

处理纯文本时,通常有两种情况:

  1. 文本已经在内存中,例如来自用户输入或程序生成的字符串。
  2. 文本存储在 .txt 文件中,需要将其转换为 Word 文档。

将文本字符串转换为 Word

using Spire.Doc;
using Spire.Doc.Documents;
class Program
{
static void Main()
{
Document document = new Document();
Section section = document.AddSection();
Paragraph paragraph = section.AddParagraph();
paragraph.AppendText("这是一个将文本字符串转换为 Word 的示例。");
document.SaveToFile("TextStringToWord.docx", FileFormat.Docx);
}
}

说明

  • Document 用于创建 Word 文档对象。
  • SectionParagraph 是 Word 文档结构的基本单元,可以根据需要添加多段文本或设置段落格式。
  • 输出文件 TextStringToWord.docx 将包含插入的文本内容。

扩展技巧:如果需要对文本应用不同字体、颜色或样式,可以使用 TextRange 对象进一步设置。


将文本文件转换为 Word

using Spire.Doc;
namespace ConvertTextToWord
{
internal class Program
{
static void Main(string[] args)
{
// 创建Document类的对象
Document doc = new Document();
// 加载文本文件
doc.LoadText("示例.txt");
// 将文本文件保存为Word
doc.SaveToFile("Txt转Word.docx", FileFormat.Docx2016);
doc.Close();
}
}
}

说明

  • LoadText 用于加载文本文件。
  • SaveToFile 将文本文件保存为Word文件,可选Doc, Docx等多种格式。

在 C# 中将 Word 转换为文本

有时我们需要从 Word 文档中提取内容用于分析或存储。这种情况下,可以将 Word 文档导出为纯文本文件:

using Spire.Doc;
class Program
{
static void Main()
{
Document document = new Document();
document.LoadFromFile("Sample.docx");
// 保存为纯文本文件
document.SaveToFile("WordToText.txt", FileFormat.Txt);
}
}

说明

  • 此操作会去除 Word 文档的格式,只保留文本内容。
  • 导出的文本可用于全文搜索、日志分析或进一步处理。
  • 如果需要保留某些简单格式(如换行或段落分隔),可在保存前手动遍历段落进行处理。

总结与建议

通过掌握文本与 Word 之间的双向转换,开发者可以:

  • 提高文档处理效率:将生成的文本内容快速转换为可打印或可分享的 Word 文档。
  • 便于数据分析:从 Word 文档中提取文本,用于搜索、索引或统计。
  • 保持格式灵活性:根据需要对段落、字体或样式进行自定义。

掌握这些方法后,C# 应用就可以更灵活地处理不同来源和类型的文档内容。

http://www.jsqmd.com/news/1165/

相关文章:

  • Chapter 8 Contour / Shape Detection
  • 【左程云算法笔记016】双端队列-双链表和固定数组实现 - 教程
  • LeetCode 几道 Promises 和 Time 的题目 - 教程
  • [硬件电路-232]:FET(场效应管)的核心机制是通过栅极电压调控半导体“沟道“中的载流子浓度与分布,进而控制源极与漏极之间的电流大小 - 指南
  • java相关问题:面向对象入门2与类的识别
  • EXCEL自动调整列宽的快捷键
  • 【C++实战⑬】解锁C++文件操作:从基础到实战的进阶之路 - 实践
  • 破解塔吊顶升高危难题!让事故率降 50%、审批快 70%
  • logicFlow________文档2
  • CF2086D Even String
  • logicflow___文档3
  • langraph-up-react
  • 2025年运营商API安全建设最佳实践:某头部省级电信案例解析与方案推荐
  • 软件工程第二次作业-第一次个人编程作业
  • 面向对象入门2与类的识别
  • 202508_天山固网_to
  • Java学生信息管理系统代码分析
  • ArcGIS Pro中 Nodata和nan 黑边的处理 - 指南
  • 怎么屏蔽 ahref.com 上你不想看到的网站链接(垃圾外链)
  • 浅谈字典树
  • go-mapus为局域网地图协作而生
  • 【工具变量】“国家级大数据综合试验区”试点城市DID(2000-2024年) - 教程
  • 《手搓动态顺序表:从数组到自动扩容的华丽转身》 - 详解
  • 板子大全
  • 通过人大金仓数据库的逻辑备份与还原功能实现数据迁移
  • 完整教程:GS1-128(EAN-128)编码构造方式
  • 第十二节:订单普通下单、支付回调、退款、退款回调详解
  • Chapter 7 Color Detection
  • 《原子习惯》-读书笔记7
  • PyQt数字转大写金额GUI程序开发及财务规范实现