当前位置: 首页 > news >正文

wangEditor实现word文档公式粘贴转MathML

《独立开发者的"富文本粘贴攻坚战":从Word地狱到云端救赎的技术实录》
——上海.NET程序员的破局之路

第一章:当需求文档变成"技术恐怖片"

作为独立开发者,我独自维护着一个基于Vue2 + wangEditor的文档协作平台。某天,产品经理甩来一份需求:
“需要支持从Word/Excel/PPT/PDF直接粘贴/导入内容,图片自动上传至阿里云OSS,且保留原始样式(字体/颜色/表格等)。后端用ASP.NET Core,数据库SQL Server。”

我盯着屏幕陷入沉思:这哪是需求,分明是**“全栈开发者の终极试炼”**。


第二章:前端战场——wangEditor的"粘贴拦截术"

1. 破解Word的"脏HTML"陷阱

Word粘贴的内容自带等Office专属标签,直接渲染会乱码。我的解决方案:

// wangEditor配置增强consteditor=newWangEditor('#editor')editor.config.pasteFilterStyle=false// 允许基础样式editor.config.pasteIgnoreImg=false// 不忽略图片// 自定义粘贴处理editor.config.customPaste=(editor,html)=>{// 1. 清理Office冗余标签(正则暴击)letcleanHtml=html.replace(//g, '') // 移除Office绘图标签.replace(/<\/o:p>/g,' ')// 换行符转换.replace(//g, '') // 移除注释// 2. 提取Base64图片并触发上传returnextractImagesAndUpload(cleanHtml)}
2. 图片自动上传:从Base64到Blob的蜕变

Word图片默认是Base64编码,直接传输效率低下。我实现了分步处理:

asyncfunctionextractImagesAndUpload(html){constparser=newDOMParser()constdoc=parser.parseFromString(html,'text/html')constimages=doc.querySelectorAll('img[src^="data:image"]')for(letimgofimages){constbase64=img.src.split(',')[1]constblob=awaitbase64ToBlob(base64)// 自定义转换函数// 调用ASP.NET后端APIconstformData=newFormData()formData.append('file',blob,'word-image.png')fetch('/api/upload',{method:'POST',body:formData}).then(res=>res.json()).then(data=>{img.src=data.url// 替换为OSS URL})}returndoc.body.innerHTML}

效果:用户粘贴Word后,图片自动上传至OSS,编辑器内显示可访问的URL,且保留了原始字体、颜色等样式。


第三章:后端战场——ASP.NET Core的"对象存储攻防战"

1. 文件接收与OSS上传

创建专门的FileUploadController处理图片上传:

[ApiController][Route("api/[controller]")]publicclassUploadController:ControllerBase{privatereadonlyIOSSClient_ossClient;// 阿里云OSS封装接口[HttpPost]publicasyncTaskUpload(IFormFilefile){if(file==null||file.Length==0)returnBadRequest();// 生成唯一文件名varext=Path.GetExtension(file.FileName);varfileName=$"{Guid.NewGuid()}{ext}";// 上传至OSS(使用阿里云SDK)usingvarstream=file.OpenReadStream();await_ossClient.PutObjectAsync("your-bucket",$"uploads/{fileName}",stream);// 返回可访问URLvarurl=$"https://your-bucket.oss-cn-shanghai.aliyuncs.com/uploads/{fileName}";returnOk(new{url});}}
2. 文档导入:多格式转换方案

针对不同文档类型采用不同策略:

① Word/Excel/PPT → HTML
使用LibreOffice(通过Docker部署):

publicasyncTaskConvertOfficeToHtml(stringfilePath,stringfileType){varoutputPath=Path.Combine("/tmp",$"{Guid.NewGuid()}.html");// 调用LibreOffice命令行转换varprocess=newProcess{StartInfo=newProcessStartInfo{FileName="soffice",Arguments=$"--headless --convert-to html:{fileType}--outdir /tmp{filePath}",RedirectStandardOutput=true,UseShellExecute=false}};awaitprocess.StartAsync();awaitprocess.WaitForExitAsync();returnFile.ReadAllText(outputPath);}

② PDF → HTML
使用pdf2htmlEX(需单独安装):

publicasyncTaskConvertPdfToHtml(stringfilePath){varoutputPath=Path.Combine("/tmp",$"{Guid.NewGuid()}.html");varprocess=newProcess{StartInfo=newProcessStartInfo{FileName="pdf2htmlEX",Arguments=$"--zoom 1.3{filePath}{outputPath}",RedirectStandardOutput=true,UseShellExecute=false}};awaitprocess.StartAsync();awaitprocess.WaitForExitAsync();returnFile.ReadAllText(outputPath);}

坑点记录

  • LibreOffice转换Excel时,复杂公式可能丢失
  • pdf2htmlEX生成的HTML需要额外CSS重置样式
  • 所有转换工具建议通过Docker部署,避免环境污染

第四章:数据库设计——SQL Server的"元数据管理"

为支持文档历史版本,设计了以下表结构:

CREATETABLEDocuments(Id UNIQUEIDENTIFIERPRIMARYKEY,Title NVARCHAR(255),Content NVARCHAR(MAX),-- 存储最终HTMLCreatedAtDATETIMEDEFAULTGETDATE(),UpdatedAtDATETIMEDEFAULTGETDATE());CREATETABLEDocumentImages(Id UNIQUEIDENTIFIERPRIMARYKEY,DocumentId UNIQUEIDENTIFIERFOREIGNKEYREFERENCESDocuments(Id),ImageUrl NVARCHAR(512),OriginalName NVARCHAR(255),SizeINT,UploadTimeDATETIMEDEFAULTGETDATE());

第五章:同行互助——QQ群里的"技术急救"

在开发过程中,加入QQ群:223813913后发现:

  • @北京-张工:“推荐用Mammoth.js处理Word,比LibreOffice轻量!”
  • @深圳-李姐:“Excel转换后表格线消失?试试OpenXML SDK直接解析.xlsx”
  • @杭州-王总:“阿里云OSS上传建议用预签名URL,避免前端直接传密钥”

群内资源推荐

  • 前端:mammoth.js(Word转HTML)
  • 后端:NPOI(.NET处理Office文件)
  • 工具:Docker(隔离转换环境)

最终成果:从需求到上线的完整闭环

现在系统支持:
Word粘贴:内容+图片自动上传,样式保留
多文档导入:Word/Excel/PPT/PDF一键转换
对象存储:图片存阿里云OSS,支持CDN加速
版本管理:SQL Server记录文档修改历史

技术栈总结

  • 前端:Vue2 + wangEditor(粘贴拦截+图片上传)
  • 后端:ASP.NET Core(文件处理+OSS SDK)
  • 转换工具:LibreOffice + pdf2htmlEX
  • 存储:阿里云OSS + SQL Server

最后呼吁
如果你也在攻克富文本编辑器难题,欢迎加入QQ群:223813913,这里没有"菜鸟",只有"即将成为大神的同行"!

(完)
——上海独立开发者·陈工

复制插件文件


安装jquery

npm install jquery

导入组件

importEfrom'wangeditor'const{$,BtnMenu,DropListMenu,PanelMenu,DropList,Panel,Tooltip}=Eimport{WordPaster}from'../../static/WordPaster/js/w'import{zyCapture}from'../../static/zyCapture/z'import{zyOffice}from'../../static/zyOffice/js/o'

初始化组件

//zyCapture ButtonclasszyCaptureBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){window.zyCapture.setEditor(this.editor).Capture();}tryChangeActive(){this.active()}}//zyOffice ButtonclassimportWordBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){window.zyOffice.SetEditor(this.editor).api.openDoc();}tryChangeActive(){this.active()}}//zyOffice ButtonclassexportWordBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){window.zyOffice.SetEditor(this.editor).api.exportWord();}tryChangeActive(){this.active()}}//zyOffice ButtonclassimportPdfBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){window.zyOffice.SetEditor(this.editor).api.openPdf();}tryChangeActive(){this.active()}}//WordPaster ButtonclassWordPasterBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){WordPaster.getInstance().SetEditor(this.editor).Paste();}tryChangeActive(){this.active()}}//wordImport ButtonclassWordImportBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){WordPaster.getInstance().SetEditor(this.editor).importWord();}tryChangeActive(){this.active()}}//excelImport ButtonclassExcelImportBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){WordPaster.getInstance().SetEditor(this.editor).importExcel();}tryChangeActive(){this.active()}}//ppt paster ButtonclassPPTImportBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){WordPaster.getInstance().SetEditor(this.editor).importPPT();}tryChangeActive(){this.active()}}//pdf paster ButtonclassPDFImportBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){WordPaster.getInstance().SetEditor(this.editor);WordPaster.getInstance().ImportPDF();}tryChangeActive(){this.active()}}//importWordToImg ButtonclassImportWordToImgBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){WordPaster.getInstance().SetEditor(this.editor).importWordToImg();}tryChangeActive(){this.active()}}//network paster ButtonclassNetImportBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){WordPaster.getInstance().SetEditor(this.editor);WordPaster.getInstance().UploadNetImg();}tryChangeActive(){this.active()}}exportdefault{name:'HelloWorld',data(){return{msg:'Welcome to Your Vue.js App'}},mounted(){vareditor=newE('#editor');WordPaster.getInstance({//上传接口:http://www.ncmem.com/doc/view.aspx?id=d88b60a2b0204af1ba62fa66288203edPostUrl:"http://localhost:8891/upload.aspx",License2:"",//为图片地址增加域名:http://www.ncmem.com/doc/view.aspx?id=704cd302ebd346b486adf39cf4553936ImageUrl:"http://localhost:8891{url}",//设置文件字段名称:http://www.ncmem.com/doc/view.aspx?id=c3ad06c2ae31454cb418ceb2b8da7c45FileFieldName:"file",//提取图片地址:http://www.ncmem.com/doc/view.aspx?id=07e3f323d22d4571ad213441ab8530d1ImageMatch:''});zyCapture.getInstance({config:{PostUrl:"http://localhost:8891/upload.aspx",License2:'',FileFieldName:"file",Fields:{uname:"test"},ImageUrl:'http://localhost:8891{url}'}})// zyoffice,// 使用前请在服务端部署zyoffice,// http://www.ncmem.com/doc/view.aspx?id=82170058de824b5c86e2e666e5be319czyOffice.getInstance({word:'http://localhost:13710/zyoffice/word/convert',wordExport:'http://localhost:13710/zyoffice/word/export',pdf:'http://localhost:13710/zyoffice/pdf/upload'})// 注册菜单E.registerMenu("zyCaptureBtn",zyCaptureBtn)E.registerMenu("WordPasterBtn",WordPasterBtn)E.registerMenu("ImportWordToImgBtn",ImportWordToImgBtn)E.registerMenu("NetImportBtn",NetImportBtn)E.registerMenu("WordImportBtn",WordImportBtn)E.registerMenu("ExcelImportBtn",ExcelImportBtn)E.registerMenu("PPTImportBtn",PPTImportBtn)E.registerMenu("PDFImportBtn",PDFImportBtn)E.registerMenu("importWordBtn",importWordBtn)E.registerMenu("exportWordBtn",exportWordBtn)E.registerMenu("importPdfBtn",importPdfBtn)//挂载粘贴事件editor.txt.eventHooks.pasteEvents.length=0;editor.txt.eventHooks.pasteEvents.push(function(){WordPaster.getInstance().SetEditor(editor).Paste();e.preventDefault();});editor.create();varedt2=newE('#editor2');//挂载粘贴事件edt2.txt.eventHooks.pasteEvents.length=0;edt2.txt.eventHooks.pasteEvents.push(function(){WordPaster.getInstance().SetEditor(edt2).Paste();e.preventDefault();return;});edt2.create();}}h1,h2{font-weight:normal;}ul{list-style-type:none;padding:0;}li{display:inline-block;margin:010px;}a{color:#42b983;}

测试前请配置图片上传接口并测试成功
接口测试
接口返回JSON格式参考

为编辑器添加按钮

components:{Editor,Toolbar},data(){return{editor:null,html:'dd',toolbarConfig:{insertKeys:{index:0,keys:['zycapture','wordpaster','pptimport','pdfimport','netimg','importword','exportword','importpdf']}},editorConfig:{placeholder:''},mode:'default'// or 'simple'}},

整合效果

导入Word文档,支持doc,docx

导入Excel文档,支持xls,xlsx

粘贴Word

一键粘贴Word内容,自动上传Word中的图片,保留文字样式。

Word转图片

一键导入Word文件,并将Word文件转换成图片上传到服务器中。

导入PDF

一键导入PDF文件,并将PDF转换成图片上传到服务器中。

导入PPT

一键导入PPT文件,并将PPT转换成图片上传到服务器中。

上传网络图片

一键自动上传网络图片,自动下载远程服务器图片,自动上传远程服务器图片

下载示例

点击下载完整示例

http://www.jsqmd.com/news/82777/

相关文章:

  • AxGlyph v12.25 终极矢量绘图指南 - 免费高效的论文插图解决方案
  • 普通人学会后黑客技术能有多爽?一文讲清!
  • 网络信息技术从入门到精通:理论 + 实操 + 资源
  • 软件测试(2):白盒测试
  • QuickJS多线程编程完全指南:从入门到精通
  • dnSpy 终极指南:快速掌握.NET反编译与调试技巧
  • 终极Python版本管理指南:pyenv完全使用手册
  • 遥感图像超分辨率重建完整教程:使用PaddleGAN实现高质量图像增强
  • 从零开始:Amazon商品评论数据集完整使用指南
  • 全网干货|白帽子黑客挣钱全攻略:新手入门到高阶变现路径拆解,兄弟致富秘籍别错过!
  • HunyuanVideo 1.5技术突破:83亿参数模型如何重塑视频内容产业链
  • 数据泄漏的三大隐形陷阱:如何避免模型“作弊“与实际部署的惨痛教训
  • 深度强化学习在格斗游戏AI中的技术实现与优化策略
  • 零基础玩转AI音乐风格识别:Magenta实战指南
  • 2025可伸缩煤矿用带式输送机厂家推荐TOP5:专业带式输送 - mypinpai
  • Gleam编程语言:类型安全与函数式编程的完美融合
  • FossFLOW容器化部署实战:从零到一的等距图可视化平台搭建指南
  • NoHello终极指南:快速隐藏Root权限,打造安全防护屏障
  • 1、树莓派特工指南:开启神秘之旅
  • DeepSeek-V3量化部署实战:从671B参数到消费级硬件的性能优化
  • 基于C语言 标准的内存操作:从指针强转陷阱到联合体契约
  • 2025年广州PCB加工企业排行榜,广州华创精密PCB可靠吗 - myqiye
  • 赋能机械产业数字化升级 ,哲霖软件斩获 “莞创杯” 双项大奖
  • 人类作者末日?我用AI写了一篇爆文,但关键一步它永远做不到
  • 郭天祥51单片机C语言教程:完整高清PDF获取指南
  • Spider语言终极指南:解决JavaScript开发痛点的完整方案
  • 采用线性动态聚类的谐波责任区间估计
  • 28、Qt 开发中的实用类与国际化配置
  • 百度网盘Mac版下载限速突破指南:让你的网速飞起来
  • 轻量化多模态推理模型的技术革命:从Apriel-1.5-15B看AI效率新范式