Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >把Doc文档转换成HTML等其它格式

把Doc文档转换成HTML等其它格式

作者头像
Java架构师必看
发布于 2021-03-22 06:31:32
发布于 2021-03-22 06:31:32
1.4K0
举报
文章被收录于专栏:Java架构师必看Java架构师必看

利用microsoft Word 9.0 Object Library可以在页面中对Doc文档进行格式转换。有关Word对象的一些方法可以参考Open和Save。下面是进行转换的代码[C#]:

/// <summary> /// WordToHtml 的摘要说明。 /// 首先要添加引用:Microsoft Word 9.0 Object Library /// </summary>

word.applicationclass word = new Word.ApplicationClass(); Type wordType = word.GetType(); Word.Documents docs = word.Documents;

// 打开文件 Type docsType = docs.GetType(); object fileName = "d://tmp//aaa.doc"; Word.Document doc = (Word.Document)docsType.InvokeMember("Open",  System.Reflection.BindingFlags.InvokeMethod, null, docs, new Object[] {fileName, true, true});

// 转换格式,另存为 Type docType = doc.GetType(); object saveFileName = "d://tmp//aaa.html"; //下面是Microsoft Word 9 Object Library的写法,如果是10,可能写成: //docType.InvokeMember("SaveAs", System.Reflection.BindingFlags.InvokeMethod, null,  // doc, new object[]{saveFileName, Word.WdSaveFormat.wdFormatFilteredHTML}); ///其它格式: ///wdFormatHTML ///wdFormatDocument ///wdFormatDOSText ///wdFormatDOSTextLineBreaks ///wdFormatEncodedText ///wdFormatRTF ///wdFormatTemplate ///wdFormatText ///wdFormatTextLineBreaks ///wdFormatUnicodeText docType.InvokeMember("SaveAs", System.Reflection.BindingFlags.InvokeMethod, null,  doc, new object[]{saveFileName, Word.WdSaveFormat.wdFormatHTML});

// 退出 Word wordType.InvokeMember("Quit", System.Reflection.BindingFlags.InvokeMethod, null, word, null);

本文由来源 21aspnet,由 javajgs_com 整理编辑,其版权均为 21aspnet 所有,文章内容系作者个人观点,不代表 Java架构师必看 对观点赞同或支持。如需转载,请注明文章来源。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Office系列在线预览
最近客户有个需求,需要在线预览PPT、Excel、Word,开始打算用第三方组建去读取 office系列,然后生成html,这样的话样式相当于丢了,只剩下数据,而且第三方组件对office版本支持不够完善,最关键的是还是样式丢了!
全栈程序员站长
2021/08/13
1.2K0
把Doc文档转换成rtf格式
先在项目引用里添加上对Microsoft Word 9.0 object library的引用。
Java架构师必看
2021/03/22
1.2K0
html格式转换word_html嵌入word
这种情况下载的word文档中,样式全乱了,当时参考资料为:http://lanhy2000.blog.163.com/blog/static/4367860820119198575552/
全栈程序员站长
2022/09/20
1.8K0
html格式转换word_html嵌入word
动态装载和使用类型
Reflection提供诸如Microsoft Visual Basic.NET和JScript语言编译器使用的底层结构来实施隐性后绑定。绑定是定位与某一特定类型相对应的声明的过程。当这个过程发生在运行的时候,而不是编译的时候,它被称为后绑定。Visual Basic.NET使你可以在你的代码中使用隐性后绑定;VisualBasic.NET编译器调用helper 方法,使用Reflection获得对象类型。传递给helper 方法的参数 使适当的方法可以在运行时被调用。这些参数是调用方法(对象)的实例,被调用方法的名字(字符串),及传递给被调用方法的参数。(一个对象数组)。
Java架构师必看
2021/03/22
7590
在大型软件中用Word做报表: 书签的应用
本文转载:http://www.cnblogs.com/huyong/archive/2011/08/24/2151599.html
跟着阿笨一起玩NET
2018/09/19
7390
在大型软件中用Word做报表: 书签的应用
在.NET中实现彩色光标,动画光标和自定义光标
using System; using System.Drawing; using System.Windows.Forms; using System.Runtime.InteropServices; using System.Reflection;
Java架构师必看
2021/03/22
2K0
C#操作 word代码
推荐:http://www.cnblogs.com/roucheng/p/3521864.html
全栈程序员站长
2021/12/27
3970
17种Hello World!
HelloWorldHelperClass hwh = new HelloWorldHelperClass();
Java架构师必看
2021/03/22
3470
C#反射
        Reflection,中文翻译为反射。         这是.Net中获取运行时类型信息的方式,.Net的应用程序由几个部分:‘程序集(Assembly)’、‘模块(Module)’、‘类型 (class)’组成,而反射提供一种编程的方式,让程序员可以在程序运行期获得这几个组成部分的相关信息,例如:         Assembly类可以获得正在运行的装配件信息,也可以动态的加载装配件,以及在装配件中查找类型信息,并创建该类型的实例。 Type类可以获得对象的类型信息,此信息包含对象的所有要素:方法、构造器、属性等等,通过Type类可以得到这些要素的信息,并且调用之。 MethodInfo包含方法的信息,通过这个类可以得到方法的名称、参数、返回值等,并且可以调用之。 诸如此类,还有FieldInfo、EventInfo等等,这些类都包含在System.Reflection命名空间下。
aehyok
2018/09/11
8480
.Net 内存马改造
里面的详细的介绍了其利用方式,在学习的过程中发现,其中的参考文章提到了直接使用Start Pocess的方式会被wdf检查: Since ProxyLogon, ProxyShell, and till now some EDRs,AV,sysmon and Microsoft Windows Defender try to catch and prevent process spawn from w3wp.exe process. This also annoys us but we need some improvements to overcome it!
鸿鹄实验室
2021/12/08
1.3K0
.Net 内存马改造
.Net魔法堂:史上最全的ActiveX开发教程——ActiveX与JS间交互篇
一、前言                             经过上几篇的学习,现在我们已经掌握了ActiveX的整个开发过程,但要发挥ActiveX的真正威力,必须依靠JS。下面一起来学习吧! 二、JS调用ActiveX方法                     只需在UserControl子类中(即自定义的ActiveX控件中),编写公共方法即可。   C# [Guid("0203DABD-51B8-4E8E-A1EB-156950EE1668")] public partial class Up
^_^肥仔John
2018/01/18
2.4K0
.Net中的反射(动态创建类型实例) - Part.4
在前面节中,我们先了解了反射,然后利用反射查看了类型信息,并学习了如何创建自定义特性,并利用反射来遍历它。可以说,前面三节,我们学习的都是反射是什么,在接下来的章节中,我们将学习反射可以做什么。在进行更有趣的话题之前,我们先看下如何动态地创建一个对象。
张子阳
2018/09/30
1K0
.Net中的反射(动态创建类型实例) - Part.4
java将Word转换成PDF
网上有很多将Word转换成PDF的方式,这里找了两种比较简单的工具:jacob和aspose。
全栈程序员站长
2022/09/02
2.4K0
Emit:动态给一个类型添加Attribute
-- Attribute: [CustomAttributeBuilderSample.ClassCreatorAttribute = "Joe Program mer"]
菩提树下的杨过
2019/09/12
1.2K0
C# 处理Word自动生成报告 四、程序处理
现在说一下程序处理部分,有点长 本来是想做针对doc和docx的模板两个版本, 后来想到可以在生成的时候saveas里设置格式, 所以此版只支持对docx的模板处理, 想要doc的情况可以选择生成格式为doc的. 上代码: public class WordHelper { private Word.Application wordApp = null; private Word.Document wordDoc = null; private D
FlyLolo
2018/05/17
2.1K0
C#笔记:反射的简单用法
反射其实说白了就是,当你知道类的名字和位置。你可以在程序运行时直接创建实例调用它。没什么大不了的。
超级大猪
2019/11/22
4100
IE下用JavaScript将HTML导出为Word、Pdf
高爽
2017/12/28
2.1K0
IE下用JavaScript将HTML导出为Word、Pdf
C#导入导出数据到Excel的通用类代码
Excel文件导入导出,需引用Microsoft Excel 11.0 Object Library
用户8671053
2021/11/03
9290
C# 将 Word 转文本存储到数据库并进行管理
将 WORD 文件的二进制信息存储到数据库里,即方便了统一管理文件,又可以实行权限控制效果,此外,将 WORD 文件转化为文本存储,可以进一步实现对已存储文件的全文检索。 在应用项目里,我们将实现如下需求:
初九之潜龙勿用
2024/06/20
1620
C# 将 Word 转文本存储到数据库并进行管理
写字板(Windows程序设计)
用richtextbox是一个类似写字板的一个控件,能满足rtf,txt等格式,如果要满足doc文档,去百度Microsoft.Office.Interop.Word.dll,下载并引用,打开保存代码如下(其中saveName为文件名)
全栈程序员站长
2022/09/06
1.2K0
写字板(Windows程序设计)
相关推荐
Office系列在线预览
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档