腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
python
-
从
microsoft
word
中
提取
文本
python
、
ms-word
我正在尝试
提取
MS
word
文档(link)
中
特定部分的
文本
-示例如下。基本上,我需要将带有标记-- ASN1START和-- ASN1STOP的所有
文本
写到一个文件
中
,上面提到的标记除外。示例
文本
-- ASN1START rrc-TransactionIdentifier RRC-TransactionIdentifier我需要帮助
提取
只在标
浏览 13
提问于2020-01-15
得票数 1
回答已采纳
1
回答
使用
python
显示docx文件的内容
python
、
python-3.x
我想在docx
中
显示数据。但是我下面的代码是
提取
文本
和打印it.Can,有人建议我怎么做呢?在这里,我的表
中
的
文本
正在显示,但没有显示表。这里能做些什么?
浏览 2
提问于2019-09-23
得票数 1
1
回答
使用pyUNO
从
Office文档中
提取
宏
python
、
libreoffice
、
uno
、
pyuno
我有一个嵌入了宏的
Microsoft
Word
文档。我已经设法使用这个示例加载了一个文档那么,如何使用
Python
UNO
从
文档中
提取
宏
文本
呢?
浏览 3
提问于2014-05-26
得票数 0
2
回答
从
pdfs和文档中
提取
文本
和元数据
javascript
、
python
我想知道如何
从
文档such as bold text or big titles中
提取
文本
和相关元数据的方法。 我将使用
python
或javascript,并在每种语言上使用框架。那么,我如何
从
文件中
提取
所需的数据呢?
浏览 11
提问于2020-10-22
得票数 0
回答已采纳
2
回答
使用ASP.NET
从
word
文档
中
获取
文本
框值?
c#
、
asp.net
、
.net
、
ms-word
我有一个用ASP.NET(C#)编写的非常基本的web应用程序和一个包含
文本
框和下拉列表的基本
Microsoft
Word
(2007)文档。在我的web应用程序代码隐藏文件
中
,我想按名称调用textbox控件和dropdown控件,并从中
提取
值。我在网上找到的任何文档都只是简单地读写
word
文档,但我似乎找不到任何关于访问控件和
从
控件中
提取
值的内容。这是我目前唯一能处理
word
文档的代码。AND DOC
浏览 0
提问于2013-08-14
得票数 2
1
回答
使用Scrapy
从
Python
中
提取
Microsoft
Word
文件
中
的
文本
windows
、
python-2.7
、
ms-word
、
scrapy
、
screen-scraping
这是我的示例代码,使用
Python
提取
word
.doc和一个
从
网站
提取
的.docx文件。请检查它,并让我知道如何实现此代码…(C) Copyright 1985-2001
Microsoft
Corp._startRunCallbacks(result) File "C:\
Python
27\lib\site-packages\twisted\internet\d
浏览 0
提问于2014-09-05
得票数 0
3
回答
仅从剪贴板获取可读
文本
java
、
clipboard
我已经知道如何在Java语言中
从
剪贴板
中
获取纯
文本
,但有时
文本
会被编码成一些奇怪的DataFlavor,比如从
Microsoft
Word
或网站复制,甚至
从
Eclipse复制源代码。如何从这些DataFlavor中
提取
纯
文本
?
浏览 6
提问于2011-08-18
得票数 59
回答已采纳
1
回答
如何避免PyPDF
中
裁剪部分的
文本
?
python
、
pypdf2
我对
python
非常陌生,我正在做一个ML项目,
从
PDF(已发布的年度报告)中
提取
披露信息。PyPDF
提取
了我的项目所需的信息,但它也包含了我想要删除的
文本
中
的页脚
文本
。但是,当我在原始代码
中
运行已裁剪的PDF时,来自页脚的
文本
仍然包含在
提取
的
文本
中
。不管怎么说我能克服这一切吗?
浏览 5
提问于2022-10-14
得票数 1
回答已采纳
2
回答
使用SSIS将
Word
文档
中
的数据
提取
到ETL
中
sql-server
、
ssis
、
ms-word
、
etl
、
openxml
在如何使用SSIS
从
Word
文档中
提取
数据以及在SQL
中
插入
提取
的数据方面,我确实需要一些帮助。有10,000 -13,000个字文件需要处理。这些年来,这些文件很可能不一致。下面是我感兴趣的
Word
文档
中
的示例数据。请注意,Date和Job No位于标头部分。
浏览 12
提问于2022-03-16
得票数 1
1
回答
快速读取文档文件c#
c#
、
ms-word
我想从.doc文件中
提取
文本
,我使用以下代码object path = FileToSave_path + FileNameToSave + ".doc"; object readOnly = t
浏览 4
提问于2015-07-11
得票数 1
回答已采纳
1
回答
如何在C#中使用
Microsoft
.Office.Interop.
Word
逐页获取
word
文件(.Docx)
中
的
文本
c#
、
asp.net-mvc
、
asp.net-mvc-3
、
asp.net-mvc-4
、
office-interop
我想在C#中使用
Microsoft
.Office.Interop.
Word
逐页
从
.DOCX文件中
提取
文本
。目前,我正在通过下面提到的方法获取文件的所有
文本
,但是我想逐页获取,那么我该如何做呢 {
Microsoft
.Office.Interop.<em
浏览 0
提问于2015-03-25
得票数 1
1
回答
如何将varbinary doc作为HTML打开
asp.net
、
sql
、
vb.net
我将
word
文档恢复存储为var二进制文件(最大)。我可以根据全文检索简历-没问题。但是,简历是以
word
文档的形式在.ashx文件
中
检索的,代码如下。我不认为这可以
从
.ashx文件
中
完成,所以我认为我需要能够在aspx页面
中
以html的形式打开简历,或者使用javascript来进行点击高亮显示,或者以某种方式返回
word
文档的
文本
内容,并在使用html标记显示之前对
文本
进行操作。
浏览 2
提问于2011-01-25
得票数 0
1
回答
用
Python
语言
从
Word
文档(.docx)中
提取
突出显示的单词
python
、
xml
、
ms-word
、
docx
我正在处理一堆
word
文档,其中的
文本
(单词)被突出显示(使用颜色代码,例如黄色、蓝色、灰色),现在我想
提取
与每种颜色相关联的突出显示的单词。我正在用
Python
编程。以下是我目前所做的工作:#!= document.xpath('//w:r', namespaces=document.nsmap) for <em
浏览 3
提问于2012-03-05
得票数 3
回答已采纳
21
回答
PHP输出显示带有问号的小黑菱形
php
、
encoding
、
character-encoding
我正在写一个php程序,可以
从
数据库源中
提取
数据。其中一些varchars的引号显示为带有问号的黑色菱形(我
从
Microsoft
Word
文本
中
假定为、�)。 如何使用php剥离这些字符?
浏览 1
提问于2008-11-09
得票数 86
1
回答
UFT
中
如何
从
洞察对象中
提取
文本
automated-testing
假设我们有如下所示的洞察力对象:”)如何
从
“InsightObject_Example”中
提取
文本
?
浏览 0
提问于2014-04-11
得票数 1
1
回答
从
Word
表单拉取数据
c#
、
ms-office
、
text-extraction
使用C#时,我需要从
word
文档中
提取
数据。我已经在项目中安装了
word
的NetOffice。数据分为两部分。其次,我需要拉出文档
中
控件的内容。现在,我已经获得了以下代码来
从
文档中
提取
平面
文本
: { NetOffice.WordApi.ApplicationwordApplicati
浏览 4
提问于2015-04-21
得票数 1
1
回答
我可以使用
Microsoft
.Office.Interop.
Word
.dll进行
word
自动化吗?
java
、
ms-word
我有多个
word
文档。我想从所有的关键字
从
所有
word
文档中
提取
一些部件,并需要将所有
提取
的部件写到java
中
的单个输出
word
文档
中
。使用
Microsoft
.Office.Interop.
Word
.dll可以做到这一点吗? 如何在java中使用
Microsoft
.Office.Interop.
Word
.dll?
浏览 1
提问于2014-07-21
得票数 0
3
回答
解析
Microsoft
Office和PDF文档的最佳方法是什么?
vb.net
、
pdf
、
ms-office
、
parsing
、
lucene.net
Lucene.NET
中
的索引器只接受原始
文本
数据,不能直接
从
Microsoft
Office (DOC,DOCX,PPT,PPTX)和PDF文档中
提取
原始
文本
。从这样的文件中
提取
原始
文本
数据的最佳方法是什么?
浏览 2
提问于2009-01-21
得票数 7
回答已采纳
2
回答
如何:使用C#
从
Word
文档页脚
中
删除
文本
c#-4.0
、
interop
、
ms-word
、
com-interop
、
footer
我试图使用C# 4
从
Word
文档
中
删除一个页脚。网页2012年4月18日 第一页(2012年4月18日) 2012年4月18日 Dim rngFtr As Range Set rngFtr = ActiveDocument.Sections下面是我在C# 4<e
浏览 5
提问于2012-04-19
得票数 1
回答已采纳
2
回答
如何
从
MS-
Word
文档文件中
提取
文本
数据
c#
、
ms-word
所以我只想知道有没有免费的库可以用来
从
doc或docx文件中
提取
文本
数据,它可以在所有ms-
word
版本的情况下工作,如果ms-
word
没有安装在pc上也可以工作。我在谷歌上搜索,发现一些文章
从
文档文件中
提取
文本
数据,但我不确定它们在所有ms-
word
版本的情况下是否有效。所以,请指导我的信息,我应该使用哪个库
从
ms-
word
提取
数据,不管ms-
word
的版本,也
浏览 1
提问于2013-02-13
得票数 2
点击加载更多
相关
资讯
如何用Python从PDF文件中提取文本词汇
Python提取Word文档中所有超链接地址和文本
Python批量提取Word文件题库中的答案
Excel中批量提取摘要文本
如何在 Microsoft Word 中打开 PDF
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
语音识别
活动推荐
运营活动
广告
关闭
领券