腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9769)
视频
沙龙
1
回答
从
table
-
python
docx
中
提取
文本
并
比较
单元格
python
、
python-docx
我有一个程序,使用
python
docx
打印表格
单元格
中
列表
中
的随机值。表格、
单元格
和行的数量取决于用户输入。我需要
比较
表格的
单元格
,然后才能在另一个表格的相同数字
单元格
中
输入值。 tablename =
浏览 8
提问于2020-02-06
得票数 1
回答已采纳
1
回答
如何
从
.
docx
文件
中
的表中
提取
文本
?
python
、
docx
、
python-docx
我希望使用
python
从
.
docx
文件
中
的表中
提取
文本
,以便进行进一步分析。我使用以下代码:tables = document.tables forrow in
table
.rows: for paragraph in c
浏览 1
提问于2018-03-05
得票数 0
回答已采纳
1
回答
Word表格
中
的
文本
python
、
python-3.x
文档
中
的所有
文本
都存在于文档
中
的表格
中
。我有成百上千个这样的word文档(我每天都收到一个)。我想使用
python
打开每个文档,复制所需的
文本
,然后将其粘贴到excel文档
中
。我无法
从
word文档中
提取
文本
。我尝试使用
python
-
docx
模块来拉取
文本
,但是我不知道如何
从
表格
中
读取
文本
。 我修改了我正在阅读的
浏览 25
提问于2018-12-26
得票数 1
回答已采纳
1
回答
只将背景颜色为word-file的
文本
提取
到
python
python
、
docx
我想将word文件
中
的“突出显示”
文本
提取
到
python
中
。我知道如何使用以下命令
提取
完整的黑白文档: import
docx
2txtprint(my_text) 然后我就能拿回完整的文档。但是在原始的word文件
中
,有一些突出显示的表格是绿色背景色的(整个表格都是绿色背景色),我如何才能只
提取
这些信息呢?
浏览 26
提问于2021-04-12
得票数 0
4
回答
如何使用
python
从
docx
文件中
提取
超链接
中
的url
python
、
python-docx
我一直试图找出如何使用
python
从
docx
文件
中
获取urls,但什么也找不到,我尝试过
python
-
docx
和
python
-
docx
2txt,但
python
-
docx
似乎只
提取
文本
,而
python
-
docx
2txt能够
从
超链接中
提取
文本
,而不是urls本身。
浏览 3
提问于2016-11-08
得票数 3
1
回答
如何有效地
从
docx
/xml
中
删除表并
提取
文本
python
、
xml
、
beautifulsoup
、
lxml
删除表后,我在从.
docx
中
提取
文本
时遇到了问题。我正在处理的
docx
文件包含很多表,在
提取
文本
之前,我希望将这些表处理掉。我首先使用
docx
2html将
docx
文件转换为html,然后使用BeautifulSoup删除表标记并
提取
文本
。BeautifulSoup(temp) soup.
t
浏览 6
提问于2013-09-21
得票数 1
回答已采纳
4
回答
如何使用
Python
从
doc/
docx
文件中
提取
数据
python
、
ms-word
、
docx
、
doc
我需要的是一种
从
MS-Word文件
中
访问某些数据并将其保存在XML文件
中
的方法。在上阅读是没有帮助的,因为它似乎只允许一个人写入word文档,而不是阅读。要准确地呈现我的任务(或者我选择如何处理我的任务):我想搜索文档
中
的关键字或短语(文档包含表),并从找到关键字/短语的表中
提取
文本
数据。有人有什么想法吗?
浏览 10
提问于2014-03-31
得票数 10
回答已采纳
1
回答
使用POI
提取
Word文档中表格
单元格
中
的内容
java
、
text
、
apache-poi
、
extract
我一直在使用Java和POI
从
Word文档(
docx
)中
提取
数据。基本上,我希望
提取
包含在两列表
中
的数据。我希望程序区分左列和右列,并将各种值存储在数组
中
,问题是它逐行
提取
文本
:我用了这个方法,但它不能区分细胞。它只是从一排抓取所有的文字。 我使用的代码可以找到。我找不到在每个
单元格
中
提取
文本
的方法
浏览 3
提问于2016-05-25
得票数 1
回答已采纳
1
回答
从
docx
文件中
提取
特定字体的
文本
python
、
python-3.x
、
docx
、
python-docx
我使用
Python
3.4和
python
-
docx
库来处理.
docx
文件。我已经能够
从
文档中
提取
文本
。但我的目标是只
提取
那些具有特定字体的
文本
(
并
修改它们)。在过去的两天里,我一直在
中
搜索这个,但是没有结果。 这里有没有人对这个库有经验,如果有,他们能给我指出正确的方向吗?
浏览 1
提问于2014-09-01
得票数 4
2
回答
从
pdfs和文档中
提取
文本
和元数据
javascript
、
python
我想知道如何
从
文档such as bold text or big titles中
提取
文本
和相关元数据的方法。 我将使用
python
或javascript,并在每种语言上使用框架。那么,我如何
从
文件中
提取
所需的数据呢?
浏览 11
提问于2020-10-22
得票数 0
回答已采纳
2
回答
有没有办法读取.
docx
文件,包括使用
python
-
docx
自动编号
python
、
docx
、
python-docx
问题陈述:
从
.
docx
文件中
提取
部分,包括自动编号。 for paragraphparagraph.style.
浏览 22
提问于2018-08-30
得票数 20
回答已采纳
1
回答
使用
python
-
docx
在表
中
跨多列的
单元格
python
、
openxml
、
python-docx
根据在example-makedocument.py
中
创建表的示例代码,
并
通读
docx
.py
中
的代码,我认为类似于以下内容的代码将会起作用: [C1', 'C2' ] ] [25, 75],tbl_cwunit = 'pct' body.append(
table
(tbl_rows, co
浏览 1
提问于2013-03-29
得票数 3
回答已采纳
0
回答
如何在
python
-
docx
中
提取
带有跟踪更改的插入
文本
python-3.x
、
ms-word
、
python-docx
我想从在“修订”模式下编辑的word文档中
提取
文本
。我想
提取
插入的
文本
并
忽略删除的
文本
。运行下面的代码,我看到以"track changes“模式插入的段落返回一个空的Paragraph.text print(par
浏览 2
提问于2016-07-07
得票数 2
回答已采纳
2
回答
如何连接
python
中
的
docx
文件?
python
、
arrays
、
pandas
、
database
、
docx
if t.endswith('.
docx
'): v_doc.append(Document(t)) # <-----how
docx
包含:#
docx
包含虚拟
文本
!#
docx
1 contains:data1data3 data6data8 我想将
docx
文件的内容保存
浏览 2
提问于2021-07-10
得票数 0
回答已采纳
5
回答
使用
python
从
MS word
docx
文件
中
逐页
提取
文本
python
、
python-3.x
、
document
、
extraction
、
text-extraction
我有一个MS文件,我需要从其中
提取
文本
分页。我尝试过
python
,但它可以
提取
整个
文本
,但不能
提取
页面。我还将
docx
转换为pdf,然后尝试
文本
提取
。问题是,在转换之后,
docx
的页面结构发生了变化。例如,在转换时,字体大小被更改,而
docx
的一页
中
的
文本
内容在pdf
中
占用了多个页面。 我正在寻找一个稳定的解决方案,可以
从
<em
浏览 9
提问于2019-12-18
得票数 4
回答已采纳
2
回答
解压缩到同一个目录,
从
使用Pandoc转换的不同.
docx
文件中
提取
媒体
linux
、
bash
、
shell
、
pandoc
目标fileA.
docx</em
浏览 2
提问于2020-03-17
得票数 2
1
回答
如何通过
docx
库或xml在表格
中
包装
单元格
文本
?
python
、
xml
、
docx
、
python-docx
我一直在使用
python
docx
库和oxml自动对word文档
中
的表格进行一些更改。不幸的是,无论我做什么,我都不能在表
单元格
中
换行。我成功地操作了表格的“autofit”和“fit- text”属性,但它们都没有对
单元格
中
的
文本
进行换行。我相信它要为我的表格
中
的“包装”这个词负责。 例如,在本例
中
,我添加了一个表。我可以在
单元格
中
调整
文本
大小,并将自动调整大小
浏览 10
提问于2019-07-26
得票数 2
回答已采纳
1
回答
为什么
python
返回带有
文本
的
单元格
时应该是空的?
python
、
docx
、
python-docx
我有一个文档转换
从
pdf与pdf2
docx
库。结果似乎不错,但是如果我用
python
加载
docx
文档,它会创建一个包含
文本
而不是空
单元格
的
单元格
的表。
单元格
中
充满来自特定
单元格
上方一行的
单元格
的
文本
。 该表包含三行。但是,如果在调试
中
可以看到空
单元格
包含如下
文本
值:
文本
Basis
浏览 3
提问于2021-10-04
得票数 0
回答已采纳
2
回答
如何在
python
或R中将.
docx
文件
中
的表转换为.xlsx或csv文件?
r
在表格上方有一些
文本
,然后是一个表格。如何
从
R或
python
中
的
docx
文件中
提取
表格,然后将其转换为csv文件或xlsx文件。我甚至不介意.txt文件保留表的确切格式。
浏览 1
提问于2016-03-18
得票数 2
点击加载更多
相关
资讯
黑科技教程,Python批量提取并保存docx文档中的图片!
使用python-docx模块读写word文件
掌握这6种方法,Python提取Word图片轻轻松松,手拿把掐!
Python 批量调整 Word 样式
Python:读取两种Word文件简述及文件未能引发事件错误
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
语音识别
活动推荐
运营活动
广告
关闭
领券