这不是重复的,尽管这个问题已经在2011年的Getting a hyperlink URL from an Excel document,2013年的Extracting Hyperlinks From Excel (.xlsx) with Python和2014年的Getting the URL from Excel Sheet Hyper links in Python with xlrd的这个论坛上提出了;仍然没有答案。在深入研究了xlrd模块之后,似乎Data_sheet.hyperlink_map.get((row,col))项出错了,因为"xlrd不能在没有formatting_info的情况下读取超链接,这在Extracting Hyperlinks From Excel (.xlsx) with Python的per @alecxe上是不支持xlsx的。问:有人在从存储在excel文件中的超链接中提取URL方面取得了进展吗?比方说,在所有客户数据中,有一列超链接。我正在考虑将excel表格作为html页面转储,然后按照通常的抓取(本地驱动器上的文件)继续进行。但这不是生产解决方案。补充:是否有其他模块可以从超链接单元上的.cell(row,col).value()调用中提取url。mechanize有解决方案吗?非常感谢。
发布于 2016-04-01 01:10:35
我在尝试从xlsx文件的单元格中获取超链接时也遇到了同样的问题。我想出的解决办法就是简单地将Excel表格转换成xls格式,这样我就可以毫不费力地获得超链接,一旦完成编辑,我就将其格式化为原始的xlsx文件。
我不知道这是否适用于您的特定需求,或者格式的更改是否意味着一些我不知道的连续性,但我认为值得一试。
发布于 2021-09-17 16:02:00
我可以通过openpyxl阅读和使用超链接来复制文件。它有一个获取链接值的cell_obj.hyperlink和cell_obj.hyperlink.target。我制作了一个具有超链接的单元格行col值的列表,然后将它们附加到一个列表中,然后循环遍历列表以移动链接的文件。
https://stackoverflow.com/questions/33149929
复制相似问题