Python BeautifulSoup 'NavigableString‘对象没有属性'get_text’ - 腾讯云开发者社区

文章/答案/技术大牛

发布

04.BeautifulSoup使用

''' BeautifulSoup 有四大节点对象： 1、BeautifulSoup：解析网页获得的对象。...对于 Tag，它有两个重要的属性，是name 和 attrs. ①创建BeautifulSoup对象： soup = BeautifulSoup(html_str) #将html文件转换成可操作对象...属性 get_text()方法:返回的是列表。...并且若标签内部没有文本 string 属性返回的是None ,而text属性不会返回None 3、Comment 的使用: 介绍:在网页中的注释以及特殊字符串。...Comment 对象是一个特殊类型的 NavigableString 对象，其输出的内容不包括注释符号。 html_str="""<!

2.8K3 0

五.网络爬虫之BeautifulSoup基础语法万字详解

1.BeautifulSoup对象 BeautifulSoup将复杂的HTML文档转换成一个树形结构，每个节点都是Python对象，BeautifulSoup官方文档将所有的对象归纳为以下四种： Tag...print(type(tag.string)) #BeautifulSoup.NavigableString'> 注意，旧版本Python2需要通过unicode()方法可以直接将NavigableString...NavigableString对象支持遍历文档树和搜索文档树中定义的大部分属性，而字符串不能包含其它内容（tag对象却能够包含字符串或是其它tag），字符串不支持“.contents”或“.string...官方文档提醒：在旧版本Python2中，如果想在BeautifulSoup之外使用NavigableString对象，需要调用unicode()方法，将该对象转换成普通的Unicode字符串，否则就算BeautifulSoup...所以它没有name和attribute属性。

2.4K1 0

您找到你想要的搜索结果了吗？

是的

没有找到

五.网络爬虫之BeautifulSoup基础语法万字详解

1.BeautifulSoup对象 BeautifulSoup将复杂的HTML文档转换成一个树形结构，每个节点都是Python对象，BeautifulSoup官方文档将所有的对象归纳为以下四种： Tag...print(type(tag.string)) #BeautifulSoup.NavigableString'> 注意，旧版本Python2需要通过unicode()方法可以直接将NavigableString...NavigableString对象支持遍历文档树和搜索文档树中定义的大部分属性，而字符串不能包含其它内容（tag对象却能够包含字符串或是其它tag），字符串不支持“.contents”或“.string...提醒：在旧版本Python2中，如果想在BeautifulSoup之外使用NavigableString对象，需要调用unicode()方法，将该对象转换成普通的Unicode字符串，否则就算BeautifulSoup...所以它没有name和attribute属性。

3.1K0 1

数据获取：网页解析之BeautifulSoup

解析器使用方式优点缺点 Python标准库 BeautifulSoup(html, "html.parser") Python的内置标准库、文档容错性较强执行速度适中 lxml解析器 BeautifulSoup...'> 现在就获得了一个BeautifulSoup的对象，Beautiful Soup其实是将HTML文档转换成一个复杂的树形结构，每个节点都是Python中的对象，所有对象可以归纳为 4 种:Tag、NavigableString...NavigableString 在上面两个属性中，并没法获取标签中的内容，那么NavigableString就是用来获取标签中文本内容的，用法也比较简单，直接使用string即可。...print(type(soup)) #代码结果： BeautifulSoup'> Comment Comment对象也是一个特殊的NavigableString，读取的内容是注释里面的内容...如果是去标签属性值，跟使用字典取值方式一样。如果是获取标签的文本，直接使用get_text()方法，可以获取到标签的文本内容。

1.1K3 0

BeautifulSoup4库

那么可以通过tag.string获取标签中的文字，底层继承了str对象，可以当作字符串来使用 from bs4.element import NavigableString 3....BeautifulSoup： BeautifulSoup 对象表示的是一个文档的全部内容.大部分时候,可以把它当作 Tag 对象，因为底层继承了Tag对象，它支持遍历文档树和搜索文档树中描述的大部分的方法.... from bs4 import BeautifulSoup 4.Comment： Tag , NavigableString , BeautifulSoup 几乎覆盖了html和xml中的所有内容,...但是还有一些特殊对象.容易让人担心的内容是文档的注释部分 Comment 对象是一个特殊类型的 NavigableString 对象，底层继承了NavigableString ； from bs4.element...get_text：获取某个标签下的子孙非标签字符串，以普通字符串形式返回 from bs4 import BeautifulSoup html = """ The

1.5K1 0

BeautifulSoup使用

安装 pip install beautifulsoup4 解析库解析库使用方法优势劣势 Python标准库 BeautifulSoup(mk, ‘html.parser’) python的内置标准库...、执行速度适中、文档容错能力强 Python2.7 or 3.2.2前的版本中文容错能力差 lxml的HTML解析器 BeautifulSoup(mk, ‘lxml’) 速度快、文档容错能力强需要安装...Python对象,所有对象可以归纳为4种: Tag , NavigableString , BeautifulSoup , Comment ....一个Tag可能包含多个字符串或其它的Tag,这些都是这个Tag的子节点.Beautiful Soup提供了许多操作和遍历子节点的属性.注意: Beautiful Soup中字符串节点不支持这些属性,因为字符串没有子节点...soup.name # [document] print soup.attrs #{} 空字典 Comment Comment 对象是一个特殊类型的 NavigableString 对象，其实输出的内容仍然不包括注释符号

1.4K3 0

python爬虫（三）数据解析，使用bs4工具

目录 1 BeautifulSoup4介绍 2 安装和文档： 3 简单使用： 4 四个常用的对象： 4.1 Tag： 4.2 NavigableString： 4.3 Comment： 5 遍历文档树...BeautifulSoup 用来解析 HTML 比较简单，API非常人性化，支持CSS选择器、Python标准库中的HTML解析器，也支持 lxml 的 XML解析器。...)) 4 四个常用的对象： Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: Tag NavigatableString BeautifulSoup...'>thon 4.3 Comment： Tag , NavigableString , BeautifulSoup 几乎覆盖了html和xml中的所有内容,但是还有一些特殊对象.容易让人担心的内容是文档的注释部分...soup = BeautifulSoup(html, 'lxml') print type(soup.select('title')) print soup.select('title')[0].get_text

1.2K1 0

深入解析网页结构解析模块beautifulsoup

大家好，我是Python进阶者，今天给大家分享一个网页结构解析模块beautifulsoup。...，中间没有其他元素 soup.select('input[name]') 所有名为，并有一个 name 属性，其值无所谓的元素 soup.select('input[type="button..."]') 所有名为,并有一个 type 属性，其值为 button 的元素 soup.select('a')[0].get_text() # 获取首个a元素的文本 soup.select...tag(标签) navigablestring(标签内字符串) beautifulsoup(对象) comment(备注) rep=requests.get('https://book.qidian.com...对象 tr=soup.div print(type(tr),tr) #tag对象标签 print(tr.get_attribute_list('class')) #获取属性对应列表 print

2.9K3 0

Beautiful Soup (一）

的名字是'p',格式：.name 3、Attributes——标签的属性，字典形式组织，格式：.attrs 4、NavigableString——标签内非属性字符串，.....7、soup.li.string #获得a标签内非属性字符串（NavigableString ）注意： soup = BeautifulSoup(data,'lxml') t = soup.li.string...3）根据关键字参数来搜索 print(soup.find_all(class_='cao')) 注：因为class是python关键字，所以关键字参数时需要加多一个下划线来进行区别 ?...img下的id值为width的标签上面三者可以混合使用，如ul .title #width 6）.get_text()方法和前面的.string属性有点不一样哈，这里的他会获取该标签的所有文本内容，不管有没有子标签...注：.string会把注释也打印出来，若标签没有内容，只有子标签有，就返回None； .get_text()不打印注释，会把标签本身和子标签内容都打印出来； 7）还可以用标签选择器来进行筛选元素, 返回的都是一个列表

8303 0

CSS 选择器：BeautifulSoup4解析器

BeautifulSoup 用来解析 HTML 比较简单，API非常人性化，支持CSS选择器、Python标准库中的HTML解析器，也支持 lxml 的 XML解析器。... """ #创建 Beautiful Soup 对象 soup = BeautifulSoup(html) #打开本地 HTML 文件的方式来创建对象 #soup = BeautifulSoup...四大对象种类 Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: Tag NavigableString BeautifulSoup...BeautifulSoup BeautifulSoup 对象表示的是一个文档的内容。...Comment Comment 对象是一个特殊类型的 NavigableString 对象，其输出的内容不包括注释符号。

8072 0

Python爬虫技术系列-02HTML解析-BS4

库的内置对象： Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构，每个节点都是Python对象，对象可以归纳为BeautifulSoup ,Tag , NavigableString...BeautifulSoup 对象为一个文档的全部内容，可以认为BeautifulSoup 对象是一个大的Tag对象。 Tag对象与XML或HTML原生文档中的tag相同。...NavigableString对象html文档中的文本，即Tag中的字符串用NavigableString对象包装。...Commern对象是一种特殊的NavigableString对象，用来包装文档中注释和特殊字符串。...span标签 print(soup.div.p.span) #获取p标签内容，使用NavigableString类中的string、text、get_text() print(soup.div.p.text

10.1K2 0

Python BS4解析库用法详解

BS4解析对象创建 BS4 解析对象是万事开头的第一步，这非常地简单，语法格式如下所示： #导入解析包 from bs4 import BeautifulSoup #创建beautifulsoup解析对象...对象，这些对象大致分为四类：Tag , NavigableString , BeautifulSoup , Comment 。...其中使用最多的是 Tag 和 NavigableString。 • Tag：标签类，HTML 文档中所有的标签都可以看做 Tag 对象。...• BeautifulSoup：表示一个 HTML 文档的全部内容，您可以把它当作一个人特殊的 Tag 对象。...类中的string、text、get_text() print(soup.p.text) #返回一个字典，里面是多有属性和值 print(soup.p.attrs) #查看返回的数据类型 print(type

1.1K4 0

技术学习：Python（18）｜爬虫篇｜解析器BeautifulSoup4（一）

Python2版本的代码,在Python3环境下安装时,会自动转换成Python3的代码,如果没有一个安装的过程,那么代码就不会被转换。...Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构，每个节点都是Python对象，所有对象可以归纳为4种：Tag，NavigableString，BeautifulSoup，Comment...通过 unicode() 方法可以直接将 NavigableString 对象转换成Unicode字符串： NavigableString 对象支持遍历文档树和搜索文档树中定义的大部分属性，并非全部...因为 BeautifulSoup 对象并不是真正的HTML或XML的tag，所以它没有name和attribute属性。...但有时查看它的 .name 属性是很方便的，所以 BeautifulSoup 对象包含了一个值为 “[document]” 的特殊属性 .name。

7732 0

爬虫 | Python爬取网页数据

本文利用Python3和BeautifulSoup爬取网页中的天气预测数据，然后使用 pandas 分析。...Dcotype 对象包含文档类型信息，NavigableString 呈现的是包含文档中的文本，Tag对象包含其它嵌套标签。最重要且经常用到的对象是 Tag 对象。...Tag 对象在HTML文档中起到导航作用，可以用来获取标签和文本。更多BeautifulSoup 对象看这里 [注2]。...通过 soup.children 获取 html 标签信息： html = list(soup.children)[2] children 属性返回的每一项都是 BeautifulSoup 对象，因此可以直接调用...将 BeautifulSoup 对象视作字典，传递需要的属性作为键： img = tonight.find("img") desc = img['title'] print(desc) Tonight

5.2K1 0

一文入门BeautifulSoup

四大对象种类 BS将HTML文档解析成一个复杂的树形结构，每个节点都可以看做是Python对象，所有对象可以归纳为4种： Tag NavigableString BeautifulSoup Comment...的tag,所以它没有name和attribute属性。...但有时查看它的 .name 属性是很方便的,所以 BeautifulSoup 对象包含了一个值为 “[document]” 的特殊属性 .name ?...Comment (注释) Tag , NavigableString , BeautifulSoup 几乎覆盖了html和xml中的所有内容,但是还有一些特殊对象.容易让人担心的内容是文档的注释部分....Comment 对象是一个特殊类型的 NavigableString 对象，其实输出的内容仍然不包括注释符号，看下面的例子： ?

4.5K0 0

Python：bs4的使用

每个节点都是Python对象，所有对象可以归纳为4种：tag，NavigableString，BeautifulSoup，Comment。...但是 BeautifulSoup 对象并不是真正的 HTM L或 XML 的 tag，它没有attribute属性，name 属性是一个值为“[document]”的特殊属性。...如果节点当中有换行符，会被当做是 NavigableString 类型节点而作为一个子节点。　　NavigableString 类型节点没有 contents 属性，因为没有子节点。...　　parent 属性返回某个元素（tag、NavigableString）的父节点，文档的顶层节点的父节点是 BeautifulSoup 对象，BeautifulSoup 对象的父节点是 None。...next_element 属性指向解析过程中下一个被解析的对象（tag 或 NavigableString）。　　previous_element 属性指向解析过程中前一个被解析的对象。

2.9K1 0

一文入门Beautiful Soup4

很简单：通过.string方法即可 [007S8ZIlly1ghchiehui0j31780bsdhr.jpg] BeautifulSoup(BS对象) BeautifulSoup 对象表示的是一个文档的全部内容....大部分时候,可以把它当作 Tag 对象因为 BeautifulSoup 对象并不是真正的HTML或XML的tag,所以它没有name和attribute属性。...但有时查看它的 .name 属性是很方便的,所以 BeautifulSoup 对象包含了一个值为 “document” 的特殊属性 .name [image-20200802151433110] Comment...(注释) Tag , NavigableString , BeautifulSoup 几乎覆盖了html和xml中的所有内容,但是还有一些特殊对象.容易让人担心的内容是文档的注释部分....Comment 对象是一个特殊类型的 NavigableString 对象，其实输出的内容仍然不包括注释符号，看下面的例子： [007S8ZIlly1ghchvnud5tj31ag0haq64.jpg]

1.4K2 1

「Python爬虫系列讲解」四、BeautifulSoup 技术

BeautifulSoup 3.1 BeautifulSoup 对象 3.1.1 Tag 3.1.2 NavigableString 3.1.3 BeautifulSoup 3.1.4 Comment...3 深入了解 BeautifulSoup 3.1 BeautifulSoup 对象 BeautifulSoup 将复杂的 HTML 文档个转换成一个树形结构，每个节点都是 Python 对象，BeautifulSoup...官方文档将所有对象总结为 4 种： Tag； NavigableString； BeautifulSoup； Comment。...一个 NavigableString 字符串与 Python 中的 Unicode 字符串相同，并且支持包含在遍历文档树和搜索文档树中的一些特性。...因为 BeautifulSoup 对象并不是真正的 HTML 和 XML 标签 Tag，所以它没有 name 和 attrs 属性。

2.3K2 0

BeautifulSoup文档2-详细方法 | 对象的种类有哪些？

Soup将HTML文档转换成一个树形结构,每个节点都是Python对象；所有对象为4种: Tag , NavigableString , BeautifulSoup , Comment . 2.2...css_soup.p['class']) 输出为： ['body', 'strikeout'] ['body'] 2.3 NavigableString对象用 NavigableString 类来包装...对象 BeautifulSoup 对象表示的是一个文档的全部内容；它支持遍历文档树和搜索文档树中描述的大部分的方法；包含了一个值为 “[document]” 的特殊属性： # BeautifulSoup...类 # [document]属性 print(soup.name) 输出为：[document] 2.5 Comment对象 Comment 对象是一个特殊类型的 NavigableString 对象；...]属性 print(soup.name) # Comment对象 markup = "<!

7283 0

用BeautifulSoup来煲美味的汤

BeautifulSoup的对象种类 Beautiful Soup实质是将复杂的HTML文档转换成一个复杂的树形结构（因为HTML本身就是DOM）,然后每个节点都是Python对象,通过分析可以把所有对象分成...例如： soup.name >>> '[document]' 但实际上BeautifulSoup对象不是一个真正的tag，前面说了，tag有2个重要的属性name和attributes，它是没有的。...但是却可以查看它的name属性，如上面采用soup.name方式获取的“[document]”，我们可以理解为“[document]”是BeautifulSoup对象的特殊属性名字。...4、 Comment就是注释，它是一个特殊类型的NavigableString对象，为什么这么说呢，因为我们可以直接采用类似于NavigableString对象获取字符串的方式来获取注释文本...节点内容前面说过对于NavigableString对象，我们可以采用 .string 来获取文本信息。

2.3K3 0

点击加载更多

04.BeautifulSoup使用

五.网络爬虫之BeautifulSoup基础语法万字详解

五.网络爬虫之BeautifulSoup基础语法万字详解

数据获取：网页解析之BeautifulSoup

BeautifulSoup4库

BeautifulSoup使用

python爬虫（三）数据解析，使用bs4工具

深入解析网页结构解析模块beautifulsoup

Beautiful Soup (一）

CSS 选择器：BeautifulSoup4解析器

Python爬虫技术系列-02HTML解析-BS4

Python BS4解析库用法详解

技术学习：Python（18）｜爬虫篇｜解析器BeautifulSoup4（一）

爬虫 | Python爬取网页数据

一文入门BeautifulSoup

Python：bs4的使用

一文入门Beautiful Soup4

「Python爬虫系列讲解」四、BeautifulSoup 技术

BeautifulSoup文档2-详细方法 | 对象的种类有哪些？

用BeautifulSoup来煲美味的汤

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐