首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何使用Python漂亮汤将yelp评论和星级收集到CSV中

使用Python漂亮汤(BeautifulSoup)将yelp评论和星级收集到CSV中可以通过以下步骤实现:

  1. 导入所需的库:
代码语言:txt
复制
from bs4 import BeautifulSoup
import requests
import csv
  1. 定义目标URL和请求头信息:
代码语言:txt
复制
url = "https://www.yelp.com"
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0;Win64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82 Safari/537.36"
}
  1. 发送请求并获取HTML页面内容:
代码语言:txt
复制
response = requests.get(url, headers=headers)
html_content = response.text
  1. 使用BeautifulSoup解析HTML内容:
代码语言:txt
复制
soup = BeautifulSoup(html_content, "html.parser")
  1. 定位评论和星级的元素,并提取数据:
代码语言:txt
复制
reviews = soup.find_all("div", class_="review")
data = []

for review in reviews:
    comment = review.find("span", class_="lemon--span__373c0__3997G raw__373c0__3rcx7").text.strip()
    rating = review.find("div", class_="i-stars__373c0__1T6rz").get("aria-label")
    data.append([comment, rating])
  1. 将数据写入CSV文件:
代码语言:txt
复制
with open("yelp_reviews.csv", "w", newline="", encoding="utf-8") as file:
    writer = csv.writer(file)
    writer.writerow(["Comment", "Rating"])
    writer.writerows(data)

以上代码将评论和星级分别存储在CommentRating两列中,并将数据写入名为yelp_reviews.csv的CSV文件中。

注意:以上代码中的示例使用了第三方库BeautifulSoup进行HTML解析,可以通过pip install beautifulsoup4安装。此外,代码中的请求头信息User-Agent是为了模拟浏览器请求,具体可根据需要进行修改。

推荐的腾讯云相关产品:腾讯云服务器(CVM)和腾讯云对象存储(COS)。

  • 腾讯云服务器(CVM):提供高性能、可扩展的云服务器实例,适用于各类应用场景和业务需求。详细信息请参考:腾讯云服务器产品页
  • 腾讯云对象存储(COS):提供高可用、高可靠的对象存储服务,适用于海量文件存储和数据备份。详细信息请参考:腾讯云对象存储产品页

请注意,以上仅为推荐产品,并非对云计算品牌商的广告,也可根据实际需求选择其他云计算品牌商的相应产品。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

领券