前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >股票交易数据采集+数据可视化(Python爬取某网站股票数据,附代全部代码)

股票交易数据采集+数据可视化(Python爬取某网站股票数据,附代全部代码)

作者头像
松鼠爱吃饼干
发布2021-12-04 16:14:38
发布2021-12-04 16:14:38
4.3K10
代码可运行
举报
文章被收录于专栏:Python分享Python分享
运行总次数:0
代码可运行

前言

我国股票投资者数量为15975.24万户, 如此多的股民热衷于炒股,首先抛开炒股技术不说, 那么多股票数据是不是非常难找,找到之后是不是看着密密麻麻的数据是不是头都大了?

今天带大家爬取雪球平台的股票数据

开发环境

  • 解释器版本: python 3.8
  • 代码编辑器: pycharm 2021.2

第三方模块

  • requests: pip install requests
  • csv

爬虫案例的步骤:

1.确定url地址(链接地址) 2.发送网络请求 3.数据解析(筛选数据) 4.数据的保存(数据库(mysql\mongodb\redis), 本地文件)

爬虫程序全部代码

分析网页

打开开发者工具,搜索关键字,找到正确url

导入模块

代码语言:javascript
代码运行次数:0
复制
import requests     # 发送网络请求
import csv

请求数据

代码语言:javascript
代码运行次数:0
复制
url = f'https://xueqiu.com/service/v5/stock/screener/quote/list?page=1&size=30&order=desc&order_by=amount&exchange=CN&market=CN&type=sha&_=1637908787379'
# 伪装
headers = {
    # 浏览器伪装
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36'
}
response = requests.get(url, headers=headers)
json_data = response.json()

解析数据

代码语言:javascript
代码运行次数:0
复制
data_list = json_data['data']['list']
for data in data_list:
    data1 = data['symbol']
    data2 = data['name']
    data3 = data['current']
    data4 = data['chg']
    data5 = data['percent']
    data6 = data['current_year_percent']
    data7 = data['volume']
    data8 = data['amount']
    data9 = data['turnover_rate']
    data10 = data['pe_ttm']
    data11 = data['dividend_yield']
    data12 = data['market_capital']
    print(data1, data2, data3, data4, data5, data6, data7, data8, data9, data10, data11, data12)
    data_dict = {
        '股票代码': data1,
        '股票名称': data2,
        '当前价': data3,
        '涨跌额': data4,
        '涨跌幅': data5,
        '年初至今': data6,
        '成交量': data7,
        '成交额': data8,
        '换手率': data9,
        '市盈率(TTM)': data10,
        '股息率': data11,
        '市值': data12,
    }
    csv_write.writerow(data_dict)

翻页

对比1、2、3页数据url,找到规律

代码语言:javascript
代码运行次数:0
复制
for page in range(1, 56):
    url = f'https://xueqiu.com/service/v5/stock/screener/quote/list?page={page}&size=30&order=desc&order_by=amount&exchange=CN&market=CN&type=sha&_=1637908787379'

保存数据

代码语言:javascript
代码运行次数:0
复制
file = open('data2.csv', mode='a', encoding='utf-8', newline='')
csv_write = csv.DictWriter(file, fieldnames=['股票代码','股票名称','当前价','涨跌额','涨跌幅','年初至今','成交量','成交额','换手率','市盈率(TTM)','股息率','市值'])
csv_write.writeheader()
file.close()

运行代码,实现效果

数据可视化全部代码

导入数据

代码语言:javascript
代码运行次数:0
复制
import pandas as pd
from pyecharts import options as opts
from pyecharts.charts import Bar

读取数据

代码语言:javascript
代码运行次数:0
复制
data_df = pd.read_csv('data2.csv')
df = data_df.dropna()
df1 = df[['股票名称', '成交量']]
df2 = df1.iloc[:20]
print(df2['股票名称'].values)
print(df2['成交量'].values)

可视化图表

代码语言:javascript
代码运行次数:0
复制
c = (
    Bar()
        .add_xaxis(list(df2['股票名称']))
        .add_yaxis("股票成交量情况", list(df2['成交量']))
        .set_global_opts(
        title_opts=opts.TitleOpts(title="成交量图表 - Volume chart"),
        datazoom_opts=opts.DataZoomOpts(),
    )
        .render("data.html")
)

print('数据可视化结果完成,请在当前目录下查找打开 data.html 文件!')

运行代码,效果展示

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-12-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 松鼠爱吃饼干 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • 开发环境
  • 第三方模块
  • 爬虫案例的步骤:
  • 爬虫程序全部代码
    • 分析网页
    • 导入模块
    • 请求数据
    • 解析数据
    • 翻页
    • 保存数据
    • 运行代码,实现效果
  • 数据可视化全部代码
    • 导入数据
    • 读取数据
    • 可视化图表
    • 运行代码,效果展示
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档