前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >获取有趣的句子,python教你如何快速收归数据库

获取有趣的句子,python教你如何快速收归数据库

作者头像
大家一起学编程
发布2021-10-12 11:01:36
6070
发布2021-10-12 11:01:36
举报

你可曾看见过这样的句子:

“我爱的人也爱着我,对我来说这简直是个奇迹。”

又或者是:

“生活中若没有朋友,就像生活中没有阳光一样。”

再或者这样:

“我会抓着你,拉着你,救你,我不会放手,但是你要让我拉着你,知道吗?”

是一些非常有意思的句子,那如何来获取这些句子,并为自己所用呢!

第一、分析字段

首先我们要分析我们需要获取的网站,然后找到我们需要的字段,这里,我们提供两个网站供学习。

代码语言:javascript
复制
https://api.fghrsh.net/hitokoto/rand/?encode=jsc&uid=3335
代码语言:javascript
复制
https://v1.hitokoto.cn/

然后我们来分析一下我们需要的字段。

看上面的json,我们需要获取的字段分别是,hitokoto,source,author,id

类似的,当我们去分析第二个网站时也是同样的操作。

第二、建立数据库表

我们能获取到字段数据之后,我们需要分析我们的表如何显示,如何储存的问题。

因此我们先创建数据库。防止出现表情,我们采用utf8mb4

代码语言:javascript
复制
'''创建数据库'''
CREATE DATABASE `csdn_article` CHARACTER SET 'utf8mb4';

接着,我们来创建数据表:

代码语言:javascript
复制
'''创建数据表'''
CREATE TABLE `linking_blink`  (
  `id` int unsigned NOT NULL,
  `linking_id` varchar(100) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL COMMENT 'id',
  `text` text CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL COMMENT '内容',
  `auther` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL COMMENT '作者',
  `source` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL COMMENT '来源',
  `from` varchar(50) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL COMMENT '渠道',
  `passed` int(0) NULL DEFAULT NULL COMMENT '0,否,1,是   是否发送',
  `insert_time` datetime(0) NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP(0),
  PRIMARY KEY (`id`) USING BTREE
) ENGINE = InnoDB AUTO_INCREMENT = 0 CHARACTER SET = utf8mb4 COLLATE = utf8mb4_0900_ai_ci ROW_FORMAT = Dynamic;

第三、插入数据库方法

我们已经建立好表了,我们接下来需要创建插入数据的方案,方便我们插入,查询数据时调用。

代码语言:javascript
复制
#建立链接池,为之后做准备,数据库需要改为自己的数据库。
POOL = PooledDB(
    creator=pymysql,  maxconnections=0,  mincached=3, maxcached=0,maxshared=3,
    blocking=True,  maxusage=None, setsession=[], ping=0,
    host='127.0.0.1',port=3306,user='root',password='root',database='csdn_article',charset='utf8mb4')

#插入数据
def insert_text(linking_id,text,auther,source,from_w):
    db = POOL.connection()
    conn = db.cursor()
    conn.execute("INSERT INTO `linking_blink`(`linking_id`, `text`, `auther`,`source`, `from`, `passed`) VALUES ('%s', '%s', '%s', '%s','%s', 0);"%(linking_id,text,auther,source,from1))# 使用execute方法执行SQL语句
    data=db.commit()
    db.close()
    return data
#按照内容查询数据
def select_text(text,from_w):
    db = POOL.connection()
    conn = db.cursor()
    conn.execute("SELECT * FROM `linking_blink` WHERE `text` = '%s' AND `from` = '%s' LIMIT 0, 1;"%(text,from_w))# 使用execute方法执行SQL语句
    data = conn.fetchall()
    db.close()
    return data
#按照id查询数据
def select_linking_id(linking_id,from_w):
    db = POOL.connection()
    conn = db.cursor()
    conn.execute("SELECT * FROM `linking_blink` WHERE `linking_id` = '%s' AND `from` = '%s' LIMIT 0, 1;"%(linking_id,from_w))# 使用execute方法执行SQL语句
    data = conn.fetchall()
    db.close()
    return data

第四、获取网站数据

我们已经准备好数据库,插入了,那我们来获取网站数据并插入到数据库中。

代码语言:javascript
复制
headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.85 Safari/537.36'}
def fghrsh(from_w="fghrsh"):
    response=requests.get(url="https://api.fghrsh.net/hitokoto/rand/?encode=jsc&uid=3335",headers=headers)
    if select_linking_id(response.json()["id"],from_w)==():
        if response.json()["source"] == "":
            insert_text(response.json()["id"],response.json()["hitokoto"],response.json()["author"],response.json()["author"],from_w)
        else:
            insert_text(response.json()["id"],response.json()["hitokoto"],response.json()["author"],response.json()["source"],from_w)
def hitokoto(from_w="hitokoto"):
    response=requests.get(url="https://v1.hitokoto.cn/",headers=headers)
    if select_linking_id(response.json()["id"],from_w)==():
        insert_text(response.json()["id"],response.json()["hitokoto"],response.json()["from_who"],response.json()["from"],from_w)

圆满搞定,来看成果吧!成功插入到数据库中

第五、完整代码

代码语言:javascript
复制
import os,random
import json
import requests
import pymysql
from dbutils.pooled_db import PooledDB

#链接池
POOL = PooledDB(
    creator=pymysql,  maxconnections=0,  mincached=3, maxcached=0,maxshared=3,
    blocking=True,  maxusage=None, setsession=[], ping=0,
    host='127.0.0.1',port=3306,user='root',password='root',database='csdn_article',charset='utf8mb4')

def insert_text(linking_id,text,auther,source,from_w):
    db = POOL.connection()
    conn = db.cursor()# 使用cursor()方法获取操作游标
    conn.execute("INSERT INTO `linking_blink`(`linking_id`, `text`, `auther`,`source`, `from`, `passed`) VALUES ('%s', '%s', '%s', '%s','%s', 0);"%(linking_id,text,auther,source,from1))# 使用execute方法执行SQL语句
    data=db.commit()# 使用 fetchone() 方法获取一条数据
    db.close()
    return data

def select_text(text,from_w):
    db = POOL.connection()
    conn = db.cursor()# 使用cursor()方法获取操作游标
    conn.execute("SELECT * FROM `linking_blink` WHERE `text` = '%s' AND `from` = '%s' LIMIT 0, 1;"%(text,from_w))# 使用execute方法执行SQL语句
    data = conn.fetchall()# 使用 fetchone() 方法获取一条数据
    db.close()
    return data

def select_linking_id(linking_id,from_w):
    db = POOL.connection()
    conn = db.cursor()# 使用cursor()方法获取操作游标
    conn.execute("SELECT * FROM `linking_blink` WHERE `linking_id` = '%s' AND `from` = '%s' LIMIT 0, 1;"%(linking_id,from_w))# 使用execute方法执行SQL语句
    data = conn.fetchall()# 使用 fetchone() 方法获取一条数据
    db.close()
    return data
headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.85 Safari/537.36'}
def fghrsh(from_w="fghrsh"):
    response=requests.get(url="https://api.fghrsh.net/hitokoto/rand/?encode=jsc&uid=3335",headers=headers)
    if select_linking_id(response.json()["id"],from_w)==():
        if response.json()["source"] == "":
            insert_text(response.json()["id"],response.json()["hitokoto"],response.json()["author"],response.json()["author"],from_w)
        else:
            insert_text(response.json()["id"],response.json()["hitokoto"],response.json()["author"],response.json()["source"],from_w)
def hitokoto(from_w="hitokoto"):
    response=requests.get(url="https://v1.hitokoto.cn/",headers=headers)
    if select_linking_id(response.json()["id"],from_w)==():
        insert_text(response.json()["id"],response.json()["hitokoto"],response.json()["from_who"],response.json()["from"],from_w)
if __name__ == '__main__':
    for i in range(20):
        fghrsh()
        hitokoto()
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-09-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大家一起学编程 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档