首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

python爬虫必要基础(-)

python可以去网上看教程安装或者去(哔哩哔哩:浅若红尘)查看教程

这个教程选一下自己需要学习的就行,多打代码、多打代码、多打代码

前期不要用一些自动生成代码的插件先,先跟着pycharm里面自带的提示打着代码,先熟悉一下。

教程用到的软件都在下面链接

https://wwpd.lanzn.com/b00l1dv2wh密码:87oa

一.变量

理解Python变量,可以将它想象成一个标签或是一个便签纸,你用这个标签来标记某个值。就像你在日常生活中可能会给不同的物品贴上标签一样,比如给一本书贴上“小说”的标签,给另一个物品贴上“文具”的标签。在编程中,我们使用变量来“标记”数据,这样就可以方便地引用和操作这些数据了。

1. 变量的定义

什么是变量? 变量是用来存储信息的标识符(名字)。你可以把任何类型的数据(如数字、字符串等)存放在一个变量里。

如何创建变量? 在Python中创建变量非常简单,只需要指定一个名称并赋值即可。例如:

age = 20name = "张三"

2. 变量的作用

存储数据:允许程序记住一些信息。

复用性:一旦设置了变量,就可以在代码中的多个地方使用它而不需要重复输入同样的值。

提高可读性:通过给变量起有意义的名字,可以让代码更容易被理解和维护。

3. 变量命名规则

必须以字母或下划线开头。

除了第一个字符外,其余部分可以是字母、数字或下划线。

区分大小写(myVar 和 myvar 是两个不同的变量)。

不建议使用Python的关键字作为变量名(如if, else, for等)。

4. 示例

假设你想记录一个人的基本信息:

# 定义几个变量person_name = "李四" # 字符串person_age = 30 # 整数is_student = False # 布尔值# 打印出这些信息print("姓名:", person_name)print("年龄:", person_age)print("是否为学生:", is_student)

这段代码定义了三个变量分别用来保存姓名、年龄以及是否是学生的状态,并打印出来。

二:算术运算符

以下假设变量: a=10,b=20:

以下实例演示了Python所有算术运算符的操作:

a = 21b = 10c = 0 c = a + bprint("a+b:",c) c = a - bprint("a-b:",c) c = a * bprint("a*b:",c) c = a / bprint("a/b:",c) c = a % bprint("a%b:",c) # 修改变量 a 、b 、ca = 2b = 3c = a**b print("a**b:",c) a = 10b = 5c = a//b print("a//b:",c)

输出结果

a+b: 31a-b: 11a*b: 210a/b: 2.1a%b: 1a**b: 8a//b: 2

三:比较运算符

以下假设变量a为10,变量b为20:

a=10b=20if a==b: print("a=b")else: print("a不等于b")

四:赋值运算符

五:逻辑运算符

Python语言支持逻辑运算符,以下假设变量 a 为 10, b为 20:

and

两个条件都要都满足就为True,否则为False

a=10b=20c=20if a<b and b==c: print("两个条件都满足")else: print("条件不满足")#输出:两个条件都满足

or

其中一个条件满足就为True,否则为False

a=10b=20c=20if a<b or b<c: print("其中一个条件满足")else: print("两个条件不满足")#输出:其中一个条件满足

not

此为反义,用上这个就是意思相反

a=Trueprint(not a)#输出 False

六:成员运算符

除了以上的一些运算符之外,Python还支持成员运算符,测试实例中包含了一系列的成员,包括字符串,列表或元组。

以下实例演示了Python所有成员运算符的操作:

#!/usr/bin/python# -*- coding: UTF-8 -*-a = 10b = 20list = [1, 2, 3, 4, 5];if (a in list): print("1 - 变量 a 在给定的列表中 list 中")else: print("1 - 变量 a 不在给定的列表中 list 中")if (b not in list): print("2 - 变量 b 不在给定的列表中 list 中")else: print("2 - 变量 b 在给定的列表中 list 中")# 修改变量 a 的值a = 2if (a in list): print("3 - 变量 a 在给定的列表中 list 中")else: print("3 - 变量 a 不在给定的列表中 list 中")

输出结果

1 - 变量 a 不在给定的列表中 list 中2 - 变量 b 不在给定的列表中 list 中3 - 变量 a 在给定的列表中 list 中

七:身份运算符

身份运算符用于比较两个对象的存储单元

注: id() 函数用于获取对象内存地址。

以下实例演示了Python所有身份运算符的操作:

#!/usr/bin/python# -*- coding: UTF-8 -*-a = 20b = 20if (a is b): print("1 - a 和 b 有相同的标识")else: print("1 - a 和 b 没有相同的标识")if (a is not b): print("2 - a 和 b 没有相同的标识")else: print("2 - a 和 b 有相同的标识")# 修改变量 b 的值b = 30if (a is b): print("3 - a 和 b 有相同的标识")else: print("3 - a 和 b 没有相同的标识")if (a is not b): print("4 - a 和 b 没有相同的标识")else: print("4 - a 和 b 有相同的标识")

输出结果:

1 - a 和 b 有相同的标识2 - a 和 b 有相同的标识3 - a 和 b 没有相同的标识4 - a 和 b 没有相同的标识

八:运算符优先级

以下表格列出了从最高到最低优先级的所有运算符:

九:条件语句

Python条件语句是通过一条或多条语句的执行结果(True或者False)来决定执行的代码块。

可以通过下图来简单了解条件语句的执行过程:

Python程序语言指定任何非0和非空(null)值为true,0 或者 null为false。

Python 编程中 if 语句用于控制程序的执行,基本形式为:

if 判断条件: 执行语句……else: 执行语句……

例子:

name = 'luren'if name == 'python': # 判断变量是否为 python print 'welcome boss' # 并输出欢迎信息else: print name # 条件不成立时输出变量名称

多重判断:

a=90 #比如a是不确定数值if a>100: print("a>100")elif a<100 and a>70: print("a<100且a>70")else: print("a小于或等于70")#输出:a<100且a>70

十:循环判断语句

Python 提供了 for 循环和 while 循环(在 Python 中没有 do..while 循环):

while

while 条件

while在满足条件的情况下会一直运行下去,不满足则会退出

a=0while a<10: print(a) a=a+1

结果

0123456789

死循环(只要电脑和程序没挂会一直运行下去)

i=0while True: print(i) i=i+1

for

例子1:

range(1,10),左闭又开,数学中理解为[1,10)

for i in range(1,10): print(i)

输出:

123456789

例子二:

lists=["我爱你",1,3,1,4]for i in lists: print(i)

输出:

我爱你1314

嵌套循环:

for和while进行嵌套

a=0b=0while a<10: a=a+1 for i in range(1,101): b=b+iprint(f"a={a}")print(f"b={b}")

运行结果

a=10b=50500

循环控制语句

循环控制语句可以更改语句执行的顺序。Python支持以下循环控制语句:

break

下面实例让死循环退出

a=0while True: a=a+1 print(a) if a>5: break

运行结果:

123456

continue

a=["apple","love","good","nice"]for i in a: if i=="love": print(f"i为love跳过处理") continue print(i)

运行结果

applelove为love跳过处理goodnice

十一:列表

列表和元组,我们在爬虫的时候用得比较多,需要多了解一下

序列中的每个元素都分配一个数字 - 它的位置,或索引,第一个索引是0,第二个索引是1,依此类推。

list1 = ['physics', 'chemistry', 1997, 2000]list2 = [1, 2, 3, 4, 5 ]list3 = ["a", "b", "c", "d"]

访问列表中的值

list1 = ['physics', 'chemistry', 1997, 2000]print(list1[0])print(list1[-1])# 通过for循环获取里面所有的值for i in list1: print(f"for获取值{i}") # 处理逻辑

运行结果

physics2000for获取值physicsfor获取值chemistryfor获取值1997for获取值2000

获取指定元素索引

list1 = ['physics', 'chemistry', 1997, 2000]print(list1.index(2000)) #获取元素2000的索引位置#运行结果:3

删除列表元素

list1 = ['physics', 'chemistry', 1997, 2000]del list1[2] #通过索引删除列表中第三个值print(list1)#运行结果:['physics', 'chemistry', 2000]

或者通过元素进行移除

list1 = ['physics', 'chemistry', 1997, 2000]list1.remove("physics")print(list1)#运行结果:['chemistry', 1997, 2000]

通过for循环删除列表中指定的一个元素

list1 = ['physics', 'chemistry', 1997, 2000] #list1是个不确定列表# 判断元素存在列表中if "physics" in list1: del list1[list1.index("physics")] #list1.remove("physics")效果一样 print(list1)#运行结果:['chemistry', 1997, 2000]

添加元素

list1 = ['physics', 'chemistry', 1997, 2000]list1.append("good")print(list1)#运行结果:['physics', 'chemistry', 1997, 2000, 'good']

列表函数&方法

Python包含以下函数:

Python包含以下方法:

十二:字典

字典是一种非常常用的数据结构,用于存储键值对

#空字典list={}# 带有初始值的字典my_dict = {'name': 'Alice', 'age': 25, 'city': 'New York'}

获取值

my_dict = {'name': 'Alice', 'age': 25, 'city': 'New York'}print(my_dict["name"])#输出 Alice

修改值

my_dict = {'name': 'Alice', 'age': 25, 'city': 'New York'}my_dict['name']="李白"print(my_dict)#输出 {'name': '李白', 'age': 25, 'city': 'New York'}

删除某个键

不显示中文、不易查看

运行结果:

{ "name": "李白", "age": 25, "city": "New York"}

字典内置函数&方法

Python字典包含了以下内置函数:

Python字典包含了以下内置方法:

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OmmeGGrwFMMOP7HGHwJr70Mg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券