首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Fake伪造数据集

Fake伪造数据集

作者头像
云深无际
发布于 2020-09-03 09:28:19
发布于 2020-09-03 09:28:19
97600
代码可运行
举报
文章被收录于专栏:云深之无迹云深之无迹
运行总次数:0
代码可运行
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import lipsum

print("generate 10 words")
print(lipsum.generate_words(10))

print("*" * 50)
print("generate 3 sentences")
for x in lipsum.generate_sentences(3).split('.'):
    print(x.strip())

print("*" * 50)
print("generate 3 paras")
for x in lipsum.generate_paragraphs(3).split('\n'):
    print(x)
    
    
    
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
https://github.com/joke2k/faker
gitbub 的地址

伪造的一份数据集

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
https://faker.readthedocs.io/en/master/locales.html

语言列表

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
https://readthedocs.org/

这个网站特别好用

这个有意思哦

喜欢Logo

实际上,faker库的设计目的是将provider对象分离为faker对象的“插件”。FAKER可以添加一个又一个Provider对象。provider对象为faker对象提供了生成特定数据的核心实现。Faker就相当于是一个生成器。它的生成功能依赖于什么?Provider为faker提供生成特定数据的能力。

实际上这个 faker 库在设计上,为了解耦,将 Provider 对象做成了 Faker 对象的”插件“。Faker 可以添加一个个 Provider 对象,Provider 对象为 Faker 对象提供了生成某项数据的核心实现。就相当于 Faker 对象是一个生成器,它的生成功能依赖于什么呢?依赖于 Provider,是 Provider 提供给了 Faker 对象生成某项数据的能力。

那我们一定很好奇。faker对象能够生成数据,那它肯定内置了一些默认的对象,我们打印看一下:

通过名字可以看到有 user_agent、phone_number、isbn、credit_card 等 Provider,其中有语言差异的 Provider 还区分了语言,比如 phone_number 代表电话号码,这个不同语言的不同,所以这里就又分了一层 zh_CN,作了语言的区分。

这样一来,通用的 Provider 就直接处在某个 Provider 类别的模块中,具有语言差异的 Provider 就又根据不同的语言进一步划分了模块,设计上非常科学,易扩展又不冗余。

地理信息类

city_suffix():市,县 country():国家 country_code():国家编码 district():区 geo_coordinate():地理坐标 latitude():地理坐标(纬度) longitude():地理坐标(经度) postcode():邮编 province():省份 (zh_TW没有此方法) address():详细地址 street_address():街道地址 street_name():街道名 street_suffix():街、路

基础信息类

ssn():生成身份证号 bs():随机公司服务名 company():随机公司名(长) company_prefix():随机公司名(短) company_suffix():公司性质 credit_card_expire():随机信用卡到期日 credit_card_full():生成完整信用卡信息 credit_card_number():信用卡号 credit_card_provider():信用卡类型 credit_card_security_code():信用卡安全码 job():随机职位 first_name()first_name_female():女性名 first_name_male():男性名 first_romanized_name():罗马名 last_name()last_name_female():女姓 last_name_male():男姓 last_romanized_name()name():随机生成全名 name_female():男性全名 name_male():女性全名 romanized_name():罗马名 msisdn():移动台国际用户识别码,即移动用户的ISDN号码 phone_number():随机生成手机号 phonenumber_prefix():随机生成手机号段

计算机基础、Internet信息类

个人账户信息类

ascii_company_email():随机ASCII公司邮箱名 ascii_email():随机ASCII邮箱 ascii_free_email()ascii_safe_email()company_email()email()free_email()free_email_domain()safe_email():安全邮箱

网络基础信息类

domain_name():生成域名 domain_word():域词(即,不包含后缀) ipv4():随机IP4地址 ipv6():随机IP6地址 mac_address():随机MAC地址 tld():网址域名后缀(.com,.net.cn,等等,不包括.) uri():随机URI地址 uri_extension():网址文件后缀 uri_page():网址文件(不包含后缀) uri_path():网址文件路径(不包含文件名) url():随机URL地址 user_name():随机用户名 image_url():随机URL地址

浏览器信息类

chrome():随机生成Chrome的浏览器user_agent信息 firefox():随机生成FireFox的浏览器user_agent信息 internet_explorer():随机生成IE的浏览器user_agent信息 opera():随机生成Opera的浏览器user_agent信息 safari():随机生成Safari的浏览器user_agent信息 linux_platform_token():随机Linux信息 user_agent():随机user_agent信息

随机生成的user_agent

文件信息类

file_extension():随机文件扩展名 file_name():随机文件名(包含扩展名,不包含路径) file_path():随机文件路径(包含文件名,扩展名) mime_type():随机mime Type

数字类

numerify():三位随机数字 random_digit():0~9随机数 random_digit_not_null():1~9的随机数 random_int():随机数字,默认0~9999,可以通过设置min,max来设置 random_number():随机数字,参数digits设置生成的数字位数 pyfloat():left_digits=5 #生成的整数位数, right_digits=2 #生成的小数位数, positive=True #是否只有正数 pyint():随机Int数字(参考random_int()参数) pydecimal():随机Decimal数字(参考pyfloat参数)

文本、加密类

pystr():随机字符串 random_element():随机字母 random_letter():随机字母 paragraph():随机生成一个段落 paragraphs():随机生成多个段落,通过参数nb来控制段落数,返回数组 sentence():随机生成一句话 sentences():随机生成多句话,与段落类似 text():随机生成一篇文章(不要幻想着人工智能了,至今没完全看懂一句话是什么意思) word():随机生成词语 words():随机生成多个词语,用法与段落,句子,类似 binary():随机生成二进制编码 boolean():True/False language_code():随机生成两位语言编码 locale():随机生成语言/国际 信息 md5():随机生成MD5 null_boolean():NULL/True/False password():随机生成密码,可选参数:length:密码长度;special_chars:是否能使用特殊字符;digits:是否包含数字;upper_case:是否包含大写字母;lower_case:是否包含小写字母 sha1():随机SHA1 sha256():随机SHA256 uuid4():随机UUID

时间信息类

am_pm():AM/PM century():随机世纪 date():随机日期 date_between():随机生成指定范围内日期,参数:start_date,end_date取值:具体日期或者today,-30d,-30y类似 date_between_dates():随机生成指定范围内日期,用法同上 date_object():随机生产从1970-1-1到指定日期的随机日期。 date_this_month()date_this_year()date_time():随机生成指定时间(1970年1月1日至今) date_time_ad():生成公元1年到现在的随机时间 date_time_between():用法同dates future_date():未来日期 future_datetime():未来时间 month():随机月份 month_name():随机月份(英文) past_date():随机生成已经过去的日期 past_datetime():随机生成已经过去的时间 time():随机24小时时间 timedelta():随机获取时间差 time_object():随机24小时时间,time对象 time_series():随机TimeSeries对象 timezone():随机时区 unix_time():随机Unix时间 year():随机年份

集合信息类

profile():随机生成档案信息 simple_profile():随机生成简单档案信息

档案信息和简档信息

#以下方法皆为随机集合类型 pyiterable() pylist() pyset() pystruct() pytuple() pydict()

其他类别

currency_code():货币编码 color_name():随机颜色名 hex_color():随机HEX颜色 rgb_color():随机RGB颜色 safe_color_name():随机安全色名 safe_hex_color():随机安全HEX颜色 isbn10():随机ISBN(10位) isbn13():随机ISBN(13位) lexify():替换所有问号(“?”)带有随机字母的事件。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-09-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 云深之无迹 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Pyhton随机生成测试数据模块faker
Faker是一个Python包,开源的GITHUB项目,主要用来创建伪数据,使用Faker包,无需再手动生成或者手写随机数来生成数据,只需要调用Faker提供的方法,即可完成数据的生成。
王大力测试进阶之路
2019/10/25
1.6K0
如何优雅的用python生成假数据
Faker是一个Python包,开源的GITHUB项目,主要用来创建伪数据,使用Faker包,无需再手动生成或者手写随机数来生成数据,只需要调用Faker提供的方法,即可完成数据的生成。本文参考文章 faker官方文档
shigen
2023/08/06
6460
没有测试数据,那自己生产
这样批量插入数据库的测试数据就有了,插入了500条,这里截图一部分,通过faker模块产生的数据都是随机生成不同的数据,这样看起来是不是没用那么fake呢?
HammerZe
2022/03/25
5530
没有测试数据,那自己生产
python3 测试时候如何批量随机生成伪数据?(faker模块)
在测试的过程中,我们经常需要造一些测试数据,比如姓名,手机号,身份证,地址,以及公司信息等测试数据。 就拿姓名来说,我们平常想到的姓名就是张三,李四,王五这些简单的名字。 如果领导让我们想一百个姓名,还不能重复,估计得抓掉不少头发了,给自己娃取个名字都得想好几天呢,更别说 100个 了。 为了让小伙伴门的头发更加茂密,给大家介绍一个造测试数据的利器 Faker 库,可以帮我们随机生成伪数据。
上海-悠悠
2021/06/25
2K0
推荐一款Python开源库,技术人必备的造数据神器!
在软件需求、开发、测试过程中,有时候需要使用一些测试数据,针对这种情况,我们一般要么使用已有的系统数据,要么需要手动制造一些数据。由于现在的业务系统数据多种多样,千变万化。在手动制造数据的过程中,可能需要花费大量精力和工作量,此项工作既繁复又容易出错,比如要构造一批用户三要素(姓名、手机号、身份证)、构造一批银行卡数据、或构造一批地址通讯录等。
测试开发技术
2020/07/08
9960
Faker 都能造哪些数据
我们在测试过程中,会使用一些测试数据,测试数据有时候来自数据库里的脱敏数据,有时候需要自己造。自己造一些简单的文本还好,一些复杂的,比如身份证号,信用卡号,街道地址可就麻烦了。
somenzz
2022/05/24
8020
Excel自动化办公 | 满足你对Excel数据的所有幻想,python-office一键生成模拟数据
自从在官网发布了python-office这个专门用来自动化办公的库,后台经常收到提问:晚枫,什么时候开发Excel功能呀?
程序员晚枫
2022/05/16
5240
Excel自动化办公 | 满足你对Excel数据的所有幻想,python-office一键生成模拟数据
Python 造假数据神器 Faker
【导读】:开发项目的时,为了测试常需要造假数据,经常要尽量的模拟真实环境,通常要费大量手工而且造出来的数据,而且通常手工造出来的看起来也很别扭,费时又费事,有没有更好的办法?有,这里给大家介绍一个“专业造数“库Faker,满足你对模拟数据的所有需求。
Python小二
2020/11/06
1.1K0
造数据神器Faker,一个有趣又实用的Python第三方库
众所周知,Python语法简洁,功能强大,通过简单的代码就能实现许多实用的功能,上到人工智能,下到少儿编程,很大原因得益于它有强大的标准库以及非常丰富的第三方库,有很多现成的轮子可以用。
测试蔡坨坨
2022/09/26
4470
别再造假数据了,来试试 Faker 这个库吧!
在做程序开发的时候,我们经常会用到一些测试数据,相信大多数同学是这么来造测试数据的:
崔庆才
2019/08/09
8490
用faker模拟数据
版权声明:本文为博主原创文章,转载请注明出处。 https://blog.csdn.net/u011054333/article/details/84203878
乐百川
2019/07/02
7910
Python Faker随机生成测试数据(干货)
Faker是一个Python软件包,可为您生成伪造数据。无论您是需要引导数据库,创建美观的XML文档,填充持久性以进行压力测试还是匿名化来自生产服务的数据,Faker都是您的理想之选。不论您这边需要创建多少条数据,无非是一个for循环就解决问题了。
wencheng
2020/07/06
1.6K0
Python Faker随机生成测试数据(干货)
Python最假的库:Faker
前辈在review的时候说怎么这么复杂,Python中有一个专门生成各类假数据的库:Faker,你去了解下。
小歪
2018/05/23
1.7K0
Python最假的库:Faker
测试数据不会造?Fake Data!
在测试过程中,大家应该都遇到过各种各样的数据构造问题。e.g. 构造一批通讯录、构造一批用户三要素(姓名手机号身份证)、构造一批银行卡数据……
用户5521279
2020/06/21
1.4K0
一个超级神奇的 Python 第三方库
姓名、所在省份、详细地址、手机号、身份证号、出生年月、邮箱、人物、颜色、公司、银行信用卡、时间日期、文件、乱数假文、用户代理、社会安全码等。
Wu_Candy
2022/12/06
2940
一个超级神奇的 Python 第三方库
如何在 Python 中使用 Faker 库来生成假数据
Faker 是一个能够生成各种类型的假数据的 Python 库,这些数据可以用于测试或填充数据库等目的。它受到 PHP 的 Faker、Perl 的 Data::Faker 和 Ruby 的 Faker 的启发。
TechHarmony
2024/04/14
7261
GoFakeIt—造数据神器
在软件开发和测试过程中,常常需要大量测试数据来模拟真实环境。然而,使用真实数据可能会引发隐私和安全问题,因此,生成虚拟数据成为了必不可少的需求。GoFakeIt 是一个专门为 Golang 开发的库,能够快速、便捷地生成各种类型的随机数据。它帮助开发者在开发、测试以及演示中大幅提升效率,同时规避了使用真实数据带来的风险。
FunTester
2025/01/23
1080
GoFakeIt—造数据神器
基于Faker生成中文测试数据实例
上一篇 基于Python生成中文测试数据 讲解了如何使用python代码自己实现中文测试数据的生成,这篇我们分享如何基于Faker开源库来实现。
苦叶子
2019/05/06
2.4K0
基于Faker生成中文测试数据实例
使用 Python 伪造数据
0 前言 某些时刻,因为个人数据不想泄露出去,所以需要伪造一下数据;也有使用爬虫的时候需要换一下 user agent ,一个用到旧会被发现,最后就是被封结尾。 运行环境是 Python3, Win10,编译器是 Pycharm。 1 个人数据 使用的是 faker 这个包,安装的过程直接省去。下面这段代码是生成简单的个人信息。 语言那可以自己选择,注释那只给出了常用的语言。 1.1 自己选择需要的数据 from faker import Faker fake = Faker('zh_CN') #
伪君子
2018/04/17
9110
使用 Python 伪造数据
软件测试|Python Faker库使用指南
Faker是一个Python库,用于生成虚假(假的)数据,用于测试、填充数据库、生成模拟数据等目的。它可以快速生成各种类型的虚假数据,如姓名、地址、电子邮件、电话号码、日期等,非常适合在开发和测试过程中使用。本文将介绍Python Faker库的详细使用。
霍格沃兹测试开发Muller老师
2023/11/09
5060
相关推荐
Pyhton随机生成测试数据模块faker
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验