随机生成测试数据

前言

在测试的过程中,我们经常需要造一些测试数据,这里给大家介绍一个造测试数据的利器 Faker 库,可以帮我们随机生成伪数据。

Faker介绍

Faker 是python的一个第三方模块,主要用来生成伪数据,无需再手动生成或者手写随机数来生成数据,只需要调用 Faker 提供的方法,即可快速完成数据的生成。

github 项目地址:https://github.com/joke2k/faker
官方文档:https://faker.readthedocs.io/en/master/index.html

基本使用

要求python版本大于等于3.6,pip安装
pip install Faker
导入模块
from faker import Faker
初始化

fake = Faker() #默认生成美国英文数据

还可以选择语言,输出多个国家的语言都可以支持
简体中文:fake=Faker(locale='zh_CN')
繁体中文:zh_TW
美国英文:en_US
英国英文:en_GB
德文:de_DE
日文:ja_JP
韩文:ko_KR
法文:fr_FR

利用Faker对象调用方法,调用方法的返回值就是随机的数据

常用方法

https://faker.readthedocs.io/en/master/locales/zh_CN.html 由于主要使用中文数据,所以提供常见的方法示例是中文的。想要了解其他的,可以在官网点击其他语言,参考示例结果,不过方法大体上都是相同的

1.基本信息类

ssn():生成身份证号
bs():随机公司服务名
company():随机公司名(长)
company_prefix():随机公司名(短)
company_suffix():公司性质
credit_card_expire():随机信用卡到期日
credit_card_full():生成完整信用卡信息
credit_card_number():信用卡号
credit_card_provider():信用卡类型
credit_card_security_code():信用卡安全码
job():随机职位
first_name_female():女性名
first_name_male():男性名
last_name_female():女姓
last_name_male():男姓
name():随机生成全名
name_female():男性全名
name_male():女性全名
phone_number():随机生成手机号
phonenumber_prefix():随机生成手机号段

2.地理信息类

city_suffix():市,县
country():国家
country_code():国家编码
district():区
geo_coordinate():地理坐标
latitude():地理坐标(纬度)
longitude():地理坐标(经度)
postcode():邮编
province():省份
address():详细地址
street_address():街道地址
street_name():街道名
street_suffix():街、路

3.网络基础信息类

domain_name():生成域名
domain_word():域词(即,不包含后缀)
ipv4():随机IP4地址
ipv6():随机IP6地址
mac_address():随机MAC地址
tld():网址域名后缀(.com,.net.cn,等等,不包括.)
uri():随机URI地址
uri_extension():网址文件后缀
uri_page():网址文件(不包含后缀)
uri_path():网址文件路径(不包含文件名)
url():随机URL地址
user_name():随机用户名
image_url():随机URL地址

4.邮箱类

fake.ascii_company_email():随机ASCII公司邮箱名
fake.ascii_email():随机ASCII邮箱:company_email():email():safe_email():安全邮箱

5.浏览器参数

chrome():随机生成Chrome的浏览器user_agent信息
firefox():随机生成FireFox的浏览器user_agent信息
internet_explorer():随机生成IE的浏览器user_agent信息
opera():随机生成Opera的浏览器user_agent信息
safari():随机生成Safari的浏览器user_agent信息
linux_platform_token():随机Linux信息
user_agent():随机user_agent信息

6.时间信息类

date():随机日期
date_between():随机生成指定范围内日期,参数:start_date,end_date
date_between_dates():随机生成指定范围内日期,用法同上
date_object():随机生产从1970-1-1到指定日期的随机日期。date_time():随机生成指定时间(1970年1月1日至今)
date_time_ad():生成公元1年到现在的随机时间
date_time_between():用法同dates
future_date():未来日期
future_datetime():未来时间
month():随机月份
month_name():随机月份(英文)
past_date():随机生成已经过去的日期
past_datetime():随机生成已经过去的时间
time():随机24小时时间
timedelta():随机获取时间差
time_object():随机24小时时间,time对象
time_series():随机TimeSeries对象
timezone():随机时区
unix_time():随机Unix时间
year():随机年份

7.数字

numerify():三位随机数字
random_digit():0~9随机数
random_digit_not_null():1~9的随机数
random_int():随机数字,默认0~9999,可以通过设置min,max来设置
random_number():随机数字,参数digits设置生成的数字位数
pyfloat():left_digits=5 #生成的整数位数, right_digits=2 #生成的小数位数, positive=True #是否只有正数
pyint():随机Int数字(参考random_int()参数)
pydecimal():随机Decimal数字(参考pyfloat参数)

8.文本、加密类

pystr():随机字符串
random_element():随机字母
random_letter():随机字母
paragraph():随机生成一个段落
paragraphs():随机生成多个段落
sentence():随机生成一句话
sentences():随机生成多句话,与段落类似
text():随机生成一篇文章
word():随机生成词语
words():随机生成多个词语,用法与段落,句子,类似
binary():随机生成二进制编码
boolean():True/False
language_code():随机生成两位语言编码
locale():随机生成语言/国际 信息
md5():随机生成MD5
null_boolean():NULL/True/False
password():随机生成密码,可选参数:length:密码长度;special_chars:是否能使用特殊字符;digits:是否包含数字;upper_case:是否包含大写字母;lower_case:是否包含小写字母
sha1():随机SHA1
sha256():随机SHA256
uuid4():随机UUID

9.其它方法

profile():随机生成档案信息
simple_profile():随机生成简单档案信息
pyiterable()  迭代器
pylist()   列表
pyset()   集合
pystruct()  结构体
pytuple()  元祖
pydict()  字典

使用示例

生成随机的数据表信息

1.利用pymysql连接数据库
2.创建表
3.利用fake格式化要插入的数据
4.利用pymysql执行插入语句

import pymysql
from faker import Faker

conn=pymysql.connect(host="localhost",port=3306,user="root",password="123456",db="it",charset="utf8")

cursor=conn.cursor()
#这里给出表结构,如果使用已存在的表,可以不创建表。
sql="""
create table user(
id int PRIMARY KEY auto_increment,
username VARCHAR(20),
password VARCHAR(20),
address VARCHAR(35) 
)
"""
cursor.execute(sql)

fake=Faker("zh-CN")
for i in range(20):
    sql="""insert into user(username,password,address) 
    values('%s','%s','%s')"""\
        %(fake.user_name(),fake.password(special_chars=False),fake.address())
    cursor.execute(sql)

conn.commit()
cursor.close()
conn.close()

生成日志格式的数据

根据具体的使用场景,生成自己需要的数据
根据提供的日志规则使用循环将测试数据写入日志文件,同时也需要考虑到一些数据的关联性

# 玩家创建日志
creat_date = (
    f'{last_time}'  # 时间,随机生成已经过去的时间
    f'#create'  # 日志标识
    f'#mock'  # 平台标识
    f'#{servers}'  # 服务器ID
    f'#{platformID}'  # 平台用户ID
    f'#{userid}'  # 游戏角色ID
    f'#{username}'  # 游戏角色名
    f'#{uniqueID}'  # 玩家的全服唯一标识:联运标识_主服id_联运服id_角色编号
    f'#1'  # 设备评级
    f'#{TestData.get_terrace(self)}'  # 终端标识
    f'#{TestData.get_jre(self)}'  # 运行时环境
    f'\n')  # 每一条打印结束 换行

# 充值日志格式
pay_data = (
    f'{now_time}'  # 时间
    f'#pay'  # 日志标识
    f'#mock'  # 平台标识
    f'#{platformID}'  # 平台用户ID
    f'#{userid}'  # 游戏角色ID
    f'#{username}'  # 游戏角色名
    f'#{TestData.get_RandomNumber(self, 1, 100)}'  # 角色等级
    f'#{TestData.get_RandomNumber(self, 1, 10000)}'  # 充值金额
    f'#{TestData.get_RandomNumber(self, 200, 300)}'  # 商品编号
    # f'#{}'    # 单服订单唯一标识
    # f'#{}'    # 游戏订单号
    # f'#{}'    # 平台订单号
    f'#{servers}'  # 服务器ID
    f'#{uniqueID}'  # 玩家的全服唯一标识:联运标识_主服id_联运服id_角色编号
    f'\n'
)
上一篇:faker.js 创建者希望 GitHub 恢复他的权利;微软公布 VS Code 2022 年路线图;Java 18 的新特性 | 开源日报


下一篇:数据可视化 - 组合组件 - 柱状图加折线图