博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
pandas.DataFrame.sample随机抽样
阅读量:5248 次
发布时间:2019-06-14

本文共 967 字,大约阅读时间需要 3 分钟。

 

 

(博主录制)

1    数据切片选取

1.1    pandas.DataFrame.sample 随机选取若干行
1.1.1     功能说明
             有时候我们只需要数据集中的一部分,并不需要全部的数据。这个时候我们就要对数据集进行随机的抽样。pandas中自带有抽样的方法。

功能相似:numpy.random.choice

    Generates a random sample from a given 1-D numpy array.

1.1.2     使用说明

1.    函数名及功能
DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)[source]

2.    输入参数说明

参数名称 参数说明 举例说明

n 要抽取的行数
df.sample(n=3,random_state=1)
提取3行数据列表
注意,使用random_state,以确保可重复性的例子。

frac

抽取行的比例
例如frac=0.8,就是抽取其中80%。

df.sample(frac=0.8, replace=True, random_state=1)

replace
是否为有放回抽样,
True:有放回抽样
False:未放回抽样

True:取行数据后,可以重复放回后再取

False:取行数据后不放回,下次取其它行数据
注意:当N>总数据容量,replace设置为值时有效

 

weights

字符索引或概率数组

axis=0:为行字符索引或概率数组

axis=1:为列字符索引或概率数组

 

random_state
int: 随机数发生器种子
或numpy.random.RandomState

random_state=None,取得数据不重复

random_state=1,可以取得重复数据

 

axis

选择抽取数据的行还是列
axis=0:抽取行
axis=1:抽取列

也就是说axis=1时,在列中随机抽取n列,在axis=0时,在行中随机抽取n行。

3.    返回值说明
返回选择的N行元素的DataFrame对象。

 

(博主视频教学主页)

 

转载于:https://www.cnblogs.com/webRobot/p/11484648.html

你可能感兴趣的文章
tju 1782. The jackpot
查看>>
HTML5与CSS3基础(五)
查看>>
WinDbg调试C#技巧,解决CPU过高、死锁、内存爆满
查看>>
linux脚本中有source相关命令时的注意事项
查看>>
css样式表中的样式覆盖顺序
查看>>
湖南多校对抗赛(2015.03.28) H SG Value
查看>>
REST Web 服务(二)----JAX-RS 介绍
查看>>
hdu1255扫描线计算覆盖两次面积
查看>>
hdu1565 用搜索代替枚举找可能状态或者轮廓线解(较优),参考poj2411
查看>>
bzoj3224 splay板子
查看>>
程序存储问题
查看>>
Mac版OBS设置详解
查看>>
优雅地书写回调——Promise
查看>>
第一次作业
查看>>
android主流开源库
查看>>
AX 2009 Grid控件下多选行
查看>>
PHP的配置
查看>>
Linux系列:Ubuntu虚拟机设置固定IP上网(配置IP、网关、DNS、防止resolv.conf被重写)...
查看>>
LANDR:在线母带处理
查看>>
简单的聊天脑思路
查看>>