机器学习中的python杂粮函数

机器学习中的python杂粮函数

第一、numpy.random.choice(a, size=None, replace=True, p=None)

概述：

可以从一个int数字或1维array里随机选取内容，并将选取结果放入n维array中返回。12

说明：

numpy.random.choice(a, size=None, replace=True, p=None)

a : 1-D array-like or int
 If an ndarray, a random sample is generated from its elements.
 If an int, the random sample is generated as if a was np.arange(n)
size : int or tuple of ints, optional
replace : boolean, optional
 Whether the sample is with or without replacement
p : 1-D array-like, optional
 The probabilities associated with each entry in a. If not given the sample assumes a uniform distribution over all entries in a.123456789101112

示例

>>> np.random.choice(5, 3)
array([0, 3, 4])
>>> np.random.choice(5, 3, p=[0.1, 0, 0.3, 0.6, 0])
array([3, 3, 0])
>>> np.random.choice(5, 3, replace=False)
array([3,1,0])
>>> np.random.choice(5, 3, replace=False, p=[0.1, 0, 0.3, 0.6, 0])
array([2, 3, 0])
>>> aa_milne_arr = ['pooh', 'rabbit', 'piglet', 'Christopher']
>>> np.random.choice(aa_milne_arr, 5, p=[0.5, 0.1, 0.1, 0.3])
array(['pooh', 'pooh', 'pooh', 'Christopher', 'piglet'],

第二、K折交叉验证：sklearn.model_selection.KFold(n_splits=3, shuffle=False, random_state=None)

思路：将训练/测试数据集划分n_splits个互斥子集，每次用其中一个子集当作验证集，剩下的n_splits-1个作为训练集，进行n_splits次训练和测试，得到n_splits个结果

注意点：对于不能均等份的数据集，其前n_samples % n_splits子集拥有n_samples // n_splits + 1个样本，其余子集都只有n_samples // n_splits样本

参数说明：

n_splits：表示划分几等份

shuffle：在每次划分时，是否进行洗牌

①若为Falses时，其效果等同于random_state等于整数，每次划分的结果相同

②若为True时，每次划分的结果都不一样，表示经过洗牌，随机取样的

random_state：随机种子数

属性：

①get_n_splits(X=None, y=None, groups=None)：获取参数n_splits的值

②split(X, y=None, groups=None)：将数据集划分成训练集和测试集，返回索引生成器

通过一个不能均等划分的栗子，设置不同参数值，观察其结果

①设置shuffle=False，运行两次，发现两次结果相同

[python] view plain copy

In [1]: from sklearn.model_selection import KFold
...: import numpy as np
...: X = np.arange(24).reshape(12,2)
...: y = np.random.choice([1,2],12,p=[0.4,0.6])
...: kf = KFold(n_splits=5,shuffle=False)
...: for train_index , test_index in kf.split(X):
...: print('train_index:%s , test_index: %s ' %(train_index,test_index))

第三、

展开阅读全文

页面更新：2024-03-27

标签：行号等份子集均等杂粮生成器整数示例样本函数索引机器参数标签方式数字测试数据数码

全球最大海上机场，落户中国了！填海造岛3万亩，难度有多大？

图为海上机场为了建设全球最大的海上机场，中国打算造岛3万亩，这就是大连金州湾国际机场，看来又一项全球之最要落户中国了！结果此消息一出，日本立刻就慌了，因为这意味着在海上机场领域，日本将不再是世界第一，但建成金州湾机场

海底发电站？中国这一超级工程太牛了，或改变全球能源布局？

图为潮汐发电站长期以来，国内一群人总喜欢拿中日科技作为对比，认为我们的技术不及对面，然而现在中国拿出了实力说话，以后不要再吹日本了，原来这次中国把发电站建在了海底，在真的吗？这不得不令人佩服这一超级工程实在太牛了，

被美国抛弃的油田，中国却花2400亿巨资接盘，后来如何变废为宝的

图为石油开发设备石油作为现代工业最为宝贵的资源，重要性不言而喻，但现在却有一座巨型油田，被美国直接选择抛弃，这座被抛弃的油田，中国却选择花费2400亿巨资接盘！结果却受尽了嘲笑，原来这座废弃油田吓退了美国，毕竟其开采难

网站SEO优化应该怎么选择代理IP？松果云告诉你

随着互联网大数据时代的到来，许多企业都纷纷建站成立自己的网站进行引流，这使得网站SEO的优化起到了至关重要的作用，好的网站SEO优化可以让网站曝光度，搜索排名、流量大幅度增加。其中又和IP有什么关系呢？因为在网站优化中

知识爆发的时代，IP就是为你引路的老师

今天是教师节，自古以来，老师作为传道受业，将知识传递出去的角色一直是受人尊敬的，每个人的知识，对世界的认知，对道理的领悟都少不了老师。可以说，每一个人的成长路上，老师是不可或缺的。随着现在科技的普及，互联网大数据的高速

「入门」萌新IP入门常识（一）：什么是IP地址和代理IP

随着互联网大数据时代的到来，工作和生活中需要代理IP的地方越来越多，但是对于很多刚接触代理IP的人来说，有太多技术性和专业性的术语搞不懂，所以在购买和使用代理IP的时候总会无所适从。因此，这边将会针对各位刚接触代理IP

中国这5大超级工程，改变了世界！西方感叹：古代神话成现实

图为天宫空间站内部如今中国的综合国力高居全球第二，很多人都知道中国的实力非常强大，但却很少有人知道中国的实力到底强大到了什么地步，前段时间中国有学者给出了5个典型例子，认为中国这五大超级工程影响改变了全世界，是

晚上抽水用来白天发电，中国最能折腾水电站，究竟是何原理？

图为安徽绩溪抽水蓄能电站为了为经济发展提供充足的能源，中国正大力推进各种能源工程建设，然而中国最近建成了一座堪称最折腾的水电站，这座水电站的任务很复杂，它在晚上需要将水抽到自己的水库里，白天再将水放出来发电，而

解决150万人吃水难题！罕为人知的引洮工程为何被誉为救命工程？

图为引洮工程如何解决西北地区用水难的问题，是长期以来摆在甘肃面前的一道考验，毕竟水资源是生命之源，不仅日常生活需要用水，工农业的生产也同样需要用水，为此中国斥巨资打造引洮工程，堪称南水北调工程的先驱，成功解决了当

弹丸小国日本，凭什么号称科技强国？这几项尖端技术，傲世全球

图为日本机器人日本作为一个弹丸小国，凭啥号称是科技强国呢？这不仅是因为日本有多名科学家获得诺贝尔奖，在这几项技术上，更是傲视全球，就连美国也无法追赶，这些科技分别是机器人工业、高精密机床技术、蒸镀模机与新材料技

爬虫选择代理IP，是SK5还是HTTP？松果云告诉你

无论是个人还是企业，在数据的整理和分析上都少不了用上爬虫来进行辅助采集数据，而使用代理IP也已经是爬虫圈内无可争议的共识了，也有很多朋友问道目前市面上的代理IP有很多，选择哪个是比较好的？目前市场上代理IP协议有很多

高匿IP代理，数据采集必备的工具

在这个大数据来临的时代，数据对于各行各业来说是至关重要的参考依据，而数据采集也是一项重要的工作。但是由于现在服务器对数据监控越来越严格，数据的采集也非常的困难，尤其是做到既能采集数据又不会留下真实IP痕迹。平

「常识向」HTTP代理IP和socks5代理IP之间有什么区别

随着大数据时代到来，代理IP已经是许多互联网工作者以及普通互联网用户常用的一种工具，但是对于很多刚接触代理IP的萌新来说，其中很多的产品特性是搞不清楚的，尤其是有很多新人对于HTTP和SK5这两个代理IP的概念无法分辨清

宝妈在家抢购不会换IP，超简单教程一看就会

这两年，随着网购平台的兴起，越来越多的人把平台抢购当做一个赚取零花钱的途径，尤其是在家带娃的宝妈，有足够的时间来进行兼职工作，获得金额也能提供一部分的家用，遇上性价比高质量还不错的产品也能自己留着用，可谓是一箭三雕

1台就能转出4亿元？中国海上风力发动机火了，美日抢着买

图为海上风力发电机组中国做成的这件事连美国都做不到？原来中国正在不断建成海上印钞机，开始运行后一台就能转出4亿元人民币的电能，如此先进技术和设备，立刻引来美日抢着买，这则消息立刻让中国的海上风力发电机火了，因为目

上滑加载更多 ↓

推荐阅读：

高匿IP代理，数据采集必备的工具

数据采集小白注意啦！爬虫IP被封怎么办？松果云告诉你三招

中国高铁凭啥那么牛？与美日对比后发现，仅调头方式就有大

「Flutter实战」06.首页_项目结构建立和获取数据

「我学flutter」6、Method/Event/BasicMessage方式与

数据结构：从原理到实战–学习笔记06

数据结构：从原理到实战–学习笔记02

数据结构：从原理到实战–学习笔记01

数据结构：从原理到实战–学习笔记03

数据结构：从原理到实战–学习笔记04

友情链接：

更多：

本站资料均由网友自行发布提供，仅用于学习交流。如有版权问题，请与我联系，QQ：4156828

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top