sklearn学习笔记7:SVM

sklearn.svm.SVC ①kernel linear:线性核 poly:多项式核 sigmoid:双曲正切核 rbf:高斯径向基 对于线性核函数,kernel是唯一能够影响它的参数,但是对于其他三种非线性核函数,它们还受到参数gamma,degree及coef0的影响。高斯径向基核函数受到gamma的影响,而多项式核函数收到全部三个参数的影响 ②C 在实际使用中,C和核函数的相关参数(gamma,d...

sklearn学习笔记8:XGBoost

xgboost.XGBRegressor ①n_estimators 默认100,集成中弱评估器的数量 ②subsample 默认1,随机抽样的时候抽取的样本比例,范围(0,1] 对模型的影响应该会非常不稳定,大概率是无法提升模型的泛化能力,但也不发提升模型的可能性 ③eta 集成中的学习率,又称为步长,以控制迭代速率,常用于防止过拟合,取值范围[0,1] ④booster 用来控制我们究竟使用怎样的弱评估...

【论文随笔】Time-Incremental Learning from Data Using Temporal Logics

好久没看文献了,来更一篇 Outline time-variant weights of STL weights are learned by NN 通过决策树方法学出一系列STL约束 通过计算信号前缀相对于STL约束的加权鲁棒度来对信号前缀进行分类 Remark 在每个时间点学一个wSTL来分类,有点无聊 前期的决策时间点太少了吧,在第一个决策点之前都是盲猜啊 Formulation 数据集:等长的带标...

NLP_learning 中文基本任务与处理(分词、停用词、词性标注、语句依存分析、关键词抽取、命名实体识别)介绍、jieba工具库

文章目录 1、分词2、停用词和N-gram停用词N-gram 3、 更多任务(词性标注、依赖分析、NER、关键词抽取)词性标注句法依存分析命名实体识别关键词抽取 4、 jieba工具库使用(1)基本分词函数与用法(2)词性标注(3)关键词抽取基于TF-IDF算法的关键词抽取基于TextRank算法的关键词抽取PageRank的基本思想TextRank的基本思想TextRank提取关键词的主要步骤TextR...

机器学习6scikit-learn中的scaler

文章目录 一、scikit-learn中的scaler对测试数据集如何归一化?测试数据是模拟真实环境:综上 二、演示 一、scikit-learn中的scaler 对测试数据集如何归一化? 测试数据集不能跟训练数据集归一化一样,应该把测试数据集与训练数据集归一化后的数据集进行相应的归一化,也就是(x_test-mean_train)/std_train,来得到均值归一化的结果; 测试数据是模拟真实环境: ...

【菜菜的sklearn课堂笔记】聚类算法Kmeans-聚类算法的模型评估指标

本相似度一致,两个簇本应该是一个簇。可以总结为轮廓系数越接近于1越好,负数则表示聚类效果非常差。 如果许多样本点具有低轮廓系数甚至负值,则聚类是不合适的,聚类的超参数K可能设定得太大或者太小。 在sklearn中,我们使用模块metrics中的类silhouette_score来计算轮廓系数,它返回的是一个数据集中,所有样本的轮廓系数的均值。但我们还有同在metrics模块中的silhouette_samp...

【菜菜的sklearn课堂笔记】聚类算法Kmeans-概述 & 工作原理

大量的当前和潜在客户的信息,我们可以使用聚类将客户划分为若干组,以便进一步分析和开展营销活动 聚类vs分类 ![[附件/Pasted image 20221115094448.png|500]] sklearn中的聚类算法 聚类算法在sklearn中有两种表现形式,一种是类(和我们目前为止学过的分类算法以及数据预处理方法们都一样),需要实例化,训练并使用接口和属性来调用结果。另一种是函数(function)...

Machine Learning with Graphs

学习笔记,仅供参考,有错必纠 文章目录 Machine Learning with Graphs Convolutional Model for Graphs Components of Graph Convolution TransE, Translating Embeddings for Modeling Multi-relational Data Many other Trans[X] models...

NLP_learning 导论:自然语言处理概述+基本文本处理操作

文章目录 一、自然语言处理概述一、基本文本处理操作1、清理与替换2、截取3、连接与分割4、比较与排序5、查找与包含6、大小写变换7、搜索查找更多的字符串相关操作 总结 一、自然语言处理概述 定义:自然语言处理(Natural Language Processing)简称NLP,是一种利用计算机为工具对人类特有的书面形式和口语形式的自然语言的信息进行各种类型处理和加工的技术。 任务:通过处理和理解语言,来构...

【菜菜的sklearn课堂笔记】逻辑回归与评分卡-步长的进一步理解和max_iter

了数次才停下,这种”震荡“其实就是因为我们设置的步长太大的缘故。但是在我们开始梯度下降之前,我们并不知道什么样的步长才合适,但梯度下降一定要在某个时候停止才可以,否则模型可能会无限地迭代下去。 在sklearn当中,我们设置参数max_iter最大迭代次数来代替步长,帮助我们控制模型的迭代速度并适时地让模型停下。max_iter越大,代表步长越小,模型迭代时间越长,反之,则代表步长设置很大,模型迭代时间很短...
© 2024 LMLPHP 关于我们 联系我们 友情链接 耗时0.026935(s)
2024-04-26 20:08:39 1714133319