【Python机器学习】1.7. 逻辑回归理论(进阶):多维度(因子)逻辑回归问题、决策边界、交叉熵损失函数、最小化损失函数
喜欢的话别忘了点赞、收藏加关注哦(关注即可查看全文),对接下来的教程有兴趣的可以关注专栏。谢谢喵!(==) 1.7.1. 多维度(因子)逻辑回归问题 在上一篇文章 1.6. 逻辑回归理论(基础) 中我们讨论了简单的逻辑回归问题。这篇文章我们来讨论复杂的逻辑回归问题: 原来我们只有一个维度(比如说小明的余额),但这个图里我们有两个维度——x_1和x_2。 虽然这个图看上去仍然是一个二维图像,但是它的两个轴都是输入变量...
【Python机器学习】1.8. 逻辑回归实战(基础):建立一阶边界模型、画分类散点图、逻辑回归模型的代码实现、可视化决策边界
喜欢的话别忘了点赞、收藏加关注哦(关注即可查看全文),对接下来的教程有兴趣的可以关注专栏。谢谢喵!(==) 1.8.1. 使用matplotlib画分类散点图 我想大家都知道未分类别的散点图是怎么画的: plt.scatter(x1, x2) 但在分类问题中你会需要把不同的类别的点体现出来,你可以改颜色,也可以改形状,也可以两者都改: 假设我们有两个特征x1和x2,以及类别标签y(0和1)。其中,类别0用红色圆点(...
【Python机器学习】1.6. 逻辑回归理论(基础):逻辑函数、逻辑回归的原理、分类任务基本框架、通过线性回归求解分类问题
喜欢的话别忘了点赞、收藏加关注哦(关注即可查看全文),对接下来的教程有兴趣的可以关注专栏。谢谢喵!(==) 1.6.1. 如何求解分类问题? 举个简单的例子:根据余额,判断小明是否会去看电影。 从这幅图中我们可以看到: y = 0代表不看电影、y = 1代表去看电影余额为1、2、3、4、5时,去看电影(正样本)余额为-1、-2、-3、-4、-5时,不看电影(负样本) 1.6.2. 分类任务基本框架 那么如何让计算器...
【Python机器学习】零基础掌握IsotonicRegression等渗回归
想要预测一个事件的结果,但因素多且复杂,难以得出精确的预测?在金融、医疗、教育等多个领域,这样的问题是非常普遍的。 假设在医疗领域,医生需要根据多项指标(如年龄、血压、胆固醇水平等)来预测患者是否有心脏病的风险。因为每个指标对结果的影响都可能不同,单一模型可能无法精确地进行预测。 为了解决这个问题,可以使用一种称为“单调回归(Isotonic Regression)”的算法。该算法可以很好地处理多个变量,并且能够根...
【Python机器学习】零基础掌握BayesianRidge贝叶斯回归
如何准确预测房价? 在现实生活中,购买房产可能是最大的一笔投资。因此,准确预测房价变得尤为重要。通常,房价受到多个因素的影响,包括地段、房龄、房屋面积等。但如何综合这些因素来做出准确预测呢? 这里介绍一种机器学习算法:贝叶斯岭回归(Bayesian Ridge Regression),它能够基于多个变量准确预测房价。 假设有以下房屋数据,包括地段(1=市中心,0=郊区)、房龄、房屋面积和价格: 使用贝叶斯岭回归模型...
【Python机器学习】零基础掌握SimpleImputer缺失值填充
如何处理数据集中的缺失值,以便更准确地进行数据分析或模型训练? 在数据分析和机器学习中,数据的完整性和准确性至关重要。但现实情况是,收集到的数据往往存在缺失值。例如,医疗研究中可能缺少某些患者的体重、年龄或血压等信息。这样的缺失值会对数据分析或模型训练产生不良影响。 假设一个小型医院需要分析患者的多项身体指标(如体重、身高、血压和血糖)以预测其是否有糖尿病风险。收集到的数据可能如下: 注意到有些数据是缺失的。一个简...
【Python机器学习】零基础掌握isotonic_regression等渗回归
遇到了数据不一致的困扰吗? 在市场分析、医疗研究或者其他数据密集型领域,经常会遇到一个问题:如何从一组不完全一致或者有噪音的数据中提取出有用的信息?例如,假设一家餐厅想要根据顾客的评分和消费金额来调整菜单。 数据表中包含了顾客的评分、消费金额、年龄和访问次数,但这些数据可能受到多种因素的影响,导致数据之间的关系并不是线性的或者容易解释。怎么办? 一个解决方案是使用等渗回归(Isotonic Regression)。...
【Python机器学习】零基础掌握PartialDependenceDisplay检验、检查
如何更好地理解模型对特定特征的依赖性?如何使用历史数据来预测明天股票市场的走势? 想象一下,作为一名数据分析师,面对海量的数据,如何准确地预测明天股票市场的走势?这是一个复杂且具有挑战性的问题。但别担心,有一种神奇的工具可以帮助解析模型对各种因素(特征)的依赖性,从而更准确地进行预测。 假设有以下模拟的股票历史数据: 通过分析历史数据中的各种因素(如交易量、市盈率等)与股票价格之间的关系,使用PartialDepe...
【Python机器学习】零基础掌握DecisionBoundaryDisplay检验、检查
为什么决策边界如此重要? 决策边界是机器学习中一个经常被忽视的话题。在处理分类问题时,了解如何可视化决策边界能帮助解释模型行为,也能更好地理解模型的优缺点。例如,在医学诊断、股票市场或者自动驾驶等领域,有效地划分和识别数据的不同区域可能是至关重要的。 假设有一个在线购物网站,该网站希望通过用户的购物习惯和行为数据,准确地预测哪些用户更有可能进行购买。为了解决这个问题,可以使用逻辑回归模型来进行分类,并通过决策边界来...
【Python机器学习】零基础掌握text图像提取
如何从大量的文本数据中提取有用的信息?这是自然语言处理(NLP)和机器学习中一个常见的问题。sklearn.feature_extraction.text 是一个专门用于文本特征提取的模块,它在文本挖掘、搜索引擎、情感分析等多个领域有广泛的应用。 文章目录 CountVectorizer HashingVectorizer TfidfTransformer TfidfVectorizer 总结 CountVecto...