最新内容

用Python进行机器学习(5)-决策树

决策树是一种树形结构,树结构中的每个节点都可以理解为是一个规则,通过对规则处理的结果进行分类,最终完成对整体数据的分类,当然也可以用于回归。下面我们就来拿一个是否去爬山的案例来说明,比如通过判断明天是否下雨、是否降温来决定是否去爬山,可以构造出如下的决策树:要实现一个决策树,最核心的就是要确定每个节点要通过哪个特征来分类,比如在我们上面举的例子中,到底是先判 …

AI算法之怎么利用Python实现支持向量机SVM算法

摘要:支持向量机(Support Vector Machine, SVM)是一种经典的机器学习算法,主要用于分类问题。其核心思想是找到一个“最佳分界线”(在高维空间中是一个“超平面”),将不同类别的数据尽可能地区分开,并且让这条分界线距离最近的数据点尽可能远一些,从而提升模型的泛化能力,也就是在新数据上的表现。这篇文章深入浅出地讲解了SVM的工作原理,包括它 …

用Python进行机器学习(7)朴素贝叶斯

朴素贝叶斯算法一听就是根据人名来定义的,这个算法包括两部分:第一部分是贝叶斯定理,这个我们在概率论中应该都学习过,下面会简单回顾一下,第二部分是朴素,也就是假设各个特征互相独立,虽然在现实情况中可能各个特征也会有一些相关性,也就是这个假设不完全成立,但是在实际中朴素贝叶斯的效果还是很不错的。下面简单回顾一下贝叶斯定理,即P(A|B) = [P(B|A) × …

一切模型皆可联邦化:高斯朴素贝叶斯代码示例

来源:DeepHub IMBA本文约1500字,建议阅读5分钟本文将以高斯朴素贝叶斯分类器为例创建一个联邦学习系统。联邦学习是一种分布式的机器学习方法,其中多个客户端在一个中央服务器的协调下合作训练模型,但不共享他们的本地数据。一般情况下我们对联邦学习的理解都是大模型和深度学习模型才可以进行联邦学习,其实基本上只要包含参数的机器学习方法都可以使用联邦学习的方 …

用Python进行机器学习(8)分类任务的模型评估

前面我们已经介绍了不少机器学习的算法,已经可以执行像回归、分类、聚类等任务,比如对于一个分类问题而言,到底哪个算法更好呢?或者同样的算法下训练出的不同的模型,到底哪个更好呢?这就需要用到模型评估了,本节的内容我们以二分类为例,通常多分类问题都可以转化为多个二分类问题,后面我们再介绍其他的任务类型。在介绍模型评估的指标签之前,先介绍预测结果和正确结果之间的四种 …

【Python机器学习系列】建立决策树模型预测小麦品种

这是我的第314篇原创文章。一、引言对于表格数据,一套完整的机器学习建模流程如下:针对不同的数据集,有些步骤不适用,其中橘红色框为必要步骤,欢迎大家关注翻看我之前的一些相关文章。前面我介绍了机器学习模型的二分类任务和回归任务,接下来做一下机器学习的多分类系列,由于本系列案例数据质量较高,有些步骤跳过了,跳过的步骤将单独出文章总结!在Python中,可以使用S …

机器学习交叉验证全指南:原理、类型与实战技巧

机器学习模型常常需要大量数据,但它们如何与实时新数据协同工作也同样关键。交叉验证是一种通过将数据集分成若干部分、在部分数据上训练模型、在其余数据上测试模型的方法,用来检验模型的表现。这有助于发现过拟合或欠拟合的问题,并预测模型在真实场景中的效果。本指南将带你了解交叉验证的基础知识、常见类型以及提升机器学习表现的最佳实践。前置知识在开始实际操作交叉验证之前,请 …

用Python进行机器学习(9)-ROC曲线与AUC

在我们前面讲到分类任务的模型评估的时候,已经介绍了四个指标(准确率、精确率、召回率和F1指标),本节继续介绍另一个有用的评估方式,ROC曲线及其AUC值。ROC曲线是Receiver Operating Characteristic的简写,如果翻译成汉语就是“受试者工作特征”,这个名称听上去有点怪怪的,但是这个指标却不难理解,先看一个具体的ROC曲线是什么吧 …

怎么利用Python+AI人工智能实现通过病历智能筛选

摘要:本文以通俗易懂的方式介绍了如何利用Python和人工智能技术,实现对病患病历的智能筛选。文章详细讲解了从数据准备、预处理、模型选择与训练,到模型评估和新病例预测的完整流程。通过实际的病历数据表和Python代码示例,使读者可以快速掌握如何用决策树算法自动判断病人是否生病。该方法不仅能大幅提升医疗筛查的效率和准确率,还为医生提供了有力的辅助决策工具。决策 …

机器学习——PCA 主成分分析

PCACreated: Apr 26, 2020 4:40 PMPCA 简介PCA是一种降维算法属性:- 在数据集中保留了最多的信息,同时将数据转换到较低维的子空间- 主要的成分彼此正交(方差最大)- 有损数据压缩,特征提取和数据可视化等应用程序。- 是一种无监督的学习为什么要降维?- 数据可视化数据可视化中很难看到高维数据,所以你可以通过降维到低维空间,更 …