一、scikit-learnscikit-learn 官方文档:https://scikit-learn.org/stable/#scikit-learn 的背景和创建者scikit-learn 是一个为 Python 编程语言设计的自由软件机器学习库。该项目最初由 David Cournapeau 在 Google Summer of Code 项目中启动
......
22
0
0
2024-11-14
本博客旨在分享在实际开发过程中,开发者需要了解并熟练运用的 Linux 操作系统常用命令。Linux 作为一种操作系统,与 Windows 或 MacOS 并驾齐驱,尤其在服务器和开发环境中占据重要地位。Linux 命令,简而言之,就是指导计算机执行特定操作的指令。在 Linux 系统中,每个用户都会在 home 目录下拥有一个私人目录,用于存储个人文件和配
......
14
0
0
2024-11-14
哈喽,我是Johngo~这几天,在社群发现很多同学都在讨论使用哪个框架的问题。当然,主要还是围绕TensorFlow和Pytorch展开。也毫无疑问,Pytorch的同学以压倒性的话语权霸屏。其实无论使用哪种框架,适合自己适合项目是最合适的。除此之外呢,还介绍了 sklearn、Keras、xgboost、LightGBM、NLTK、Gensim、Stats
......
25
0
0
2024-11-02
GBDT梯度提升决策树(Gradient Boosting Decision Tree),是一种集成学习的算法,它通过构建多个决策树来逐步修正之前模型的错误,从而提升模型整体的预测性能。GBDT属于Boosting方法的一种,这种方法会顺序构建一系列弱学习器(通常是决策树),每个后续模型都侧重于纠正前一个模型的错误。在GBDT中,这些弱学习器是回归决策树。G
......
234
0
0
2024-07-12
写在开头在机器学习中,我们除了关注模型的性能外,数据处理更是必不可少,本文将介绍一个重要的数据处理库numpy,将随着我的学习过程不断增加内容基本数据格式arrayarray矩阵是numpy中的数据格式,array格式有很多便捷的操作,如矩阵运算,广播等使用代码import numpy as np
arr = np.array([1, 2, 3,
......
248
0
0
2024-04-15
写在开头在机器学习中,我们除了关注模型的性能外,数据处理更是必不可少,本文将介绍一个重要的数据处理库pandas,将随着我的学习过程不断增加内容基本数据格式pandas提供了两种数据类型:Series和DataFrame,在机器学习中主要使用DataFrame,我们也重点介绍这个DataFramedataframe是一个二维的数据结构,常用来处理表格数据使用
......
228
0
0
2024-04-15
1 场景分析1.1 项目背景描述开发项目模型的一系列情境和因素,包括问题、需求、机会、市场环境、竞争情况等1.2. 解决问题传统机器学习在解决实际问题中主要分为两类:有监督学习:已知输入、输出之间的关系而进行的学习,从而产生一个能够对已知输入给出合适输出的模型。这些算法在图像分类、语音识别、自然语言处理、推荐系统等领域有着广泛的应用 无监督学习:已知输入,无
......
197
0
0
2024-04-02
1. 优化算法概览梯度下降法;牛顿法;拟牛顿法;坐标下降法;梯度下降法的改进型如AdaDelta,AdaGrad,Adam,NAG等。2. 梯度下降法的关键点梯度下降法沿着梯度的反方向进行搜索,利用了函数的一阶导数信息。梯度下降法的迭代公式为:根据函数的一阶泰勒展开,在负梯度方向,函数值是下降的。只要学习率设置的足够小,并且没有到达梯度为0的点处,每次迭
......
182
0
0
2024-03-14
尽管大模型非常强大, 但是解决实践的问题也可以不全部依赖于大模型。一个不太确切的类比,解释现实中的物理现象,未必要用到量子力学。有些相对简单的问题,或许一个统计分布就足够了。对机器学习而言, 也不用言必深度学习与神经网络,关键在于明确问题的边界。那么在使用ML解决相对简单问题的时候,如何评估一个机器学习模型的性能呢?这里给出了10个相对常用的评价指标,希望对
......
269
0
0
2024-03-05
【导读】大家好,我是泳鱼。一个乐于探索和分享AI知识的码农!本文介绍通过机器学习的可视化技术以解释和理解模型这个"黑盒子"的开发与运作。机器学习的可视化(VIS4ML)是利用可视化技术来解释和理解机器学习模型的过程。由于数据质量极大地影响了机器模型的性能,如图1,本文从数据出发,介绍了机器学习模型输入常见的五种数据类型,并介绍了六个以数据为中心的任务应用于来
......
226
0
0
2024-02-12
机器学习介绍Hnad-crafted rulesHand-crafted rules,叫做人设定的规则。那假设今天要设计一个机器人,可以帮忙打开或关掉音乐,那做法可能是这样:设立一条规则,就是写一段程序。如果输入的句子里面看到“turn off”这个词汇,那chat-bot要做的事情就是把音乐关掉。这个时候,之后对chat-bot说,Please turn
......
303
0
0
2024-02-02
公众号:尤而小屋 作者:Peter 编辑:Peter大家好,我是Peter~本文的主题:机器学习建模的超参数调优。开局一张图:文章很长,建议直接收藏~一、什么是机器学习超参数?机器学习超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。超参数是在模型训练之外设置的选项,不会在训练过程中被优化或更改。相反,需要在训练之前手动设置它们,并且对模
......
222
0
0
2024-01-21
1机器学习有四种用途:分类、聚类、回归和降维。更严格一点,机器学习的目的只有三个:分类、聚类和回归,降维不过是达成目标的手段之一。2分类和聚类都是对个体样本归类,看起来很相似,实则相去甚远——前者属于有监督的学习,后者属于无监督的学习。分类是基于经验的,而经验来自过往的数据,这意味着分类需要训练;聚类则是基于当前全部样本的特征,不依赖经验,自然也就无需训练。
......
202
0
0
2024-01-08
作为一款网红编程语言,Go语言还十分年轻,很多程序员无法及时了解到Go语言的框架、库和软件应用。近日,Github用户avelino分享了一张非常完整且庞大的表单,包括命令行、数据库、Web框架、机器学习、自然语言处理……以下是部分内容截取,感谢avelino的分享。标准CLI 用于构建标准或基本命令行应用程序的库。argv – 使用 bash 语法将库命令
......
279
0
0
2023-08-15
十大 Java 机器学习工具和库对于Java机器学习的关注反映了Java语言的普及。由于其极端的稳定,领先的组织和企业已经采用Java几十年。它广泛应用于Android的移动应用开发,为全球数十亿用户提供服务。为了实现机器学习算法,Java开发人员可以使用各种工具和库。仅在上就列出了至少90个基于Java的ML项目。本文列出了10个最常用的库和平台:简要地描
......
695
0
0
2023-07-15