john

I can not choose the best, the best chooses me.

scikit-learn用户指南

监督学习-线性判别分析

LDA和QDA 线性判别分析和二次判别分析是两个经典的分类器,正如其名称所示,分别表示线性或者二次决策表面。 这些分类器很有吸引力,因为它们具有封闭形式的解决方案,可以轻松计算,本质上是多类的,已经证明在实践中运行良好并且没有超参数可以调整。 使用线性判别分析进行降维 线性判别分析可用于执行有监督的降维,通过将输入数据投影到线性子空间,该线性子空间由最大化类之间分离的方向组成。输出的维度...

scikit-learn用户指南

监督学习-广义线性模型

广义线性模型 以下是一组用于回归的方法,其中目标值应该是输入变量的线性组合。在数学概念中,y是预测值。如下式所示: 在整个模块中,我们将向量指定为coef_和intercept_。 如果使用广义线性回归进行分类,可以参看逻辑回归。 普通最小二乘 线性回归拟合具有系数的线性模型,以最小化数据集中观察到的响应与线性近似预测的响应之间的残差平方和。在数学上它解决了以下形式的问题: ...

企业财报

读懂上市公司财报

杜邦分析法 评价一个公司好不好,主要看三个方面:盈利能力、融资能力、运营能力。 通过ROE指标衡量(杜邦分析法) ROE: 净资产报酬率 = 净利润/净资产,简而言之,就是我投入的钱,能给我带来多大的收益。其中净资产是股东投入的那部分钱,又叫所有者权益 (净利润 / 销售收入) * (销售收入 / 总资产) * (总资产 / 净资产) 销售净利润率 * 总资产周转率 * 权益乘数 ...

迁移学习

迁移学习的艺术

机器学习和深度学习的比较 数据依赖性: 随着数据规模的增大的,深度学习的效果会逐渐好于传统机器学习。 硬件依赖性: 深度学习算法本质上是做大量的矩阵乘法操作。 特征工程: 传统机器学习需要专家或者手工设计特征。 解决问题的方法: 深度学习可以设计成端到端的网络结构,例如目标检测的yolo。 执行时间: 深度学习需要很少的时间去训练。 可解释性: 传统机器学习的可解释...

EHandbook翻译

EDA介绍

什么是EDA   EDA(Exploratory Data Analysis)是一种使用了下面几种技巧的数据分析方法: 最大化洞察数据集合 揭示数据底层的结构 抽取重要的变量 发现离散点或者异常点 验证一些假设 决定一些最优因素设置 三种经典的数据分析方法: 经典分析法: 问题=>数据=>模型=>分析=>结论 ...

数据挖掘

数据仓库

数据仓库 数据仓库是面向主题的、集成的、稳定的、不同时间的数据集合,用于支持经营管理中的决策制定过程。 从数据库发展到数据仓库的原因: 数据太多,信息贫乏 异构环境数据的转换和共享 利用数据进行事务处理转换为利用数据支持决策 操作型数据(DB数据)与分析型数据(DW数据)之间的差别: DB数据 DW数据 ...

集成学习

Lightgbm

简介 LightGBM是使用基于树的学习算法的梯度提升框架。它被设计成分布式的和高效的,具有以下优点: 快的训练速度和高的使用效率 更低的内存使用 更好的准确率 并行和GPU学习支持 处理大规模数据的能力 具体可以参加Github地址 文档地址 LightGBM和xgboost的详细对比 LightGBM算法理解 Adaboost新的角度理解 XGBoo...

网络框架

Pytorch or Tensorflow

前言 Pytorch更适合于在研究中快速进行原型设计、业余爱好者和小型项目;Tensorflow则更适合大规模的调度,尤其当考虑到跨平台和嵌入式调用操作时。 参考斯坦福大学计算机科学博士生Awni Hannun的文章Pytorch or Tensorflow。 中文翻译参考雷锋网的译文。

机器学习

Network Embedding Survey

DeepWalk 论文地址DeepWalk: Online Learning of Social Representations DeepWalk是对图从一个节点开始使用random walk来生成类似文本的序列特征,然后将节点id作为一个个词使用skip gram训练得到词向量。 node2vec 论文地址node2vec: Scalable Feature Learning for ...

计算机视觉

目标检测

简介 目标检测的任务是找出图像中所有感兴趣的目标(物体),确定它们的位置和大小,是机器视觉领域的核心问题之一。由于各类物体有不同的外观,形状,姿态,加上成像时光照,遮挡等因素的干扰,目标检测一直是机器视觉领域最具有挑战性的问题。 计算机视觉中关于图像识别有四大类任务: 分类-Classification 定位-Location 检测-Detection 分割-Segmen...