多因子模型的因子分组-聚类分析

news/2024/5/17 12:51:12

优质博文:IT-BLOG-CN

在这里插入图片描述

之前我们已经介绍了简单、高效的克隆巴赫α系数和科学有效的主成分分析对因子进行分组,我们将继续介绍一种复杂的方法----聚类分析(Cluster Analysis)。

聚类分析根据多个因子某一方面的相似性进行归类,使类内因子的同质性最多化同时使类间因子的异质性最多化。聚类分析的核心概念为—距离。但是,当因子维度较多时,聚类分析的计算量会比较多而且不太稳定,因此对于多维度因子进行聚类分析之前,一般先使用之前我们讲过的因子分析或者主成分分析对因子进行降维处理。聚类分析相较于克隆巴赫α系数和主成分分析,有以下三个优点:

聚类分析是一种非线性的分析方法;

聚类分析进行因子分组时,不需要我们去计算分组的因子权重;

聚类分析相较于克隆巴赫α系数和主成分分析,对于因子分组更加细致准确,能够较多幅度提升多因子模型的有效性和准确性。
聚类分析主要有以下4个步骤:
【1】因子预处理;
【2】为衡量因子点间的相似度定义一个距离函数;
【3】聚类或分组;
【4】评估输出。

因子预处理包括选择因子数量,因子类型和因子特征的标度,它主要依赖因子的特征选择和特征抽取。因子特征选择是选择重要的特征,特征抽取把输入的特征转化为一个新的显著特征,它们经常被用来获取一个合适的特征集来避免“维数灾”进行聚类。因子预处理还包括将孤立因子移出,因为孤立因子经常会导致有偏差的聚类结果,因此为了得到正确的聚类,我们必须将它们剔除。

由于类同质性是定义一个类的基础,那么不同因子之间在同一个特征空间相似度的衡量对于聚类步骤是很重要的,由于特征类型和特征标度的多样性,距离度量必须谨慎,它经常依赖于应用,例如,通过定义在特征空间的距离度量来评估不同对象的异质性,很多距离度量都应用在一些不同的领域,一个简单的距离度量,如Euclidean距离,经常被用作反映不同因子间的异质性,一些有关同质性的度量,例如PMC和SMC,能够被用来特征化不同因子的概念同质性。

聚类或分组同样是一个很重要的步骤,因子基于不同的方法被分到不同的类中。划分方法和层次方法是聚类分析的两个主要方法,划分方法一般从初始划分和最优化一个聚类标准开始。Crisp Clustering和Fuzzy Clusterin是划分方法的两个主要技术,划分方法聚类是基于某个标准产生一个嵌套的划分系列,它可以度量不同类之间的同质性或一个类的异质性用来合并和分裂类。层次方法聚类是创建一个层次以分解给定的因子集合。

评估聚类结果的质量是最后一个重要的阶段,聚类是一个无管理的程序,也没有客观的标准来评价聚类结果,它一般通过一个类有效索引来评价,一般来说,几何性质,包括类间的分离和类内部的耦合,一般都被用来评价聚类结果的质量,类有效索引在决定类的数目时经常扮演了一个重要角色,类有效索引的最佳值被期望从真实的类数目中获取,取个通常的决定类数目的方法是选择一个特定的类有效索引的最佳值,这个索引能否真实的得出类的数目是判断该索引是否有效的标准,很多已经存在的标准对于相互分离的类因子集合都能得出很好的结果,但是对于复杂的数据集,却通常行不通。

聚类分析通常根据交易员或者策略开发人员的直觉和交易经验对参数进行预判,从而得到一个经典因子分组模型。近年来,越来越多的交易员运用强大的计算机技术,通过上千次上万次地模拟测试来得到最优最稳定的聚类分析参数训置。这是一种机器学习的思想,并且这种思想的融入通过实践证明能够很好的规避人为因素造成的偏差。


http://www.mrgr.cn/p/07021887

相关文章

JMeter下载与环境配置

前置 使用JMeter前需要先配置好Java的环境变量,不会的朋友可以阅读:https://www.cnblogs.com/test-gang/p/18144441 JMeter下载 JMeter官网:https://jmeter.apache.org/ 进入官网后,点击左边Download Releases进入Download Releases,页面会展示两种版本Source 是源代码版,…

DbMigrator迁移数据库报错:The ConnectionString property has not been initialized.

问题 执行.DbMigrator时报错:The ConnectionString property has not been initialized.原因 情况一 DbContext中没有指定连接字符串 解决方案情况二 appsettings.json 配置文件的属性没有设置为始终复制 解决方案 右键appsettings.json选择属性>复制到输出目录选择始终复制…

矩阵求导(一)

前言 在大学的微积分课程中,我们学习过关于标量函数的导数。但是当我们求解一个多元函数的极值时,单独一个自变量的偏导数往往不能告诉我们太多信息,于是我们有一种天然的想法是要把每个自变量的偏导数放在一起,看看他们的联合效果如何。这个过程其实是一个向量求导的过程。…

HTTP/HTTPS详解

HTTP/HTTPS详解 1. HTTP1.1 HTTP基础知识1.2 HTTP建立和断开连接 2. HTTPS 1. HTTP 1.1 HTTP基础知识 HTTP是互联网上应用最为广泛的一种网络协议,是一个客户端和服务器端请求和应答的标准(TCP),用 于从WWW服务器传输超文本到本…

他来了他来了,.net开源智能家居之苹果HomeKit的c#原生sdk【Homekit.Net】1.0.0发布,快来打造你的私人智能家居吧

背景介绍 hi 大家好,我是三合,作为一个非著名懒人,每天上完班回到家,瘫在沙发上一动都不想动,去开个灯我都嫌累,此时,智能家居拯救了我,只需要在手机点点点,开关灯,空调,窗帘就都搞定了,一开始我用的是开源的home assistan,俗称HA,搭配上hass-xiaomi-miot以及hap…

hbase-2.2.7分布式搭建

一、下载上传解压 1.在官网或者云镜像网站下载jar包 华为云镜像站:Index of apache-local/hbase/2.2.7 2.上传到linux并解压 tar -zxvf hbase-2.2.7-bin.tar.gz -C /usr/locol/soft 二、配置环境变量 1. vim /etc/profile export HBASE_HOME/usr/local/soft/h…

如何在 Netlify 上手动部署 React 和 TypeScript 项目

在本教程中,我将教你如何使用 Vite 在 Netlify 上手动部署 React 和 TypeScript 项目。我将向你展示一些快速简单的步骤,让你的项目能够立即运行。 要跟着本教程操作,有几个先决条件:一个现有的 React 和 TypeScript 项目,使用 Vite 构建,并且你想要部署它。 Visual Stud…

nexus 配置 docker-ce yum 源

环境说明服务 ip 端口 备注nexus 192.168.80.129 (内网) 8081 内网地址无法访问外网centos7.9192.168.80.133 安装docker服务nginx192.168.80.128 (内网) 192.168.174.126 (外网) 88 19000192.168.174.126 地址可以访问外网创建 Blob Stores创建 Repositoriesnginx 配置 server…

vscode按ctrl+鼠标左键没反应

vscode按ctrl鼠标左键没反应 问题问题解决 问题 新买的阿里云服务器,在连接vscode后,按ctrl鼠标左键没反应,怎么办? 问题解决 你没有在vscode上安装c的相关插件,安装之后才可以实现按ctrl鼠标左键跳转到函数的定义

.NET 爬虫从入门到入狱

目录 前言 1.💡使用HttpClient爬取数据 2.🚀模拟User-Agent 3.🤵使用HTML解析库 3.👌前端Price显示 4.🌱运行实例 获取金价Au 5.🧾使用正则表达式解析 6.💫获取BTC价格 7.✨获取CSDN热点…

探索Go语言中的高效IO操作技巧

探索Go语言中的高效IO操作技巧 原创 Go大神 Go大神 2024-04-18 09:35 浙江 听全文一、打开和关闭文件os.Open()函数能够打开一个文件,返回一个*File和一个err。对得到的文件实例调用close()方法能够关闭文件。为了防止文件忘记关闭,我们通常使用defer注册文件关闭语句package…

公网IP多少钱可以购买?

公网IP是指可以在全球范围内访问和识别的唯一IP地址。对于许多企业和个人用户来说,公网IP是实现远程访问、搭建服务器、建立安全连接等重要需求的基础。公网IP的获取并不是免费的,并且价格因供应商和地区而异。 现有公网IP市场 当前,市场上有…

Idea修改【Help->Edit Custom VM Options...】后,导致idea无法正常启动的解决方法

一、错误场景: 二、解决方法: 修改文件路径:C:\Users\tianjm(写自己的用户名)\AppData\Roaming\JetBrains\IdeaIC2024.1(选自己安装的版本)

如何在浏览器Web前端在线编辑PPT幻灯片?

有时候在项目中我们会遇到需要在网页在线打开并编辑PPT文档保存到本地或者服务器指定位置,猿大师办公助手可以很方便的调用本机Office实现在网页上编辑PPT幻灯片,效果与本机Office打开PPT完全一样。 猿大师办公助手支持完整嵌入模式,也就是本…

Mac电脑版鼠标连点工具 RapidClick for Mac

RapidClick for Mac是一款方便实用的自动点击工具,可以帮助Mac用户在使用电脑时轻松、快速地进行鼠标操作。它可以模拟人类手指点击的动作,让您的鼠标点击变得更加快捷高效,大大提升了工作和游戏的效率。 RapidClick for Macv1.5.1激活版下载…

互联网技术底蕴探究 | 联网通信原理精析与网络协议通信机制

联网通信原理精析与网络协议入门导览 前提介绍网络网络结构与节点网络应用Sun公司的Jini技术 网络设备网卡(Netword Card)以太网卡 路由器(Router)处理数据模式安全控制访问 集线器(Hub)网关(Ga…

Elastic学习之旅 (11) .NET 6应用集成ES - 上

有了前面10篇的基础,我们大概清楚了ES的基本概念和使用(主要是查询),这也是我们作为Developer应该了解的范畴,而至于更深入的聚合分析、运维管理就不在本系列的范畴中。有童鞋说,讲讲如何在.NET应用中集成和使用ES吧,额,这个其实网上也有很多教程了。不过你既然提了,那…

初识集合框架

前言~🥳🎉🎉🎉 hellohello~,大家好💕💕,这里是E绵绵呀✋✋ ,如果觉得这篇文章还不错的话还请点赞❤️❤️收藏💞 💞 关注💥&#x1f…

JS中的变量和数据类型及用户输入详解

源码 variate.html<!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title> </he…