文章 2024-05-30 来自:开发者社区

Python 机器学习算法交易实用指南(五)(1)

第十五章:词嵌入 在前两章中,我们应用了词袋模型将文本数据转换为数值格式。结果是稀疏的、固定长度的向量,表示文档在高维词空间中的位置。这允许评估文档的相似性,并创建特征来训练机器学习算法,分类文档的内容或评估其中表达的情感。然而,这些向量忽略了术语使用的上下文,因此,例如,包含相同单词的不同句子将被编码为相同的向量。 在本章中,我们将介绍一种替代类别的算法,它使用神经网络来学习个...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(四)(5)

Python 机器学习算法交易实用指南(四)(4)https://developer.aliyun.com/article/1523386 生成模型 狄利克雷分布在 LDA 主题模型中占据重要地位,该模型假设当作者将文章添加到一系列文档中时,存在以下生成过程: 根据主题概率随机混合一小部分共享主题 K 对于每个词语,根据文档-主题概率选择其中一个主题...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(四)(4)

Python 机器学习算法交易实用指南(四)(3)https://developer.aliyun.com/article/1523385 条件独立性假设 使得模型既可行又有理由称其为朴素的假设是,特征在结果条件下是独立的。为了说明,让我们对一个包含三个词Send money now的电子邮件进行分类,这样贝叶斯定理就变成了以下形式: 形式上,三个词条件独立的假...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(四)(3)

Python 机器学习算法交易实用指南(四)(2)https://developer.aliyun.com/article/1523384 从文本到标记 - NLP 管道 在本节中,我们将演示如何使用开源 Python 库spaCy构建 NLP 管道。textacy库构建在spaCy之上,并提供对spaCy属性和附加功能的简便访问。 有关以下代码示例、安装说明和额外详细信...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(四)(2)

Python 机器学习算法交易实用指南(四)(1)https://developer.aliyun.com/article/1523382 t-SNE t-分布随机邻域嵌入是由劳伦斯·范德马滕(Laurens van der Maaten)和杰夫·辛顿(Geoff Hinton)于 2010 年开发的获奖算法,用于检测高维数据中的模式。它采用概率、非线性方法来定位位于几个不同但相...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(四)(1)

第十二章:无监督学习 在第六章,机器学习流程中,我们讨论了无监督学习如何通过发现数据中的结构而增加价值,而无需一个指导搜索过程的结果变量,例如老师。这个任务与我们在过去几章中专注于的监督学习的设置形成对比。 当数据集只包含特征而没有结果的测量值,或者当我们想要提取与结果无关的信息时,无监督学习算法可以很有用。目标不是预测未来的结果,而是研究对解决另一个任务有用的数据的信息表示,包...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(三)(5)

Python 机器学习算法交易实用指南(三)(4)https://developer.aliyun.com/article/1523357 二阶损失函数近似 最重要的算法创新通过使用依赖于二阶导数的近似来降低评估损失函数的成本,类似于牛顿法找到稳定点。因此,在贪婪树扩展过程中评分潜在分割的速度相对于使用完整损失函数更快。 正如先前提到的,梯度提升模型是以增量方式训练的,其...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(三)(4)

Python 机器学习算法交易实用指南(三)(3)https://developer.aliyun.com/article/1523356 随机森林 决策树不仅因其透明度和可解释性而有用,而且是更强大的集成模型的基本构建模块,它将许多个体树与策略结合起来,以随机变化其设计,以解决前一节讨论的过拟合和高方差问题。 集成模型 集成学习涉及将多个机器学习模型组合成一个新...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(三)(3)

Python 机器学习算法交易实用指南(三)(2)https://developer.aliyun.com/article/1523355 收敛 我们可以随时间和它们的分布可视化样本,以检查结果的质量。下面的图表显示了初始 100 和额外的 100,000 个样本后的后验分布,并说明了收敛意味着多个链识别相同的分布。pm.trace_plot()函数也显示了样本的演变(更多信息请...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(三)(2)

Python 机器学习算法交易实用指南(三)(1)https://developer.aliyun.com/article/1523351 如何构建波动率预测模型 为资产收益序列开发波动率模型包括四个步骤: 基于 ACF 和 PACF 显示的序列依赖性构建金融时间序列的 ARMA 时间序列模型。 再次依靠残差序列的 ACF 和 PACF 检查模型的残...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

人工智能平台PAI

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等