文章 2024-05-30 来自:开发者社区

Python 机器学习算法交易实用指南(一)(5)

Python 机器学习算法交易实用指南(一)(4)https://developer.aliyun.com/article/1523719 数据的质量 数据集的质量是另一个重要的标准,因为它影响分析和货币化所需的工作量,以及它包含的预测信号的可靠性。质量方面包括数据频率和其可用历史长度、其所含信息的可靠性或准确性、它是否符合当前或潜在未来的法规,以及其使用的独家性。 法律...

文章 2024-05-30 来自:开发者社区

Python 机器学习算法交易实用指南(一)(4)

Python 机器学习算法交易实用指南(一)(3)https://developer.aliyun.com/article/1523718 建立基本数据时间序列 财务报表和附注数据集中的数据范围包括从主要财务报表(资产负债表、利润表、现金流量表、权益变动表和全面收益表)和这些报表的附注中提取的数字数据。该数据最早可追溯至 2009 年。 提取财务报表和附注数据集 ...

文章 2024-05-30 来自:开发者社区

Python 机器学习算法交易实用指南(五)(5)

Python 机器学习算法交易实用指南(五)(4)https://developer.aliyun.com/article/1523713 不做免费午餐 没有系统——计算机程序或人类——有基础可靠地预测新样本的结果,超出了它在训练期间观察到的范围之外。唯一的出路是具有一些额外的先验知识或做出超出训练样本范围的假设。我们从本书的第七章,线性模型 和 第八章,时间序列模型,到非线性集...

文章 2024-05-30 来自:开发者社区

Python 机器学习算法交易实用指南(五)(4)

Python 机器学习算法交易实用指南(五)(3)https://developer.aliyun.com/article/1523712 第十六章:下一步 本书的目标是使您能够将机器学习(ML)应用于各种数据源,并提取对投资策略的设计和执行有用的信号。为此,我们将机器学习介绍为交易策略过程的重要组成部分。我们看到,机器学习可以在设计、测试、执行和评估策略的多个步骤中添加价值。 ...

文章 2024-05-30 来自:开发者社区

Python 机器学习算法交易实用指南(五)(3)

Python 机器学习算法交易实用指南(五)(2)https://developer.aliyun.com/article/1523711 使用 Doc2vec 进行情感分析 文本分类需要组合多个词嵌入。一个常见的方法是对文档中每个词的嵌入向量进行平均。这使用所有嵌入的信息,并有效地使用向量加法来到达嵌入空间中的不同位置。但是,有关单词顺序的相关信息会丢失。 相比之下,用...

文章 2024-05-30 来自:开发者社区

Python 机器学习算法交易实用指南(五)(2)

Python 机器学习算法交易实用指南(五)(1)https://developer.aliyun.com/article/1523710 如何训练自己的单词向量嵌入 许多任务需要嵌入或特定领域的词汇,而基于通用语料库的预训练模型可能无法很好地或根本无法表示。标准 Word2vec 模型无法为词汇表中不存在的单词分配向量,而是使用降低其预测价值的默认向量。 例如,在处理行...

文章 2024-05-30 来自:开发者社区

Python 机器学习算法交易实用指南(五)(1)

第十五章:词嵌入 在前两章中,我们应用了词袋模型将文本数据转换为数值格式。结果是稀疏的、固定长度的向量,表示文档在高维词空间中的位置。这允许评估文档的相似性,并创建特征来训练机器学习算法,分类文档的内容或评估其中表达的情感。然而,这些向量忽略了术语使用的上下文,因此,例如,包含相同单词的不同句子将被编码为相同的向量。 在本章中,我们将介绍一种替代类别的算法,它使用神经网络来学习个...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(四)(5)

Python 机器学习算法交易实用指南(四)(4)https://developer.aliyun.com/article/1523386 生成模型 狄利克雷分布在 LDA 主题模型中占据重要地位,该模型假设当作者将文章添加到一系列文档中时,存在以下生成过程: 根据主题概率随机混合一小部分共享主题 K 对于每个词语,根据文档-主题概率选择其中一个主题...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(四)(4)

Python 机器学习算法交易实用指南(四)(3)https://developer.aliyun.com/article/1523385 条件独立性假设 使得模型既可行又有理由称其为朴素的假设是,特征在结果条件下是独立的。为了说明,让我们对一个包含三个词Send money now的电子邮件进行分类,这样贝叶斯定理就变成了以下形式: 形式上,三个词条件独立的假...

文章 2024-05-29 来自:开发者社区

Python 机器学习算法交易实用指南(四)(3)

Python 机器学习算法交易实用指南(四)(2)https://developer.aliyun.com/article/1523384 从文本到标记 - NLP 管道 在本节中,我们将演示如何使用开源 Python 库spaCy构建 NLP 管道。textacy库构建在spaCy之上,并提供对spaCy属性和附加功能的简便访问。 有关以下代码示例、安装说明和额外详细信...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问