文章 2022-02-10 来自:开发者社区

阿里云PAI Studio Python脚本组件使用Quick Start

Step By Step1、界面组件拖拽与配置2、Python 组件相关配置3、运行测试4、日志查看一、界面组件拖拽与配置1.1 Designer控制台创建工作流1.2 分别拖拽读数据表组件和Python脚本组件到画布二、组件相关配置2.1 DataWorks数据开放控制台创建数据表并导入数据脚本:CREATE TABLE `lm_test_input_1` ( `value` bigi...

阿里云PAI Studio Python脚本组件使用Quick Start
文章 2022-01-21 来自:开发者社区

15 年老兵谈阿里云大规模机器学习实践

  近年来,机器学习技术的发展归因于我们有极其庞大的数据用来训练算法。当企业需要落地大规模机器学习时,往往会面临很多难题,如何解决这些问题?如何系统了解大规模机器学习落地的技巧?其适用场景是什么?InfoQ 希望通过该选题解决这些问题,并推动企业在大规模机器学习方面的实践。本文,InfoQ 有幸采访了阿里云机器学习研究员林伟,听他分享自己的经验和见解。  15 年老兵谈阿里云大规模机器学习实践 ....

文章 2022-01-21 来自:开发者社区

阿里云天池大赛赛题解析——机器学习篇-赛题一(7)

2.2.4 可视化数据分布       下面以可视化方式对数据特征、数据分布等进行探索分析。1. 箱形图       首先绘制训练集中特征变量V0 的箱形图:fig = plt.figure(figsize=(4, 6)) # 指定绘图对象的宽度和高度sns.boxplot(train_data['V0'],orient="v", wi....

阿里云天池大赛赛题解析——机器学习篇-赛题一(7)
文章 2022-01-20 来自:开发者社区

阿里云天池大赛赛题解析——机器学习篇-赛题一(6)

2.2 赛题数据探索2.2.1 导入工具包       先要导入一些Python 工具包,用于数据计算和可视化显示。import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom scipy import statsimport warning....

阿里云天池大赛赛题解析——机器学习篇-赛题一(6)
文章 2022-01-19 来自:开发者社区

阿里云天池大赛赛题解析——机器学习篇-赛题一(5)

2.1.5 变量转换1. 变量转换的目的       在使用直方图、核密度估计等工具对特征分布进行分析的过程中,我们可能会发现一些变量的取值分布不平均,这将会极大影响估计。为此,我们需要对变量的取值区间等进行转换,使其分布落在合理的区间内。       如图1-2-11 所示,经过对数变换减轻了数据大量聚集在左侧的情况,其分布也更加趋于....

阿里云天池大赛赛题解析——机器学习篇-赛题一(5)
文章 2022-01-18 来自:开发者社区

阿里云天池大赛赛题解析——机器学习篇-赛题一(4)

2.1.3 缺失值处理1. 缺失值的产生原因和分类       缺失值的产生原因多种多样,主要分为机械原因和人为原因。机械原因是由机械导致的数据缺失,比如数据存储的失败、存储器损坏、机械故障导致某段时间的数据未能收集(对于定时数据采集而言)。人为原因是由人的主观失误、历史局限或有意隐瞒造成的数据缺失。比如,在市场调查中被访人拒绝透露相关问题的答案,或者回答的问题是无....

阿里云天池大赛赛题解析——机器学习篇-赛题一(4)
问答 2022-01-17 来自:开发者社区

阿里云PAI平台可以直接调用R或者Mahout生成的模型吗?

阿里云PAI平台可以直接调用R或者Mahout生成的模型吗?

文章 2022-01-17 来自:开发者社区

阿里云天池大赛赛题解析——机器学习篇-赛题一(3)

2 数 据 探 索2.1 理论知识2.1.1 变量识别       变量识别就是对数据从变量类型、数据类型等方面进行分析。举个例子,数据如表1-2-1所示:表1-2-1       我们可以从以下方面对其进行变量识别:1. 输入变量与输出变量       输入变量(也称为“predictor”或“特征”)有....

阿里云天池大赛赛题解析——机器学习篇-赛题一(3)
文章 2022-01-17 来自:开发者社区

阿里云天池大赛赛题解析——机器学习篇-赛题一(2)

1.4 评估指标1.5 赛题模型       在赛题分析中,很重要的一点就是要根据赛题的特点和目标明确问题的类型,并选择合适的模型。在机器学习中,根据问题类型的不同,常用的模型包括回归预测模型和分类预测模型。1. 回归预测模型       回归预测模型的预测结果是一个连续值域上的任意值,回归可以具有实值或离散的输入变量。我们通常把多个输....

阿里云天池大赛赛题解析——机器学习篇-赛题一(2)
文章 2022-01-17 来自:开发者社区

阿里云天池大赛赛题解析——机器学习篇-赛题一(1)

赛题一 工业蒸汽量预测1 赛 题 理 解1.1 赛题背景       火力发电的基本原理是燃料在燃烧时加热水生成蒸汽,蒸汽产生的压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的燃烧效率,即燃料燃烧加热水产生高温、高压的蒸汽。影响锅炉燃烧效率的因素很多,包括锅炉的可调参数,如燃烧给量、一二次风、引风、返料风、给....

阿里云天池大赛赛题解析——机器学习篇-赛题一(1)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

人工智能平台PAI

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

+关注