文章 2021-10-29 来自:开发者社区

ML之K-means:基于K-means算法利用电影数据集实现对top 100 电影进行文档分类

输出结果实现代码# -*- coding: utf-8 -*-from __future__ import print_functionimport numpy as npimport pandas as pdimport nltkfrom bs4 import BeautifulSoupimport reimport osimport codecsfrom sklearn import fea....

ML之K-means:基于K-means算法利用电影数据集实现对top 100 电影进行文档分类
文章 2021-10-28 来自:开发者社区

ML之H-Clusters:基于H-Clusters算法利用电影数据集实现对top 100电影进行文档分类

输出结果先看输出结果实现代码# -*- coding: utf-8 -*-import numpy as npimport pandas as pdimport nltkfrom bs4 import BeautifulSoupimport reimport osimport codecsfrom sklearn import feature_extraction#import three li....

ML之H-Clusters:基于H-Clusters算法利用电影数据集实现对top 100电影进行文档分类
文章 2018-03-09 来自:开发者社区

深入内核丨12C 新特性之 TOP - N 频率柱状图原理和算法

在 Oracle 12c 当中,优化器的一个新特性就是提供了新类型的柱状图数据,Top - N 频率柱状图和混合柱状图。优化器利用它们可以更加高效、精确地计算执行计划代价,选择最优计划。这里将探究一下 Top - N 频率柱状图在什么情况下获得、以及它如何影响优化器的选择率的计算。12c 在线文档描述: Top - N 频率柱状图是频率柱状图的一个变种,它忽略了那些"非流行数据"(即出现频率低的....

文章 2018-01-12 来自:开发者社区

【AI TOP 10】今日头条首次公布算法;马云“认真考虑”在港上市;高通收购恩智浦获欧盟批准

产业要闻 阿里巴巴:马云称将“认真考虑”到香港上市 今日头条:首次公布算法原理 称并非一切交给机器 中国移动咪咕和科大讯飞联手推出首款全语音AI耳机 AI成为直播答题“作弊”工具 芯片史上最大收购案:高通收购恩智浦已获欧盟批准 比特大陆在瑞士成立分公司 索尼发布人工智能机器狗"aibo" 融资新闻 人工智能翻译平台Unbabel获微软、Salesforce等公司2300万美元融...

文章 2017-11-08 来自:开发者社区

Top K算法

应用场景:         搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。         假设目前有一千万个记录(这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个...

文章 2013-03-20 来自:开发者社区

海量数据处理的 Top K算法(问题) 小顶堆实现

  问题描述:有N(N>>10000)个整数,求出其中的前K个最大的数。(称作Top k或者Top 10)   问题分析:由于(1)输入的大量数据;(2)只要前K个,对整个输入数据的保存和排序是相当的不可取的。         可以利用数据结构的最小堆来处理该问题。         最小堆如图所示,对于每个非叶子节点的数值,一定不大于孩子节点的数值。这样可用含有K个节点的最小...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

智能搜索推荐

智能推荐(Artificial Intelligence Recommendation,简称AIRec)基于阿里巴巴大数据和人工智能技术,以及在电商、内容、直播、社交等领域的业务沉淀,为企业开发者提供场景化推荐服务、全链路推荐系统开发平台、工程引擎组件库等多种形式服务,助力在线业务增长。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等