《中国人工智能学会通讯》——12.8 序列模式挖掘趋势展望
12.8 序列模式挖掘趋势展望 近年来,数据挖掘会议和期刊中将模式与统计结合成为较热门的研究方向[47-49] ,通过统计方法对数据模式进行剪枝、判断模式的“有趣性”成为热点。例如,Nakagawa 等人[50]提出基于统计的安全剪枝规则对数据模式进行剪枝;Tatti [47] 提出的基于概率的划分模型 , 可以根据所预测的“有趣性”对无间隔的频繁情景模式进行排序。此外,在数据库会议和期刊中,面....
《中国人工智能学会通讯》——12.7 序列模式挖掘近似算法
12.7 序列模式挖掘近似算法 数据中通常蕴含大量的频繁模式。确定性算法能够挖掘出所有频繁的模式,具有最高的准确性,但通常会花费大量计算时间,并且消耗大量内存。而序列模式挖掘近似算法是适应大数据的另一种方式。但是,近似算法所挖掘的结果中却存在着误差。因此,错误误差的估计通常是近似算法重点关注的对象。其中,Manku 等人[41]提出的 LCA(LowestCommon Ancestors)算法.....
《中国人工智能学会通讯》——12.6 增量序列模式挖掘
12.6 增量序列模式挖掘 在动态更新的流式数据中进行数据挖掘的需求由来已久[34] ,对于序列模式挖掘来说,当数据发生少量更新时对全体数据重新进行挖掘是不可取的。因此,一些增量序列挖掘算法被提出以适应不断增长的数据,这类算法在更新迅速的大数据中显得十分重要。 Parthasarathy 等人[35]提出的 ISM 增量序列模式挖掘算法,基于 SPADE 算法进行扩展,以最小的 I/O 和计算代....
《中国人工智能学会通讯》——12.5 并行序列模式挖掘
12.5 并行序列模式挖掘 早期的并行序列模式挖掘算法大多被用于解决算法效率低下的问题。因此,许多并行算法是由其串行版本改进得到。例如,Zaki [28] 扩展了由他自己提出的 SPADE 算法,提出了在内存共享框架下的并行算法 pSPADE。pSPADE 的并行性主要来源于对垂直格式数据库的划分,这种划分既可以横向也可以纵向,最终实现了并行。采用了相似策略的算法还有 Par-ASP [29] ....
《中国人工智能学会通讯》——12.4 基于模式增长的序列模式挖掘算法
12.4 基于模式增长的序列模式挖掘算法 FreeSpan [15] 和 PrefixSpan [22] 都是由 Han 和 Pei等人提出的基于模式增长的序列模式挖掘算法。它们都是基于频繁模式挖掘中的 FP-growth [23] 思想而被提出的。其中,FreeSpan 基于频繁项将数据库划分成若干投影子数据库,然后在各个子数据库中进行序列模式的挖掘。PrefixSpan 则优化了构建投影数据....
《中国人工智能学会通讯》——12.3 基于 Apriori 的序列模式挖掘算法
12.3 基于 Apriori 的序列模式挖掘算法 GSP(Generalized Sequential Patterns) [17] 是一种经典的序列模式挖掘算法,它直接从频繁模式挖掘的 Apriori 算法扩展而来。GSP 采用了水平的数据格式,通过生成候选序列及扫描数据库的方法逐层挖掘频繁序列模式。这里的水平数据格式指的是依然以序列作为主要的观察对象。此外,GSP 还采用了序列模式支持度的....
《中国人工智能学会通讯》——12.2 大数据环境下序列模式挖掘及应用
12.2 大数据环境下序列模式挖掘及应用 模式发现问题诞生于 1993 年[1] ,与分类、聚类和异常点检测并称为数据挖掘四大问题[2] 。它指的是从数据库找出频繁共现的“项”,被称为频繁模式。模式发现问题在数据挖掘领域地位重要,有大量关于模式发现的论文发表在重要数据挖掘、数据库会议。Google Scholar 记录的 Agrawal 等人[1]提出的经典模式发现算法 Apriori 的论文单....
《中国人工智能学会通讯》——11.56 情境感知的移动用户个性化偏好 挖掘方法
11.56 情境感知的移动用户个性化偏好 挖掘方法 近年来,随着移动产业的高速发展,智能手机、平板电脑等移动设备已经成为了人们最重要的社交娱乐和信息获取媒介。与此同时,这些新型的移动设备都配备了许多高性能的情境传感器,例如GPS、3D 加速及光学传感器等。这些情境传感器能够捕获到来自于移动用户的丰富情境数据,从而帮助实现一系列基于情境感知的移动服务。 这些情境信息和相应的用户活动记录,均可以被移....
《中国人工智能学会通讯》——8.44 基于用户缺陷报告挖掘软件缺陷
8.44 基于用户缺陷报告挖掘软件缺陷 缺陷报告是用户向软件开发者汇报软件使用过程中所遇故障的报告。该报告基于自然语言书写,记录了软件发生故障场景和症状等信息。通过分析软件缺陷报告,可以有效定位出导致该缺陷的程序代码,从而帮助程序员对其进行修复。 由于缺陷报告是终端用户通过自然语言书写,因此基于用户缺陷报告进行缺陷挖掘的关键在于如何建立缺陷报告与符合其功能描述的代码之间的联系。现有技术通常将程序....
《中国人工智能学会通讯》——8.43 基于缺陷标注挖掘软件缺陷
8.43 基于缺陷标注挖掘软件缺陷 除通过描述程序的正常模式以发现软件缺陷外,另一类有效的软件缺陷挖掘技术则是通过直接对带有人工缺陷标注的程序模块进行学习建模,建立从程序模块的特征表示到软件缺陷的映射关系,以预测给定程序模块的是否可能包含缺陷。 基于缺陷标注挖掘软件缺陷的一般流程如图 1所示。首先人工对软件源代码进行详细软件测试,获得每个模块的缺陷情况标注。然后,利用软件度量 (software....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。