《模糊系统与数学》
基于动态模糊聚类的数据挖掘研究以安徽城市综
地级城市的综合实力是推动地域发展的重要动力,分析其综合实力并进行相应解析,对研究我国地域经济具有重要意义,同时也可衡量城市的发展水平和发达程度[1]。城市综合实力聚类是对比城市间综合实力的一种常用方法,其要解决的关键问题是分析指标的选取和聚类方法的选择。国内外学者从不同角度对构建城市综合实力评价指标体系进行了许多研究,为本文的研究提供了有益借鉴。
聚类分析是数据挖掘研究领域中一个非常活跃的课题,就是将一组物理或抽象对象分组为类似对象组成的多个类的过程,使同类对象彼此类似,不同类对象彼此相异。如果分类数量已知成为静态聚类,在分析过程中获得类的数量则为动态聚类[2]。传统的聚类方法是基于经验或者简单的统计方法,聚类主观性强,效果不理想。其聚类方法一般都是硬划分,将对象进行严格区分,分类界限分明。而电子商务客户群具有多样性的特点,往往不能用某一严格界限对其进行具体类的划分,采用传统方法聚类不理想。模糊理论的出现为聚类提供新的思路,聚类思想由硬划分中的“要么属于,要么不属于”变化为“用属于程度来描述”[3]。客观事物之间没有一个截然区别的界限,不是严格分明的,是带有模糊性的,因此用模糊方法解决聚类问题必然更符合实际。模糊聚类结果不是说事物绝对地属于或不属于某类,而是指属于某类的程度有多大,其在聚类分析的基础上,引入“隶属度”来度量每个样本与各类的隶属程度,聚类结果比较科学合理。本文提出的动态模糊聚类应用于城市综合实力的分析,MATLAB仿真结果表明了该算法的可行性、有效性和优越性。
一、数据挖掘理论
随着大数据时代的到来,以云计算、大数据、移动互联网、智能终端、物联网为代表的新一代信息技术普及速度不断加快发展,使得数据的采集、存储、计算和分析能力得到的大幅度提升,传统的对于数据的查询、处理和统计分析已经不能满足于人们对于数据应用的需要,迫切希望能够对其进行更高层次的分析以便更好地利用这些数据,进而获取能指导未来行为的规律和模式,并提高企业、社会、组织和机构的效益以及效率。计算机处理数据的速度很快,但从海量数据中挖掘规律并不是简单的操作,因此需要有行之有效的分析算法来完成在数据中“沙里淘金”的过程,因此数据挖掘技术也就应运而生了。数据挖掘(Datamining)是知识发现(简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算科学有关,并通过统计、聚类分析、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标[4]。近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商业智能,生产控制,市场分析,工程设计和科学探索等。数据挖掘利用了来自如下一些领域的思想:(1) 来自统计学的抽样、估计和假设检验;(2)人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论;(3)模糊理论以及新型的灰色系统理论。数据挖掘也迅速地接纳了来自其他领域的思想,这些领域包括最优化、进化计算、信息论、信号处理、可视化和信息检索。分类、估算、预测、相关性分组或关联规则、聚类、图形图像分割,视频及音频检索等都属于数据挖掘研究。
数据挖掘技术已经在商业方面得到了广泛应用,根据顾客购买记录,使用序列模式挖掘顾客的消费变化,分析顾客的忠诚程度。电商平台基于用户的基本属性、购买能力、行为特征、兴趣爱好,使用数据挖掘技术构建客户画像,实现精准营销;在制造领域,数据挖掘技术可以在生产、装配、质检、维修等多个环节来帮助企业解决传统管理与技术难以的解决的问题。基于产品生产工艺流程和缺陷分析,找出生产过程影响生产质量的因素,从而通过重点改进相关环节及工艺,来提高企业的生产效率,保障产品质量。通过设备故障数据分析,发现影响设备故障的因素,提前进行故障预测,实现预测性设备检修维护。以及最优的设备装备方案、最佳产品生产工艺参数组合、产品质量分析与问题追溯。数据挖掘已经深入到生产制造的各个环节,是制造行业智能化转型的核心基础支撑;在电子政务应用方面,基于智慧交通、智慧政务、智慧旅游等多领域数据分析与挖掘技术应用的智慧城市建设,已经成为当今时代的主题。政府在城市规划中,通过对城市地理、气象等自然信息和经济、社会、文化、人口等人文社会信息的挖掘,可以为城市规划提供强大的决策支持,强化城市管理服务的科学性和前瞻性。大数据时代下的电子政务具备海量繁复的数据资源,而数据挖掘则是提升数据利用价值,为舆情管控、业务创新提供支撑的核心所在。数据挖掘在各领域的应用和重要性不胜枚举,应用相应算法对数据进行挖掘来指导工作提供决策依据,是目前各个领域备受关注的热点。
上一篇:浅谈计算机多媒体教学系统的组建与维护
下一篇:没有了