基于语义关联性特征融合的大数据挖掘方法

米捷 刘道华

引用本文: 米捷, 刘道华. 基于语义关联性特征融合的大数据挖掘方法[J]. 信阳师范学院学报(自然科学版), 2019, 32(1): 141-145.   doi: 10.3969/j.issn.1003-0972.2019.01.025 shu
Citation:  MI Jie and LIU Daohua. Large Data Mining Method Based on Semantic Correlation Feature Fusion[J]. Journal of Xinyang Normal University (Natural Science Edition), 2019, 32(1): 141-145.   doi: 10.3969/j.issn.1003-0972.2019.01.025 shu

基于语义关联性特征融合的大数据挖掘方法

    作者简介: 米捷(1981-),女,河南郑州人,讲师,硕士,主要研究方向为计算机应用与图像处理.;
  • 基金项目: 国家自然科学基金项目(31872704);河南省重点研发与推广专项资助项目(182102210537);河南省高等学校重点项目(17A520025,19A520035);河南省教学改革资助项目(2017SJGLX389)

  • 中图分类号: TP391

摘要: 提出一种基于语义关联性特征融合的大数据挖掘算法.对云存储大数据分布式信息流进行高维相空间重构,在重构的相空间中提取大数据的语义关联维特征量,以提取的特征量为测试集进行自适应学习训练.采用模糊C均值算法进行大数据语义关联特征的稀疏性融合和聚类处理,在聚类中心实现对挖掘目标数据的指向性聚敛,输出数据挖掘结果,并采用特征压缩器进行降维处理,降低计算开销.仿真结果表明,采用该方法进行大数据挖掘的特征提取准确性较好,挖掘数据的聚类能力较强,在实时性和准确性方面具有优势.

English

    1. [1]

      MORADI M, KEYVANPOUR M R. An analytical review of XML association rules mining[J]. Artificial Intelligence Review, 2015, 43(2):277-300.

    2. [2]

      DONG G L, RYU K S, BASHIR M, et al. Discovering medical knowledge using association rule mining in young adults with acute myocardial infarction[J]. Journal of Medical Systems, 2013, 37(2):1-10.

    3. [3]

      曹玖新, 陈高君, 吴江林, 等. 基于多维特征分析的社交网络意见领袖挖掘[J]. 电子学报, 2016, 44(4):898-905.
      CAO Jiuxin, CHEN Gaojun, WU Jianglin, et al. Multi-feature based opinion leader mining in social networks[J]. Chinese Journal of Electronics, 2016, 44(4):898-905.

    4. [4]

      邢淑凝, 刘方爱, 赵晓晖. 基于聚类划分的高效用模式并行挖掘算法[J]. 计算机应用, 2016, 36(8):2202-2206.
      XING Shuning, LIU Fang'ai, ZHAO Xiaohui. Parallel high utility pattern mining algorithm based on cluster partition[J]. Journal of Computer Applications, 2016, 36(8):2202-2206.

    5. [5]

      米捷, 张鹏,于海鹏. 粒子群差分扰动优化的聚类算法研究[J].河南工程学院学报(自然科学版),2016,28(1):63-68. MI Jie, ZHANG Peng, YU Haipeng. Large data clustering algorithm based on particle swarm differential perturbation optimization[J]. Journal of Henan University of Engineering (Natural Science Edition), 2016, 28(1):63-68.

    6. [6]

      赵学健,孙知信,袁源. 基于预判筛选的高效关联规则挖掘算法[J]. 电子与信息学报, 2016, 38(7):1654-1659.
      ZHAO Xuejian, SUN Zhixin, YUAN Yuan. An efficient association rule mining algorithm based on prejudging and screening[J]. Journal of Electronics & Information Technology, 2016, 38(7):1654-1659.

    7. [7]

      陆兴华,陈平华.基于定量递归联合熵特征重构的缓冲区流量预测算法[J].计算机科学,2015, 42(4):68-71.
      LU Xinghua, CHEN Pinghua. Traffic prediction algorithm in buffer based on recurrence quantification union entropy feature reconstruction[J]. Computer Science, 2015, 42(4):68-71.

    8. [8]

      徐工,程效军.基于小波技术的散乱点云自适应压缩算法[J].同济大学学报(自然科学版),2013, 41(11):1738-1743.XU Gong, CHENG Xiaojun. Adaptive reduction algorithm of scattered point clouds based on wavelet technology[J]. Journal of Tongji University (Natural Science), 2013, 41(11):1738-1743.

    9. [9]

      CZIBULA G, MARIAN Z, CZIBULA I G. Detecting software design defects using relational association rule mining[J]. Knowledge and Information Systems, 2015, 42(3):545-577.

    1. [1]

      米捷黄俊 . 基于定量递归特征提取的流量监测方法. 信阳师范学院学报(自然科学版), 2016, 29(3): 456-460. doi: 10.3969/j.issn.1003-0972.2016.03.034

    2. [2]

      吕康孟慧丽马媛媛 . 基于粒计算的超市会员数据的聚类算法. 信阳师范学院学报(自然科学版), 2014, 27(2): 284-287. doi: 10.3969/j.issn.1003-0972.2014.02.030

    3. [3]

      居桦奚斌雷自力 . 基于三维零件特征提取的装配过程质量缺陷率预测. 信阳师范学院学报(自然科学版), 2011, 24(3): 337-341.

    4. [4]

      李艳灵李刚 . 基于蚁群算法和粗糙集的信息融合教学评价. 信阳师范学院学报(自然科学版), 2009, 22(4): 624-626.

    5. [5]

      李艳灵魏涛 . 基于轮廓波变换的模糊聚类图像分割. 信阳师范学院学报(自然科学版), 2011, 24(3): 405-409.

    6. [6]

      刘宏兵周文勇郭振 . 基于模糊关系传递闭包的聚类方法. 信阳师范学院学报(自然科学版), 2008, 21(1): 144-146.

    7. [7]

      郭淑红雷梁 . 基于聚类的Web用户访问模式的算法研究. 信阳师范学院学报(自然科学版), 2009, 22(1): 137-141.

    8. [8]

      陈良琼 . 基于最大Lyapunov指数的公路沉降预测. 信阳师范学院学报(自然科学版), 2017, 30(4): 647-650. doi: 10.3969/j.issn.1003-0972.2017.04.029

    9. [9]

      苏晓珂虎晓红兰洋 . 基于内容的图像检索技术综述. 信阳师范学院学报(自然科学版), 2005, 18(4): 478-481.

    10. [10]

      赵亮程林敏彭喜科 . 铝合金铸件胶片计算机自动识别方法. 信阳师范学院学报(自然科学版), 2003, 16(2): 225-227.

    11. [11]

      张钰莎蒋盛益 . Clementine软件功能缺陷分析. 信阳师范学院学报(自然科学版), 2015, 28(3): 450-453. doi: 10.3969/j.issn.1003-0972.2015.03.035

    12. [12]

      李为华苏辉郭华平 . 融合多特征和谱聚类集成的图像分割方法. 信阳师范学院学报(自然科学版), 2017, 30(4): 638-641. doi: 10.3969/j.issn.1003-0972.2017.04.027

    13. [13]

      张艳青 . 网络信息计量的数据挖掘技术研究. 信阳师范学院学报(自然科学版), 2007, 20(4): 531-534.

    14. [14]

      牛继强刘明华徐丰 . 基于空间数据挖掘的土地用途分区系统. 信阳师范学院学报(自然科学版), 2012, 25(3): 382-386.

    15. [15]

      陈希兰安军熊康宁廖建军 . 基于多源遥感数据的石漠化信息提取研究. 信阳师范学院学报(自然科学版), 2018, 31(3): 437-442. doi: 10.3969/j.issn.1003-0972.2018.03.018

    16. [16]

      李莉李运娣 . 基于路由协议的低能耗数据融合方法. 信阳师范学院学报(自然科学版), 2013, 26(2): 292-295.

    17. [17]

      郭颂柳春华周明林 . 语义Web服务组合实现框架研究. 信阳师范学院学报(自然科学版), 2011, 24(4): 536-540.

    18. [18]

      李永仪 . 付氏光学中的相空间方法. 信阳师范学院学报(自然科学版), 1987, 0(1): 19-24. doi: 10.3969/j.issn.1003-0972.(1987)01-0019-06

    19. [19]

      朱长水袁宝华曹红根袁红星 . LPQ与NMF特征融合的人脸识别. 信阳师范学院学报(自然科学版), 2013, 26(1): 133-135.

    20. [20]

      李卓凡牛继强王浩闫军辉张婷婷 . 淮河流域干旱灾害空间格局重构. 信阳师范学院学报(自然科学版), 2017, 30(4): 582-586. doi: 10.3969/j.issn.1003-0972.2017.04.015

  • 加载中
计量
  • 文章访问数:  317
  • PDF下载量:  6
  • 引证文献数: 0
文章相关
  • 收稿日期:  2017-11-14
  • 录用日期:  2018-03-12
通讯作者: 陈斌, bchen63@163.com
  • 1. 

    沈阳化工大学材料科学与工程学院 沈阳 110142

  1. 本站搜索
  2. 百度学术搜索
  3. 万方数据库搜索
  4. CNKI搜索

基于语义关联性特征融合的大数据挖掘方法

    作者简介:米捷(1981-),女,河南郑州人,讲师,硕士,主要研究方向为计算机应用与图像处理.
  • 1. 河南工程学院 计算机学院, 河南 郑州 451191;
  • 2. 信阳师范学院 计算机与信息技术学院, 河南 信阳 464000
基金项目:  国家自然科学基金项目(31872704);河南省重点研发与推广专项资助项目(182102210537);河南省高等学校重点项目(17A520025,19A520035);河南省教学改革资助项目(2017SJGLX389)

摘要: 提出一种基于语义关联性特征融合的大数据挖掘算法.对云存储大数据分布式信息流进行高维相空间重构,在重构的相空间中提取大数据的语义关联维特征量,以提取的特征量为测试集进行自适应学习训练.采用模糊C均值算法进行大数据语义关联特征的稀疏性融合和聚类处理,在聚类中心实现对挖掘目标数据的指向性聚敛,输出数据挖掘结果,并采用特征压缩器进行降维处理,降低计算开销.仿真结果表明,采用该方法进行大数据挖掘的特征提取准确性较好,挖掘数据的聚类能力较强,在实时性和准确性方面具有优势.

English Abstract

    全文HTML

参考文献 (9) 相关文章 (20)

目录

/

返回文章

本系统由 北京仁和汇智信息技术有限公司 开发 技术支持: info@rhhz.net   百度统计