陈小军

个人简介

陈小军,出生于1981年。2011年获得哈尔滨工业大学博士学位。2008年-2009年,在香港大学电子商务科技研究所(ETI)作研究助理。012年加入中科院深圳先进技术研究院,在深圳市高性能数据挖掘重点实验室从事大数据挖掘相关研究工作。2013年加入深圳大学计算机与软件学院,任职讲师。 2006-2007参与AlphaMiner数据挖掘开源系统(www.alphaminer.org)的开发,领导开发了AlphaMiner 1.1-2.5版本,已经成为国际上重要的数据挖掘开源软件,被国内外许多大学和公司采用。2010年起,领导开发AlphaMiner云版本,首次实现了AlphaMiner与著名云计算平台Hadoop的无缝对接,并在2010年和2011年高交会予以展示。2013年研发了包含超过10个支持TB级大数据挖掘的分布式数据挖掘算法库。2012年作为主要参与人参与中科院战略先导专项中的一个课题“海云数据系统关键技术研究与系统研制”。2013年获批自然科学基金青年基金项目“面向TB级大数据的分布式属性分层加权子空间聚类集成方法研究”。

教育经历

2004-2011,哈尔滨工业大学,计算机科学与技术。

2000-2004, 哈尔滨工业大学,机械设计制造及其自动化


工作经历

2008年-2009年,香港大学电子商务科技研究所(ETI),研究助理; 2010年-2012年2月,中科院深圳先进技术研究院,客座学生; 2012年2月-2013年10月,中科院深圳先进技术研究院,深圳市高性能数据挖掘重点实验室,助理研究员; 2013年10月-至今,深圳大学,计算机与软件学院,讲师。

研究方向

特征选择 聚类 随机森林 分布式数据挖掘

其他

代表性论文

[1] Xiaojun Chen, Joshua Zhexue Huang and Jun Luo. PurTreeClust: A Purchase Tree Clustering Algorithm for Large-scale Customer Transaction Data. ICDE 2016.

[3] Yeshou Cai, Xiaojun Chen, Patrick Xiaogang Peng and Joshua Zhexue Huang. A LDA Feature Grouping Method for Subspace Clustering of Text Data. PAKDD PAISI 2014: 78-90.

[4] Xiaojun Chen, Xiaofei Xu, Yunming Ye and Joshua Zhexue Huang. TW-k-means: Automated Two-level Variable Weighting Clustering Algorithm for Multi-view Data. IEEE Transactions on Knowledge and Data Engineering, 2013, 25(4): 932-944.

[4] Xiaojun Chen, Yunming Ye, Xiaofei Xu and Joshua Zhexue Huang. A Feature Group Weighting Method for Subspace Clustering of High-Dimensional Data. Pattern Recognition, 2012, 45(1): 434-446.

[5] 黄哲学,曹付元,李俊杰,陈小军. 大数据分析的机遇与挑战. 网络新媒体技术, 2012, 1(6): 20-26.

[6] Xiaojun Chen, Yunming Ye, Graham Williams and Xiaofei Xu. A Survey of Open Source Data Mining Systems. PAKDD 2007 industrial track workshop: 3-14.

[7] Bingguo Li, Xiaojun Chen, Mark Junjie Li, Zhexue Joshua Huang and Shengzhong Feng. Scalable Random Forests for Massive Data. PAKDD 2012, 7301: 135-146.

[8] Baoxun Xu, Junjie Li, Qiang Wang and Xiaojun Chen. A Tree Selection Model for Improved Random Forest. In: 3th International Conference on Knowledge Discovery, 2011: 382-386.

[9] Shuang Wang, Xiaojun Chen, Joshua Zhexue Huang and Shengzhong Feng. Scalable Subspace Logistic Regression Models for High Dimensional Data. APWeb 2012, 7235: 685-694.

[10] Qizhen Huang, Xiaojun Chen, Joshua Zhexue Huang, Shengzhong Feng and Jianping Fan. Scalable Ensemble Information-Theoretic Co-clustering for Massive Data. In Proceedings of International MultiConference of Engineers and Computer Scientists 2012, 2012, I: 563-568.

[11] Yunming Ye, Joshua Huang, Xiaojun Chen, Shuigeng Zhou, Graham Williams and Xiaofei Xu. Neighborhood Density Method for Selecting Initial Cluster Centers in K-means Clustering. PAKDD 2006, 3918:189-198.

科研成果

国家自然科学基金“面向TB 级大数据的分布式属性分层加权子空间聚类集成方法研究”,2014-2016

专利:

[1] 张媛,陈小军,黄哲学。一种基于位置信息的移动互联网用户行为分析方法及装置。

[2] 张媛,董师师,陈小军。一种自动图文主题分析方法。

[3] 董师师,陈小军,黄哲学。 一种基于移动终端的上网数据分析与预测的方法。

[4] 范成林,陈小军,黄哲学。 一种提高随机森林在线分类速度和模型可理解性的方法.。ASP12114228SZ,2012。

[5] 黄哲学,扎拉玛,李俊杰,陈小军,王强。 分类器构建方法和系统。ASP12110266SZ, 2012。

社会兼职

1. 国际会议PAKDD 2013 program committee member;

2. 国际会议PAKDD审稿人

3. 国际期刊审稿人:

a) IEEE Transactions on Neural Networks and Learning System

b) IEEE Transactions on Knowledge and Data Engineering

c) Pattern Recognition

d) Machine Learning

e) Knowledge and Information Systems

f) Journal of Classification


博士生导师

  • 黄哲学

    黄哲学

    黄哲学,瑞典皇家理工学院博士、深圳大学特聘教授、博士生导师,深圳大学大数据技术与应用研究所所长、大数据系统计算技术国家工程实验室副主任,首批广东省领军人才、深圳孔雀计划高层次人才,斯坦福大学全球“终身科学影响力排行榜”前2%顶尖科学家。符号数据快速聚类算法研究的开拓者,发表了k-modes等一系列著名聚类算法,被纳入国内外教科书和专著,进入软件产品。发表学术论文250多篇,主要论文被引用超万次。领导开发了全球首个面向算力网络的多数据中心大数据协同计算系统Octopus,最近获深圳第二十五届中国国际高新技术成果交易会“优秀产品奖”和“华为杯”第五届中国研究生人工智能创新大赛“一等奖”。
  • 黄哲学

    崔来中

    2007年6月于吉林大学获工学学士学位,同年被免试推荐直接攻读博士研究生,2012年6月于清华大学获计算机科学与技术博士学位。研究领域包括:下一代互联网体系结构、软件定义网络、边缘计算、大数据分析、机器学习和智能计算。国际电子工程师学会高级会员(IEEE Senior Member),中国计算机学会高级会员(CCF Senior Member),人工智能学会(CAAI)会员,CCF互联网专委会常委,CCF大数据专家委员会委员、CCF区块链专委会委员,CAAI知识工程与分布智能委员会副秘书长。担任SCI期刊《International Journal of Machine Learning and Cybernetics》、《International Journal of Bio-Inspired Computation 》和《Ad Hoc and Sensor Wireless Networks》的副编辑/编委。已主持国家重点研发计划课题、国家自然科学基金,广东省自然科学基金,广东省育苗工程,深圳市基础研究计划项目等项目10多项。已在国内外重要期刊以及国际会议上发表SCI/EI检索论文80余篇。《计算机网络》课程负责人,课程入选广东省一流本科课程。入选广东省青年珠江学者,深圳市优青、深圳市高层次人才和深圳大学“荔园优青”人才培养计划。
  • 黄哲学

    陈梓楠

    陈梓楠(博士,国家海外优青,IEEE会员,ACM会员)现在担任深圳大学计算机与软件学院特聘教授。在研期间一共发表了顶级会议和期刊将近30篇论文,其中CCF A类论文有19篇(第一作者有12篇),主持了国家自然科学优秀青年(海外)项目1项和国家自然科学青年基金项目1项。此外,陈老师也是各大国际会议(包括:VLDB 2022 - 2024 (demo track)、VLDB 2025 (research track)、SIGKDD 2024 、ICDE 2022和2024、EDBT 2023、IJCAI 2020、DASFAA 2021 - 2024和WISE 2019 - 2024)和国际期刊(包括:VLDBJ、TKDE、AIJ、IEEE Transactions on Computers (TC)、WWWJ、 TSAS 、TNSE、PR Journal、DKE、JCST、The Journal of Supercomputing等等)的审稿人,并担任MDM 2021 - 2024的会议论文集主席 (proceedings chair)。

科研项目

联系我们
0755-2653 0821