陈小军
2004-2011,哈尔滨工业大学,计算机科学与技术。
2000-2004, 哈尔滨工业大学,机械设计制造及其自动化
2008年-2009年,香港大学电子商务科技研究所(ETI),研究助理; 2010年-2012年2月,中科院深圳先进技术研究院,客座学生; 2012年2月-2013年10月,中科院深圳先进技术研究院,深圳市高性能数据挖掘重点实验室,助理研究员; 2013年10月-至今,深圳大学,计算机与软件学院,讲师。
代表性论文
[1] Xiaojun Chen, Joshua Zhexue Huang and Jun Luo. PurTreeClust: A Purchase Tree Clustering Algorithm for Large-scale Customer Transaction Data. ICDE 2016.
[3] Yeshou Cai, Xiaojun Chen, Patrick Xiaogang Peng and Joshua Zhexue Huang. A LDA Feature Grouping Method for Subspace Clustering of Text Data. PAKDD PAISI 2014: 78-90.
[4] Xiaojun Chen, Xiaofei Xu, Yunming Ye and Joshua Zhexue Huang. TW-k-means: Automated Two-level Variable Weighting Clustering Algorithm for Multi-view Data. IEEE Transactions on Knowledge and Data Engineering, 2013, 25(4): 932-944.
[4] Xiaojun Chen, Yunming Ye, Xiaofei Xu and Joshua Zhexue Huang. A Feature Group Weighting Method for Subspace Clustering of High-Dimensional Data. Pattern Recognition, 2012, 45(1): 434-446.
[5] 黄哲学,曹付元,李俊杰,陈小军. 大数据分析的机遇与挑战. 网络新媒体技术, 2012, 1(6): 20-26.
[6] Xiaojun Chen, Yunming Ye, Graham Williams and Xiaofei Xu. A Survey of Open Source Data Mining Systems. PAKDD 2007 industrial track workshop: 3-14.
[7] Bingguo Li, Xiaojun Chen, Mark Junjie Li, Zhexue Joshua Huang and Shengzhong Feng. Scalable Random Forests for Massive Data. PAKDD 2012, 7301: 135-146.
[8] Baoxun Xu, Junjie Li, Qiang Wang and Xiaojun Chen. A Tree Selection Model for Improved Random Forest. In: 3th International Conference on Knowledge Discovery, 2011: 382-386.
[9] Shuang Wang, Xiaojun Chen, Joshua Zhexue Huang and Shengzhong Feng. Scalable Subspace Logistic Regression Models for High Dimensional Data. APWeb 2012, 7235: 685-694.
[10] Qizhen Huang, Xiaojun Chen, Joshua Zhexue Huang, Shengzhong Feng and Jianping Fan. Scalable Ensemble Information-Theoretic Co-clustering for Massive Data. In Proceedings of International MultiConference of Engineers and Computer Scientists 2012, 2012, I: 563-568.
[11] Yunming Ye, Joshua Huang, Xiaojun Chen, Shuigeng Zhou, Graham Williams and Xiaofei Xu. Neighborhood Density Method for Selecting Initial Cluster Centers in K-means Clustering. PAKDD 2006, 3918:189-198.
科研成果
国家自然科学基金“面向TB 级大数据的分布式属性分层加权子空间聚类集成方法研究”,2014-2016
专利:
[1] 张媛,陈小军,黄哲学。一种基于位置信息的移动互联网用户行为分析方法及装置。
[2] 张媛,董师师,陈小军。一种自动图文主题分析方法。
[3] 董师师,陈小军,黄哲学。 一种基于移动终端的上网数据分析与预测的方法。
[4] 范成林,陈小军,黄哲学。 一种提高随机森林在线分类速度和模型可理解性的方法.。ASP12114228SZ,2012。
[5] 黄哲学,扎拉玛,李俊杰,陈小军,王强。 分类器构建方法和系统。ASP12110266SZ, 2012。
社会兼职
1. 国际会议PAKDD 2013 program committee member;
2. 国际会议PAKDD审稿人
3. 国际期刊审稿人:
a) IEEE Transactions on Neural Networks and Learning System
b) IEEE Transactions on Knowledge and Data Engineering
c) Pattern Recognition
d) Machine Learning
e) Knowledge and Information Systems
f) Journal of Classification