V
主页
中国人民大学黄丹阳教授:大规模网络随机块模型的子采样谱聚类
发布人
嘉宾简介 黄丹阳,中国人民大学统计学院教授,博士生导师,应用统计科学研究中心研究员,中国现场统计研究会教育统计与管理分会常务理事,北京大数据协会理事会副秘书长,常务理事。主持国家自然科学基金等多项省部级及以上课题,入选北京市科协青年人才托举工程,曾获北京市优秀人才培养资助。长期从事复杂网络建模、超高维数据分析、分布式计算等方向的理论研究工作,注重统计理论研究在小微企业数字化发展中的实际应用。在Journal of the Royal Statistical Society:Series B (Statistical Methodology),Journal of Econometrics, Journal of Business & Economic Statistics等国内外权威期刊发表论文30余篇,著有教材一部,独立作者专著一部。 报告摘要 The rapid development of science and technology has generated large amounts of network data, leading to significant computational challenges for network community detection. A novel subsampling spectral clustering algorithm is proposed to address this issue, which aims to identify community structures in large-scale networks with limited computing resources. The algorithm constructs a subnetwork by simple random subsampling from the entire network, and then extends the existing spectral clustering to the subnetwork to estimate the community labels for entire network nodes. As a result, for large-scale datasets, the method can be realized even using a personal computer. Moreover, the proposed method can be generalized in a parallel way. Theoretically, under the stochastic block model and its extension, the degree-corrected stochastic block model, the theoretical properties of the subsampling spectral clustering method are correspondingly established. Finally, to illustrate and evaluate the proposed method, a number of simulation studies and two real data analyses are conducted.
打开封面
下载高清视频
观看高清视频
视频下载器
北京大学王汉生教授:开学第一课 | 统计学研究什么?
中国人民大学黄丹阳副教授:基于K-S统计量的聚类算法及在银行卡交易数据上的应用
中央财经大学潘蕊副教授:开学第一课 | 数据分析–从兴趣开始
北京大学耿直教授:因果推断:混杂因素、替代指标、因果网络
中国人民大学王菲菲副教授:基于贝叶斯联合动态主题模型的文本间语义关系识别
复旦大学朱雪宁副教授:基于大规模网络的空间自回归模型的分布估计与推断
中国人民大学黄丹阳副教授:开学第一课 | 学会拥抱不确定性
北京大学王汉生教授:基于大规模社交网络数据的空间自回归模型的最小二乘估计
中国人民大学周静副教授:一种用于肺腺癌病理亚型识别的集成3D CNN模型
【数据科学】中国人民大学孟澄助理教授:希尔伯特曲线与大规模非参数回归估计
【数据科学】中国人民大学周静副教授:基于逐步主成分分析的深度神经网络模型压缩算法
【数据科学】加州大学河滨分校马舒洁教授:基于神经网络的因果推断
北京师范大学师资博士后亓颢博:深度神经网络的因子归一化方法
香港大学徐锦峰教授:随机梯度下降的统计分析
中国人民大学王菲菲副教授:非均匀和非随机分布式数据中的分布式一步改进估计
【数据科学】华中师范大学晏挺教授:大型稀疏网络 beta 模型中的正则化最大似然
北京大学董彬副教授:基于深度学习进行数据和任务驱动的CT成像
北京大学王汉生教授:数据思维:从数据分析到商业价值
复旦大学郁文教授:用于生存分析的NFM(Neural Frailty Machines)
厦门大学方匡南教授:基于混合惩罚项的函数形数据双向聚类
北京大学王汉生教授:数据治理与合规
北京大学王汉生教授:深度学习中的统计学习
复旦大学朱雪宁副教授:带缺失的矩阵型时间序列的网络自回归
Three-manifolds with positive Ricci curvature
复旦大学在读博士生李哲:随机块模型下大规模网络的分布式社团检测算法
中央财经大学潘蕊教授:统计学科引文网络的动态社区发现
狗熊会在线项目研发总监常莹:开学第一课 | 从-4岁开始你的职业生涯
【数据科学】上海财经大学钟玉洁助理教授:有偏家系研究中带删失的次要结局变量的统计分析
北京师范大学师资博士后亓颢博:固定小批量梯度下降算法估计量的统计分析
企业数字化转型教练王安:开学第一课 | 各行各业中的数据应用
北京大学在读本科生李柄辉:鲁棒泛化性或需指数级大模型
复旦大学朱雪宁副教授:具备潜在群组结构的网络向量自回归模型
【数据科学】威斯康星大学张正军教授:最大线性回归模型与最大线性逻辑回归分类器
宾夕法尼亚州立大学李润泽教授:超高维数据的特征筛选:方法与应用
北卡罗莱纳州立大学在读博士高辰印:基于选择性半参数法的数据整合:随机对照实验与外部对照组
【非参数回归】——瑞恩·J·提布希拉尼 Ryan Tibshirani(卡内基梅隆大学)
华盛顿大学在读博士生张奕堃:核平滑和均值移位理论及其在宇宙网探测中的应用
香港大学在读博士生黄绯青:RNN和LSTM有长期记忆吗?
杨超越B站视频的分析与启示
西南财经大学在读博士生刘洋溢:基金赚钱、基民不赚钱:业绩持续性感知与基金投资者行为