V
主页
复旦大学戴国榕博士:超越总体变量重要性——个体变量重要性的概念、理论和应用
发布人
报告摘要 In a nonparametric regression setting, we propose a novel concept of ''individual variable importance'', which refers to the relevance of some covariates with respect to an outcome variable among individuals with certain features. This concept holds practical importance for both risk assessment and association identification. For example, it can represent (i) the usefulness of expensive biomarkers in disease prediction for individuals at certain baseline risk, or (ii) age-specific associations between physiological indicators. We quantify the individual variable importance by a ratio parameter between two conditional mean squared errors. To infer this parameter we develop fully nonparametric estimators and establish their asymptotic properties. Our inferential approaches perform well in simulation studies. We further demonstrate our approaches through application to a real data set, showing a scientifically interesting result: the association between body shape and systolic blood pressure decays with increasing age. While our finding aligns with the existing medical literature based on standard parametric regression techniques, our analysis methods are more reliable because their validity is not affected by model misspecification. More importantly, the fully nonparametric nature equips the individual variable importance framework with broader applicability in contexts that go beyond traditional parametric modeling. It can capture complex relationships between variables that are likely to be missed by standard parametric interaction analyses. 嘉宾简介 戴国榕,复旦大学管理学院统计与数据科学系讲师。他于2019年获Texas A&M 统计学博士学位,随后留校从事博士后研究工作,直至2021年加入复旦大学。戴国榕博士的研究兴趣包括高维统计、缺失数据、半参数理论、半监督推断,以及统计方法在生物医学中的应用。 直播分享时间:2024年6月6日
打开封面
下载高清视频
观看高清视频
视频下载器
斯坦福大学在读博士生金滢:无重叠的政策学习-悲观主义和广义经验伯恩斯坦不等式
上海财经大学张耀武教授:高维数据中的非线性关系和独立性检验
上海科技大学汪时嘉助理教授:复杂模型的近似贝叶斯加速计算方法
宾夕法尼亚州立大学李润泽教授:超高维数据的特征筛选:方法与应用
北卡罗莱纳大学教堂山分校李悫风副教授:多模态数据分析的综合因子回归及其推论
中国人民大学在读博士闫引桥:空间转录组学研究中的贝叶斯整合区域分割方法
第三届美团商业分析精英大赛冠军作品:Meta-tour旅游定制师——整合多源信息的一站式旅游规划研究
中国人民大学黄丹阳副教授:开学第一课 | 学会拥抱不确定性
香港大学在读博士生黄绯青:RNN和LSTM有长期记忆吗?
ChatGPT辅助的R语言编程:06-生存回归
宾夕法尼亚大学李洪哲教授:迁移学习在基因组学中的应用
复旦大学林晓蕾青年副研究员:用于 I 期剂量探索试验的贝叶斯样本量规划
北京大学在读本科生李柄辉:鲁棒泛化性或需指数级大模型
北京大学王汉生教授:机遇与挑战-大规模商业场景中的统计计量方法
西南财经大学在读博士生刘洋溢:基金赚钱、基民不赚钱:业绩持续性感知与基金投资者行为
香港中文大学范青亮副教授:带有多个无效及弱工具变量的内生性处理效应模型
中国人民大学黄丹阳教授:大规模网络随机块模型的子采样谱聚类
中国人民大学黄丹阳副教授:基于K-S统计量的聚类算法及在银行卡交易数据上的应用
华东师范大学周勇教授:经济管理中复杂数据和复杂行为的分析方法及其应用
第三届美团商业分析精英大赛季军作品:“袋鼠管家”新模式——基于遗传算法的无人配送车最优投放方案
北京大学王汉生教授:数据治理与合规
中国人民大学周静副教授:一种用于肺腺癌病理亚型识别的集成3D CNN模型
复旦大学在读博士任怡萌:大规模网络下空间自回归模型的分布式估计与推断方法
复旦大学在读博士生李哲:随机块模型下大规模网络的分布式社团检测算法
中国人民大学在读博士生胡威:分组空间自回归模型
华东师范大学周勇教授:大数据统计学习理论与分布式计算及其应用
第三届美团商业分析精英大赛亚军作品:助力“闪电仓”老品去库存——临期食品动态定价与管理策略
中国人民大学张琨助理教授:条件风险值的模拟置信区间
复旦大学郁文教授:用于生存分析的NFM(Neural Frailty Machines)
罗格斯大学郭子剑副教授:基于对抗鲁棒学习的领域泛化:识别、估计和不确定性量化
香港理工大学蒋滨雁副教授:动态网络的双向异质性模型
北京大学王汉生教授:开学第一课 | 统计学研究什么?
北京大学在读博士生师佳鑫:利用超高维文本数据进行混合条件回归从而估计法外因素的影响
【数据科学】加州大学河滨分校马舒洁教授:基于神经网络的因果推断
第三届美团商业分析精英大赛季军作品:基于强化学习的新能源充电站布局优化
西南财经大学刘耀午教授:全局检验的集成方法
【数据科学】上海财经大学钟玉洁助理教授:有偏家系研究中带删失的次要结局变量的统计分析
中央财经大学李丰副教授:基于狄利克雷过程的无限预测组合
中央财经大学潘蕊副教授:开学第一课 | 数据分析–从兴趣开始
华盛顿大学在读博士生张奕堃:核平滑和均值移位理论及其在宇宙网探测中的应用