第一幕:失真的代价 —— 因数据“偷懒”引发的危机
教师播放某电商公司“双十一”复盘视频:因运营人员未严格清洗订单数据(如未填充“不明”用户信息、忽略逻辑错误等),导致系统误判热销区域,最终错配物流资源,造成超2000万元损失。
互动环节:
1.角色扮演。学生分组模拟“数据清洗员”,面对部门主管要求“跳过缺失值处理,直接生成报告”的压力,讨论如何应对。
2.数据实验。 提供同一份含缺失值和逻辑错误的数据表,对比“草率处理”与“规范清洗”后的分析结果差异(如用户画像偏差、库存预测错误等)。
3.教师提问。“若你发现同事为赶工而忽略数据清洗规范,你会选择沉默,还是向上级反馈?为什么?”
第二幕:毫米级的严谨 —— 华为数据治理的“零容忍”
案例对比:
引入华为消费者业务部数据治理案例,通过“数据清洗五步法”(定位、校验、修正、复核、存档),确保用户行为数据的绝对精准,展示其“数据异常实时监控系统”如何自动拦截0.01%的错误数据,避免促销活动中的资源浪费。
实践任务:
1.虚拟沙盘。学生使用模拟数据清洗平台,处理包含敏感信息(如用户隐私字段)的订单表。系统实时评分,若违规保留隐私字段或掩盖错误,触发“伦理扣分”警告。
2.分组辩论。围绕“效率优先还是质量优先”展开辩论,结合《中华人民共和国数据安全法》分析企业责任边界。
第三幕:实验室里的“数据良知” —— 从技术到价值观的跨越
情境模拟:
教师设置“两难任务包”,要求学生在有限时间内完成数据清洗。
任务A:领导要求隐藏“用户年龄异常”数据(如500岁),以通过合规审查。
任务B:发现竞品数据被意外混入,需选择“删除”或“上报”。
技术+伦理考核:
学生需同步提交《数据清洗报告》与《伦理决策说明》,解释每一步操作的技术依据与道德考量。通过“数据可信度指数”量化不诚信操作对分析结果的潜在影响。