用 AI 预测未来靠谱吗？全球 160 个研究团队参赛 5 个月得到答案

雷锋网 • 4年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

我们的人生轨迹可能受家庭、社会、时代影响，也因大大小小的决定被改变。我们无法预知的未来，AI 可以准确地预测吗？

来自普林斯顿大学、加州大学洛杉矶分校、麻省理工学院、弗吉尼亚理工大学等机构的 160 个研究小组参与了“脆弱家庭挑战赛”（Fragile Families Challenge），通过建立统计和机器学习模型，试图预测、衡量美国各地儿童、父母及其家庭的人生轨迹，寻求上述问题的答案。

当地时间 2020 年 3 月 30 日，这一挑战赛的研究成果在线发表于《美国国家科学院院刊》，论文题为 Measuring the predictability of life outcomes with a scientific mass collaboration（通过科学合作探究人生轨迹的可预测性），合著者多达 112 位。

用 AI 预测未来靠谱吗？全球 160 个研究团队参赛 5 个月得到答案

来自 4000 余个家庭的大样本数据集

实际上，探究人生轨迹，更像是一个社会学问题。这不仅仅是预测未来那么简单，它在提供家庭援助、了解社会僵化程度、改善相关政策方面都有一定的参考意义。

这一研究基于一个名为“脆弱家庭与儿童健康研究”（Fragile Families and Child Wellbeing Study）的高质量出生队列数据集——由社会科学家 15 年来收集的大样本数据集，包含来自 4000 多个家庭的 1.3 万个数据点。

研究人员对出生于 1998-2000 年间美国大城市的儿童进行了研究，其中未婚父母所生儿童的占比较大。不难看出，这一纵向研究的目的也在于了解出生在未婚家庭的孩子的生活。

具体来讲，随着孩子年龄的增长，相关数据总共收录了 6 个阶段的情况——小孩刚出生时、1 岁、3 岁、5 岁、9 岁和 15 岁。

值得一提的是，每个年龄段数据收集的范围不同。比如，孩子刚出生时，仅仅收集父母的调查访谈信息；孩子 9 岁时，需要对父母、孩子的主要照顾者（如果不是父母的话）、老师和孩子自己都进行调查访谈，进而收集信息（如下图）。

用 AI 预测未来靠谱吗？全球 160 个研究团队参赛 5 个月得到答案

此外，针对不同年龄段，研究人员对数据的关注方向不一。

例如，孩子刚出生时，对母亲的采访主要涉及儿童健康与发展、父母关系、父亲身份、父母对婚姻的态度、与家人的关系、环境和政策因素、健康状况、人口特征、教育程度、就业及收入情况；而在孩子 9 岁时，对孩子本人的采访主要涉及的话题有父母关系、父母的要求及督促孩子的情况、与兄弟姐妹的关系、日常生活、在校情况、青少年犯罪倾向、任务完成和行为表现及健康、安全状况。

脆弱家庭挑战赛

实际上，这一名为“脆弱家庭挑战赛”的项目可以说是一款游戏——游戏开发者是项目组织者，玩家是参与进来的各个研究团队。

而游戏设定是，项目组织者不公开上述家庭中孩子们 15 岁时的数据，各个研究团队可利用任意的 AI 模型高能玩法准确预测孩子们 15 岁时的人生发展。开发者为玩家提供了 6 种衡量维度，如孩子们的平均学习成绩、孩子们的毅力、家庭经济水平、孩子的主要照顾者的工作和接受培训情况等，玩家需要预测其中的至少一个维度。

如下图，这一研究的背景数据包括来自 4242 个家庭的孩子刚出生时、1 岁、3 岁、5 岁和 9 岁时的共 12942 个变量。而训练数据即是孩子们 15 岁时的 6 种人生轨迹。

用 AI 预测未来靠谱吗？全球 160 个研究团队参赛 5 个月得到答案

实际上，这一游戏设计思路正是计算机科学领域常用的一种研究设计方法「共同任务法」。

雷锋网了解到，项目组织者收到了来自全球 68 所大学的 457 份申请，最终这一项目由全球 160 个研究小组协同开展。挑战赛于 2017 年 3 月 5 日至 2017 年 8 月 1 日展开，参与者只要将预测结果上传至挑战赛官网即可。

用 AI 预测未来靠谱吗？全球 160 个研究团队参赛 5 个月得到答案

【脆弱家庭挑战赛官网】

在脆弱家庭挑战赛结束后，组织者将 160 个团队的结果进行分析比较，发现各团队使用了不同的数据处理、统计学习等技术来生成预测，虽然各个团队得到的预测结果之间相差不大，但各预测结果普遍与真实情况差距较大， 即便是最准确的预测结果也与训练数据的实际情况存在不小的差距 。

如下图，研究团队对家庭经济水平、孩子们平均学习成绩的平均预测准确度在 0.2 上下浮动，而对其他几种维度的预测准确度平均约 0.05（雷锋网 (公众号：雷锋网) 注：值越接近 1，吻合程度越高；越接近 0，则吻合程度越低）。

用 AI 预测未来靠谱吗？全球 160 个研究团队参赛 5 个月得到答案

当然不可否认的是，各团队对部分预测也是准确的，比如具体某个孩子的学习成绩。

用 AI 预测未来靠谱吗？全球 160 个研究团队参赛 5 个月得到答案

目前看来，我们可以回答文章开头的那个问题了——AI 并不能很准确地预测人生轨迹。

这一结论对 AI 模型在刑事司法、儿童保护服务等场景的应用带来了启示，同时社会学家、数据科学家今后也应谨慎使用 AI 预测模型。正如普林斯顿大学和哥伦比亚大学 “脆弱家庭与儿童健康研究”首席研究员 Sara McLanahan 所说：

结果令人大开眼界，要么运气在我们的生活中扮演着重要角色，要么我们作为社会科学家在研究中忽略了一些重要变量。

引用来源：

[1] https://www.eurekalert.org/pub_releases/2020-03/puww-pto032520.php

[2] https://www.eurekalert.org/pub_releases/2020-03/vt-pto032720.php

[3] https://www.pnas.org/content/early/2020/03/24/1915006117

[4] https://www.fragilefamilieschallenge.org/

雷锋网

。