得扣 与其说是家谱学家,不如说是经济学家. 她过去的大部分作品都探讨了家庭经济学、人口统计学和儿童健康.

但她决定尝试家谱网站Family搜索,因为她正在与杨百翰大学(Brigham Young University)的经济学家合作 约瑟夫价格 关于代际流动的研究. 巴克尔斯知道追踪和联系一个人的历史记录是多么困难, 尤其是那些结婚后改姓的女人.
她决定去看看她的曾祖母,并惊讶地发现她的一些美国人.S. 她在Family搜索网站上的个人资料中已经附上了人口普查记录. 1910年,这个2岁的孩子被登记为玛丽·L. Gaddie. 十年后,她的中间名改为莱蒂. 到1940年,她已经是一名已婚妇女. 莱蒂卡斯韦尔给你.
巴克尔斯知道,传统的研究方法试图通过长期追踪同一个人的名字来追踪一个人,这种方法无法建立联系.
“当我看着我的曾祖母,看到其他人已经完成的所有工作时,我顿悟了,巴克尔斯说. “然后我就迷上了它,因为它有点上瘾.”


365wm完美体育官网登录的教授 经济系 能够利用这项研究在2019年祖母去世前重新审视她的家庭记忆吗. “我们度过了一个非常美好的下午,巴克尔斯说, 在那里,我可以告诉她一些她已经忘记或从来不知道的过去.”
其他的人, 可能的亲戚巴克尔斯不知道, 利用他们对家族历史的了解,把她曾祖母的姓氏联系起来. 与价格合作, 她意识到,这个众包家庭知识的金矿可以用来建立一个强大的工具,用于各种长期研究.
由 国家科学基金会 和 罗素塞奇基金会, 巴克尔斯和普莱斯创造了人口普查树, 一个数字化数据库,使用家谱研究和机器学习来改善1850年至1940年的人口普查联系. 的 普查树网站 于2023年7月下旬上线.
同月, 巴克尔斯和普莱斯介绍了他们对代际流动的研究结果, 第一份使用这些数据的工作论文, 在国家经济研究局的两次会议上 夏季研究所. 365wm完美体育官网登录博士生 哈雷Wilbert 也是这篇论文的合著者吗 扎克沃德 贝勒大学.
巴克尔斯说,制作人口普查树需要一个庞大的团队, 其中包括数十名来自365wm完美体育官网登录和杨百翰大学的本科生 录音连接实验室来自365wm完美体育官网登录的多名经济学博士生,以及康奈尔大学的博士生阿德里安·豪斯.
“这项工作将把人口普查中的人们联系起来,让你看到他们的一生, 看看他们的经历,他们的早期生活, 世界事件, 公共政策——以一种我们以前无法做到的方式塑造了他们,巴克尔斯说. “我们的创新之处在于,我们把自己的家谱研究与人们联系起来. 我认为这是公众和学术研究人员之间令人兴奋的共生关系.”
包容性的研究
使用人口普查记录进行长期研究的挑战在于,每一项调查都是相隔十年的快照. 这限制了追踪人们的时间和家庭的能力. 一种将人们联系起来的方法是使用社会安全号码或纳税记录, 这两种方法都会引起隐私问题,而且在大多数历史记录中都找不到.
为了解决这个问题, 研究人员通过识别名字来追踪人们, 姓, 出生的地方, 出生年份. 结果对白人男性相当有效, 但对少数族裔来说就不那么好了,对女性来说更是几乎没有. 这些群体的代表性不足会影响研究的结论.
例如, 扣, 价格, Wilbert, 沃德研究了代际流动性,以了解你的出生环境在多大程度上决定了你的生活方式. 巴克尔斯是这样说的:“出生在低收入或低地位家庭的人取得更高成就的可能性有多大?? 美国梦存在吗?何时存在,为谁存在?”
为了回答这个问题, 一项衡量标准是将一个人的职业地位与其父母的职业地位进行比较. 威尔伯特说,北方的白人农民和南方的黑人农民之间可能存在很大的社会经济差异.
“因此,我们采用的衡量标准不仅包括占领情况, 还有扫盲措施, 移民身份, 性别, 以及你所居住的地区,威尔伯特说.
人口普查树链接使得这项历史研究的样本量增长到数亿个链接, 并且第一次将女性纳入其中.
“过去,当人们估计父母和孩子之间的这种相关性时, 他们只会为白人做这件事,巴克尔斯说. “事实上,看起来经济流动性并没有随着时间的推移而发生太大变化, 如果有什么区别的话, 情况变得更糟.”
但是直到最近,美国黑人的流动性一直很低. 女性根本不包括在内, 尽管在过去的50年里,他们在劳动力中的存在急剧增加. 把这些之前被忽视的群体包括在内,结果就发生了变化.
其中包括美国黑人的数据, 还有女性, 以及其他移民群体, 我们可以更好地看到这种流动性,而且它实际上随着时间的推移而增加,巴克尔斯说. “相对于我们正在研究的19世纪末和20世纪初的时期, 今天,你更容易得到一个不同于你父母的结果.”
众包输入
Family搜索, 世界上最大的家谱网站之一, 最初是耶稣基督后期圣徒教会的一项努力. 它是免费的,不为营利, 这就是为什么它可能没有像Ancestry这样的广告网站那么熟悉.com.
但Family搜索拥有超过1200万用户,近1000万用户.40亿份死者的档案. 用户可以建立自己的家谱,搜索并结合他人的努力, 并附上实际历史记录的扫描件. 该网站提示用户确认数据,避免重复.
杨百翰大学的普莱斯是一个天然的合作伙伴, 因为他和巴克尔斯在研究项目上合作了大约15年,因为他们对理解家庭有共同的兴趣. 他们意识到,积极性很高的业余家谱学家已经在十年一次的人口普查之间建立了联系,可以用来追踪个人. 在1850-1940年的人口普查中,男性有1.33亿对,女性有1.21亿对.
而政客们, 社会科学家和其他人出于多种原因使用人口普查信息, 这些数据在收集72年后才包括姓名等个人标识符. 这意味着1950年的人口普查是最近一次可以与个人联系起来的信息.

Wilbert, 谁在杨百翰大学读本科时认识普莱斯, 作为巴克尔斯的研究助理开始这个项目,并一直从事数据创建和分析工作. 家谱数据可以用来训练一种算法来识别额外的匹配, 并识别诸如昵称或拼写错误之类的变化. 她说,使用手动链接的数据来通知机器学习使她相信它是正确的,并且代表了人口.
“我之前已经处理过人口普查数据, 我真的很喜欢这个想法,把声音带给那些历史上从未被看到过的人,威尔伯特说. “这个项目突出了那个时期的女性以及多个少数群体.”
完整的人口普查树数据集包含大约3.3亿对男性和2.7亿对女性的人口普查数据,这是一个巨大的数据宝藏. “我们能够从人群中汲取智慧,学到很多东西,并建立以前人们无法建立的联系,巴克尔斯说.
普查树可以识别一个链接, 例如, 在1920年到1930年的人口普查中,这个人可能是某人的祖母. 如果他们确认是正确的人,就会创建一个新的链接或“人行横道”.
“它对公众来说有很好的应用, 对于那些想了解自己家族历史的人来说,巴克尔斯说. 然后依次, 研究人员向公众中所有独立从事这类工作的人学习.”
未开发的潜力
普查树网站将公开这些链接, 巴克尔斯希望这将开启一波新的研究浪潮.
她的下一个项目将着眼于禁酒令对儿童的长期影响. 她将使用这些数据来识别1910年人口普查中的孩子, 他们中的一些人在1920年禁酒令修正案之前生活在干旱的州或县, 看看他们的环境是否对他们的教育成就有影响, 职业或其他可衡量的结果.
“要做到这一点, 我们可以下载1910年和1940年的人口普查, 然后下载我们的普查树人行横道,巴克尔斯说. “然后我们就能让所有这些人都知道他们的童年环境是如何接触到禁令的, 也知道他们是如何成长起来的.”



其他研究人员可以利用这些数据来研究大型公共工程项目的影响, 比如水质的改善. 其他人可能会关注自然灾害及其如何影响人们的生命历程.
“老实说,这取决于用户的想象力,”威尔伯特说. “最明显的是关注政策变化或重大事件. 你可以用它来看看大萧条是如何影响各州的个人移民的.”
社会科学家和历史学家可以研究重大的政策举措,如卫生干预或福利举措的引入. 人口统计学家可以研究有关出生顺序或家庭规模的数据,以及这些因素如何影响生活结果.
“历史学家,社会学家,人类学家,政治家,所有的社会科学 . . . 我们希望这些社区的研究人员能发现这些有用的东西,”巴克尔斯说. “我们在经济史上已经取得了一些成功,这一事实令人鼓舞.”
巴克尔斯说,她和她的合作者从未考虑过不公开这些数据. 她感到很幸运,在她的职业生涯中,她可以使他人受益,并离开这个领域.
她说:“这里有很多事情可以做,我们不可能把所有事情都做了。. “我很高兴看到其他人如何处理这些数据,就像我自己处理这些数据一样. 这真的感觉像是一个贡献,远远超过我可能写的任何一篇论文.”