登录 注册
当前位置:主页 > 资源下载 > 10 > 参考数据集包含美国历史名称和当前名称

参考数据集包含美国历史名称和当前名称

  • 更新:2024-11-25 16:49:56
  • 大小:32.09MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:数据集 - 行业研究
  • 格式:ZIP

资源介绍

美国姓名数据集 婴儿姓名数据集以不同的方式呈现。 我发现自己经常回到这些数据。 其中包括对 2014 年在世人姓名频率的估计、自 1910 年以来出生姓名统计的各个部分以及性别概率。 在世公民姓名估计 通过将美国出生的出生姓名与 2014 年的人口年龄分布进行交叉引用,我估计了今天遇到一个名字的可能性。 这里有一些警告,最重要的是依赖婴儿名字并没有考虑到美国 4000 万外国出生的居民。 包括: data/us-living-estimate-names-by-sex-state-year.csv data/us-living-estimate-names-by-sex.csv 粗略估计的方法是P(alive|age)=P(age|alive)*P(alive)/P(age) ,其中P(age|alive)是当前人口占给定年龄的比例, P(age)是年份(2014-age)的婴儿