-
参考数据集包含美国历史名称和当前名称
资源介绍
美国姓名数据集
婴儿姓名数据集以不同的方式呈现。 我发现自己经常回到这些数据。
其中包括对 2014 年在世人姓名频率的估计、自 1910 年以来出生姓名统计的各个部分以及性别概率。
在世公民姓名估计
通过将美国出生的出生姓名与 2014 年的人口年龄分布进行交叉引用,我估计了今天遇到一个名字的可能性。 这里有一些警告,最重要的是依赖婴儿名字并没有考虑到美国 4000 万外国出生的居民。
包括:
data/us-living-estimate-names-by-sex-state-year.csv
data/us-living-estimate-names-by-sex.csv
粗略估计的方法是P(alive|age)=P(age|alive)*P(alive)/P(age) ,其中P(age|alive)是当前人口占给定年龄的比例, P(age)是年份(2014-age)的婴儿
- 上一篇: svcutil.exe
- 下一篇: InstallShield 2010简体中文汉化包