-
贝叶斯深度学习基准:bdl-benchmarks
资源介绍
贝叶斯深度学习基准
该存储库不再被更新。
请参阅的以获取最新的基线实现。
概述
为了通过贝叶斯深度学习(BDL)工具使现实世界与众不同,这些工具必须扩展到现实世界的设置。 为此,我们(研究团体)必须能够使用实际基准测试任务评估我们的推理工具(并快速迭代)。 我们应该能够做到这一点,而不必担心特定于应用程序的领域知识,例如医疗应用程序中经常需要的专业知识。 除了开发成本和工作量之外,我们还需要基准测试来测试推理的鲁棒性,性能和准确性。 这些基准应该具有多种规模,从快速开发周期的玩具MNIST规模基准到真实世界应用真实的大型数据基准(捕获其约束)。
我们的BDL基准应该
提供一个透明的,模块化的和一致的接口,用于评估各种下游任务的深度概率模型;
依靠专家驱动的不确定性质量度量(实际应用中利用了现实世界中的BDL不确定性),但抽象化了专家知识并消除了在真实数据集上运行实验所需的样板步骤;
- 上一篇: 贝叶斯机器学习前沿进展综述_朱军
- 下一篇: 利用opencv实现的shared matting代码