-
qui Coqui的机器学习工作计划程序被称作snakepit
资源介绍
:snake: 疯人院
Snakepit是具有以下功能的机器学习作业调度程序:
并发机器学习作业的调度
支持多机和多GPU作业
Job的任务在具有“ root”访问权限的互连LXD容器中运行
内置的用户和组管理
作业根据用户的访问权限访问培训数据
通过HTTP API通过命令行客户端进行远程访问
通过FUSE挂载进行远程数据访问(即使在培训期间)
Snakepit服务尚未经过深入的安全审核。 因此,您不应为未知/随机用户提供访问您的服务的权限。
入门
以下说明适用于要配置和运行自己的Snakepit群集的管理Snakepit用户。
如果您是Snakepit最终用户,并且只想知道如何在现有Snakepit群集上运行作业,则应遵循
大图景
Snakepit机器学习集群的典型设置是拥有一个所谓的头节点机器和一堆工作节点机器。
头节点通常托管Snakepit服务,并具有/提供对外部世界的访问。 在我