-
Rust语言中finch-rs库的基因组minhashing实现
资源介绍
雀科
Finch是针对基因组数据的最低限度独立置换排列局部敏感哈希(“ MinHashing”)的实现。 该存储库提供了一个库和命令行界面,可在中重新实现One Codex(并添加新功能/扩展!)。
入门
安装
您可以从源代码构建Finch,这需要Rust> = 1.43 。 Rust的Cargo包裹管理器(请参阅以获得Cargo的安装说明)可以自动使用cargo install finch_cli来构建和安装Finch。 如果需要python绑定,则必须采取额外的步骤(请参阅 )。 或者,。
用法示例
首先,我们首先为几个FASTA或FASTQ文件计算草图。 这些草图是基础基因组数据的紧凑,采样表示形式,它们使finch能够快速估计数据集之间的距离。 草绘文件使用finch sketch命令:
finch sketch example.fastq example2.fastq
然后