-
node-warc-proxy:允许导航 WARC 文件内容的简单 node.js 服务器下载
资源介绍
节点-warc-代理
允许导航 WARC 文件内容的简单 node.js 服务器
要求
: npm install csv csv-stream 流转换
stdio 插件: npm install stdio
:pip install warctools
测试中使用的示例 warc:
跑步
将 drupalib.interoperating.info.warc.gz 复制到目录 ../warc(相对于安装 warcnode.js 的目录); 或其他地方
gunzip drupalib.interoperating.info.warc.gz
生成 csv 索引(与 drupalib.interoperating.info.warc.gz 在同一目录中):
warcindex drupalib.interoperating.info.warc > drupalib.interoper