-
Intel x86指令文档的HTML形式表示为x86doc
资源介绍
x86 文档
我需要一份用于个人项目的英特尔 x86 指令集文档的可解析副本,因此我下载了英特尔:registered: 64 位和 IA-32 架构软件开发人员手册(分别可在和找到)的第 2A 和 2B 卷,并使用一个在线 PDF-to-HTML 工具,可将它们转换为 HTML 文件。 不幸的是,结果非常糟糕,而且完全无法使用。
他们说你从来没有比自己更好的服务过,所以我把这件事了我自己的 pdfminer 手,直接从文档 PDF 中提取 HTML 页面。
这仍然不完美,但它已经比其他解决方案好得多(并且它不涉及丑陋的第三方)。
如何跑步
安装 ;
获取 和PDF 的副本。
pdfminer不了解这些是如何加密的,因此将它们打印为 PDF,两者都仅从文档中的第一条指令(不是整个文档)开始;
运行python extract.py vol2a.pdf vol2b.pdf ;
去喝杯咖啡;
享受您的