资源介绍
Swordfish 是一个简单的 Ruby 文档处理库。 它可以将 Microsoft Word XML 文档 (.docx) 转换为干净、语义化的 HTML5,而不会出现普通导出工具或复制粘贴会产生的所有混乱。
特征
Swordfish 目前支持识别以下功能:
段落
格式:粗体、斜体、下划线、上标、下标、删除线
链接
列表(包括嵌套列表)
表
脚注和尾注
图像(Word 绘图除外)
安装
Swordfish 可通过 RubyGems 获得,因此您可以使用gem install swordfish Swordfish 安装它。
转换文档
将 Word 文档转换为 HTML 只需要两次调用:一次解析文档,一次生成标记:
require 'swordfish'
Swordfish . open ( '~/Documents/my_word_doc.docx' ) . to_html
- 上一篇: Word中表格元素Xml化
- 下一篇: xml转换导出Word