-
如何撰写被引用的科学论文和获得资助的提案——可选的主机数据类型
资源介绍
表 7.1 可选的主机数据类型
数据类型 用法
PD 用作专门的数字值排序,按照压缩十进制(或 COMP-3)格式排序。
ZD 用作专门的数字值排序,按照分区十进制格式排序。
AC
用作专门的 ASCII 代码相关的数据排序,而不是按照主机本地的 EBCDIC 代码。当数据是从主机
传输到 Unix 或 Windows 上的 ETL 过程时,用这种格式为混合的(字母数字混合编码的)字段
排序。
Dates
你可能会遇到带 2000 前格式(没有明确的世纪)的日期在遗留系统文件中你可能会在历史系
统文件中遇到公元 2000 年以前的日期时(那种不带明确世纪,例,98),SORT 有丰富的数据
类型设置来处理这些日期并赋给它们相应的世纪。
这个表只提供了可用数据类型的很少一部分。还有许多其它可用的数据类型
可以针对你可能遇到的数字集和其它数据格式的数据类型。
你也可以在组合索引中混合数据格式。比如,按照年和反序单位成本来排序
销售文件使用以下命令:
SORT FIELDS= ( 1,4,BI,A,72,4,PD,D)
在 Unix 和 Windows 系统中排序
在 Unix 和 Windows 系统中的平面文件是基于 ASCII 字符的,没有难处理的陈
旧的数据格式(压缩数字,等等)混合编制在旧主机系统上来节省磁盘空间。但
是这些系统有它们自己的挑战。
你要面对的最常见的排序挑战是分隔符文件或其它非结构化数据文件。在这
里,非结构化指的是每个记录没有按照等长的列整理的数据。同样的,你不能指
定排序键位置。
相反,sort 实用程序必须能够使用分隔符来分析记录。(当然,主机实用程序
SyncSort 和 CoSort 在 Unix 和 Windows 平台也可以使用。)以下的抽取显示了本
章前面的同一个销售数据现在用逗号分隔符格式化的文件。