术语表

Spring Batch 术语表

批处理

随时间累积的业务交易。spring-doc.cadn.net.cn

批处理应用风格

用于将批处理指定为一种独立的应用程序风格的术语,类似于在线、Web 或 SOA。它具有输入、验证、信息转换为业务模型、业务处理和输出等标准元素。此外,它还需要在宏观层面进行监控。spring-doc.cadn.net.cn

批处理

处理在一段时间内(例如一小时、一天、一周、一个月或一年)积累的大量业务事务。它是以重复且可预测的方式,将某个流程或一组流程应用于许多数据实体或对象,过程中无需人工干预,或仅针对错误处理设置独立的人工环节。spring-doc.cadn.net.cn

批处理窗口

批处理作业必须完成的时间范围。这可能受到其他系统上线、其他依赖作业需要执行,或批处理环境特有的其他因素的限制。spring-doc.cadn.net.cn

步骤

主要的批处理任务或工作单元。它根据提交间隔设置和其他因素,初始化业务逻辑并控制事务环境。spring-doc.cadn.net.cn

任务处理器

由应用程序开发人员创建的组件,用于处理步骤的业务逻辑。spring-doc.cadn.net.cn

批处理作业类型

作业类型描述了针对特定处理类型的作业应用。常见领域包括接口处理(通常是平面文件)、表单处理(用于在线 PDF 生成或打印格式)以及报表处理。spring-doc.cadn.net.cn

驱动查询

驱动查询用于识别作业需要执行的工作集。随后,作业将该工作拆分为独立的工作单元。例如,驱动查询可以是识别所有状态为“待传输”的金融交易,并将其发送到合作伙伴系统。驱动查询返回一组待处理的记录 ID,每个记录 ID 即成为一个工作单元。驱动查询可能涉及连接操作(如果选择条件跨越两个或多个表),也可能仅针对单个表进行操作。spring-doc.cadn.net.cn

项目

一个项(Item)代表处理所需的最小完整数据单元。用最简单的术语来说,它可能是文件中的一行、数据库表中的一行,或是 XML 文件中的某个特定元素。spring-doc.cadn.net.cn

逻辑工作单元 (LUW)

批处理作业会遍历驱动查询(或其他输入源,例如文件),以执行该作业必须完成的一组工作。每次执行的工作迭代都是一个工作单元。spring-doc.cadn.net.cn

提交间隔

在单个事务中处理的一组逻辑工作单元(LUW)。spring-doc.cadn.net.cn

分区

将一个作业拆分为多个线程,其中每个线程负责处理整体数据的一个子集。执行线程可以位于同一个 JVM 内,也可以分布在支持负载均衡的集群环境中的多个 JVM 上。spring-doc.cadn.net.cn

暂存表

一个在处理过程中用于保存临时数据的表。spring-doc.cadn.net.cn

可重启的

一个可以再次执行且在首次运行时具有相同身份的作业。 换句话说,它具有相同的作业实例 ID。spring-doc.cadn.net.cn

可重运行

一个可重启的作业,能够根据上一次运行的记录处理情况管理其自身状态。可重运行步骤的一个示例是基于驱动查询的步骤。如果驱动查询的构建方式能够在作业重启时限制已处理的行,那么它就是可重运行的。这由应用程序逻辑进行管理。通常,会在 where 语句中添加一个条件,以通过类似于 and processedFlag!= true 的逻辑来限制驱动查询返回的行数。spring-doc.cadn.net.cn

重复

批处理最基本的单元之一,它通过重复调用一段代码直到完成且没有错误为止来定义。通常,只要有输入,批处理过程就可以重复执行。spring-doc.cadn.net.cn

重试

简化了具有重试语义的操作执行,这种语义最常与处理事务性输出异常相关联。重试与重复略有不同。重试不是持续调用一段代码,而是有状态的,它会使用相同的输入持续调用同一段代码,直到操作成功或超过某种类型的重试限制。通常,只有当环境的某些方面有所改善,使得操作的后续调用可能成功时,重试才有用。spring-doc.cadn.net.cn

恢复

恢复操作以某种方式处理异常,使得重复过程能够继续。spring-doc.cadn.net.cn

跳过

Skip 是一种恢复策略,常用于文件输入源,作为忽略验证失败的错误输入记录的策略。spring-doc.cadn.net.cn