kettle同一个表输入,手动执行的时候是11条数据;但是夜间自动执行作业的结果就是10条数据

数据量很大,其中的明细会出错???kettle同一个表输入,手动执行的表输出是11条数据;但是夜间自动执行作业的结果就是10条数据,有时候自动执行也是正常的11条;很不稳定,这是为啥?image.png

其他问题 小白不白 发布于 2025-6-11 11:16 (编辑于 2025-6-11 13:34)
1min目标场景问卷 立即参与
回答问题
悬赏:0 F币 + 添加悬赏
提示:增加悬赏、完善问题、追问等操作,可使您的问题被置顶,并向所有关注者发送通知
共2回答
最佳回答
0
华莉星宸Lv7专家互助
发布于2025-6-11 11:17

你的表输入有什么过滤条件?

是不是源数据变成了10条,校验一下

  • 小白不白 小白不白(提问者) 都是同样的过滤条件;就是现在明确数据不会变了,我现在手动执行是11条;但是明天早上自动执行的结果又会变成10条,感觉kettle有点bug,但是又不得不用这个kettle,不知道咋优化,数据量很大,有200W条数据,看deepseek说可能是批量插入的问题
    2025-06-11 11:30 
  • 华莉星宸 华莉星宸 回复 小白不白(提问者) 这最基本的插入 应该不是bug
    你插入是不是用了主键更新?你可以新建一个表 直接插入进去 看看是不是源数据在晚上发生了变化
    2025-06-11 11:33 
  • 小白不白 小白不白(提问者) 回复 华莉星宸 主键更新,是说数据库表那里设置了主键?还是kettle?kettle可以设置主键更新吗
    2025-06-11 11:35 
  • 小白不白 小白不白(提问者) 回复 华莉星宸 请问你们kettle的服务器一般运行内存是多少G,总是报JVM不足,感觉是这个原因导致的困顿然后数据传输不完整
    2025-06-11 13:36 
  • 华莉星宸 华莉星宸 回复 小白不白(提问者) 你就几行数据 应该不会内存不足吧~
    可以适当增加内存试试https://blog.csdn.net/Dreamy_zsy/article/details/108759508
    2025-06-11 13:56 
最佳回答
0
ScyalcireLv7高级互助
发布于2025-6-11 13:46(编辑于 2025-6-11 13:47)

你们晚上是不是有很多job同时执行的,自动执行时若并发任务多或JVM内存不足,Kettle可能因OOM(内存溢出)丢失部分数据

-------------------

1.调整spoon.bat/sh中的JVM参数,例如:-Xms2048m -Xmx4096m(根据服务器资源调整)

2.检查夜间服务器负载,避免资源竞争

  • 小白不白 小白不白(提问者) 对的,就是晚上一直有很多job并行执行;还有就是kettle和FineReport工程部署在同一个服务器了,资源占用有时候不及时重启都得70%多了,Windows提示JVM不足,所以夜间的时候感觉有这种可能,1,就是这么调整过的
    2025-06-11 14:03 
  • Scyalcire Scyalcire 回复 小白不白(提问者) 调整job的执行时间,每个都尽量错开,然后其他job避免全量更新
    2025-06-11 14:14 
  • 小白不白 小白不白(提问者) 回复 Scyalcire 全量更新 资源会更吃紧吗?但是我发现不论是增量更新,还是全量更新的时间 一个百万级别的表都得要25分钟左右
    2025-06-11 15:49 
  • Scyalcire Scyalcire 回复 小白不白(提问者) 增量更新通常比全量更新更节省系统资源‌,数据量小,10万以内,选择全量,百万级的,肯定选择增量
    2025-06-11 15:57 
  • 小白不白 小白不白(提问者) 回复 Scyalcire 好的 蟹蟹~ 我去优化优化,主要job太多,都错不开了,FR和kettle又部署在一台服务器上,FR晚上没人用,但是光开在那的资源占用率都挺高的,所以考虑是不是要把FR和kettle分开,不然JVM就是会不足

    2025-06-11 16:03 
  • 3关注人数
  • 34浏览人数
  • 最后回答于:2025-6-11 13:47
    请选择关闭问题的原因
    确定 取消
    返回顶部