设为首页|加入收藏
你的当前位置为:首页 >> 学术研究 >
农业机械大数据清洗算法研究
发布日期:2023-01-10 新闻来源: 正文字号
福建省莆田市荔城区拱辰街道办事处  郑志良

 前言
数据清洗对农业机械大数据平台的有效应用具有积极意义[1]。为提升数据清洗的精准性和实效性,有必要对农业机械大数据清洗算法进行研究。本文在分析农业机械数据异常情况的基础上,提出了基于滑动窗口的在线清洗算法,并通过试验验证了算法的有效性,以期为农业机械大数据平台的有效运行及数据的精准应用提供参考与借鉴。
1 农业机械数据异常情况分析
根据既有研究成果分析,本文将农业机械数据异常定义为在农业机械使用过程中的某个时间节点,服务器接收到的数据及其中的某数据要素,出现不完整、不精准等情况[2]。农业机械的运行条件较为复杂,在实际工作中,田间环境会对机械传感器的检测精度产生影响,表现为数据离散、缺失等;作业过程中的粉尘会对传感器的检测精度产生影响,表现为数据抖动等;农业机械发动机及供电系统的不稳定性会对传感器检测精度产生影响,表现为数据丢失、抖动等;农业机械具体工作环境中的网络信号、电磁信号,对数据传输产生干扰,表现为数据传输延时等[3]。
需要说明的是,本文讨论的农业机械数据异常的情况,不包括作业环境合理变化导致的数据波动。
2 农业机械大数据在线清洗算法
为实现农业机械大数据在线清洗,基于农业机械作业数据特征(以数值型为主),确定大数据在线清洗算法为滑动窗口法,其流程为数据异常识别—生成候选修正数据—候选修正数据的迭代修正。