科研产出
基于BERT-Attention-DenseBiGRU的农业问答社区问句相似度匹配
《农业机械学报 》 2022 EI 北大核心 CSCD
摘要:为了解决问答社区中相同语义问句文本的快速自动检测,提出一种基于BERT的Attention-DenseBiGRU农业问句相似度匹配模型。针对农业文本具备的特征,采用12层的中文BERT文本预训练模型对文本数据进行向量化处理,并与Word2Vec、Glove、TF-IDF方法进行对比分析,得出BERT方法能够有效地解决农业文本的高维性和稀疏性问题,并且解决多义词在不同语境下具有不同含义的问题。该网络的每一层都使用注意特征的连接信息以及前面所有递归层的隐藏特征,为了缓解由于密集拼接而导致特征向量尺寸不断增大的问题,在模型的最后使用自动编码器进行特征降维。试验结果表明:基于BERT的Attention-DenseBiGRU农业问句相似度匹配模型可以提高文本特征的利用率,减少特征丢失,能够实现快速及准确的农业问句文本相似度匹配,在本文所构建的农业问句相似对数据集上精确率及F1值达到97.2%和97.6%,与其他6种问句相似度匹配模型相比,效果提升明显。
关键词: 问答社区 农业问句相似度匹配 自然语言处理 密集连接BiGRU 协同注意力机制


大田土壤电导率快速检测系统设计与试验
《农业机械学报 》 2022 EI 北大核心 CSCD
摘要:为评价土壤肥力、生产能力及制作精准施肥处方,基于四端法原理设计了一种车载式大田土壤电导率快速检测系统,系统包括交流恒流信号源、信号检测调理电路及GNSS定位系统,可实现土壤田块不同区域内电导率的快速检测.通过试验探究土壤含水率、土壤浸出液电导率、电极入土深度、土壤温度对电极输出信号的影响规律并根据试验结果回归得出预测模型,模型决定系数R2为0.996 1.将系统安装到土壤电导率检测装置上进行大田试验,基于回归预测模型对系统检测数据进行计算,并与实验室土壤采样检测的实际值进行比较,试验结果表明,实验室建立的回归模型可用于大田土壤浸出液电导率计算,该系统在相同或相近路径上得到的传感器数据较为稳定,土壤浸出液电导率预测值与该区域系统检测值趋势相似,该系统预测模型可用于大田中快速实时检测电导率.
关键词: 土壤;电导率;四端法;快速检测;变量施肥


基于BERT的多特征融合农业命名实体识别
《农业工程学报 》 2022 EI 北大核心 CSCD
摘要:命名实体识别是农业文本信息抽取的重要环节,针对实体识别过程中局部上下文特征缺失、字向量表征单一、罕见实体识别率低等问题,提出一种融合BERT(Bidirectional Encoder Representations from Transformers,转换器的双向编码器表征量)字级特征与外部词典特征的命名实体识别方法.通过BERT预训练模型,融合左右两侧语境信息,增强字的语义表示,缓解一词多义的问题;自建农业领域词典,引入双向最大匹配策略,获取分布式词典特征表示,提高模型对罕见或未知实体的识别准确率;利用双向长短时记忆(Bi-directional Long-short Term Memory,BiLSTM)网络获取序列特征矩阵,并通过条件随机场(Conditional Random Field,CRF)模型生成全局最优序列.结合领域专家知识,构建农业语料集,包含5295条标注语料,5类农业实体.模型在语料集上准确率为94.84%、召回率为95.23%、F1值为95.03%.研究结果表明,该方法能够有效识别农业领域命名实体,识别精准度优于其他模型,具有明显的优势.
关键词: 农业;命名实体识别;文本;BERT;词典特征;BiLSTM


高光谱成像的煤与矸石分类
《光谱学与光谱分析 》 2022 EI SCI 北大核心 CSCD
摘要:煤与矸石分选是煤矿生产的必要工序,现有的人工分选与机械分选,存在效率低,易造成资源浪费以及环境污染等问题.鉴于可见/近红外高光谱成像具有分析速度快、样品无需预处理、无污染等诸多优势,旨在探讨基于可见/近红外高光谱成像对黑色背景下块状煤与矸石准确分类的可行性,并基于特征波长筛选算法简化模型,为构建多光谱煤与矸石分选系统提供理论参考.首先,搭建高光谱成像系统并采集山西西铭矿的85个煤样本与83个矸石样本在400~1000 nm(Vis/NIR)与1000~2500 nm(NIR)两个范围内的高光谱图像,基于图像处理方法去除背景信息,选取Vis/NIR范围内100×100像素和NIR范围内50×50像素区域内的平均光谱作为该样本在对应波段范围的一条光谱,重复10次,最终在两个波段各获得煤与矸石光谱850条和830条.其次,对光谱先后进行Savitzky-Golay卷积平滑和标准正态变量变换,以减少噪音和误差对光谱的影响.基于全波段光谱建立支持向量机(SVM),k近邻法(KNN),偏最小二乘判别分析(PLS-DA)三种模型,每个模型针对预测集的分类准确度均大于0.95,结果表明,基于煤和矸石的光谱信息可将二者区分.随后根据竞争性自适应重加权算法(CARS)和连续投影算法(SPA)选择的特征波长建立简化模型,综合考虑精度与成本等因素,在Vis/NIR范围内基于SPA筛选的3个特征波长所建立的SVM模型效果最好,不仅能有效减少波长数量,还能提高模型的分类效果,对应的灵敏度,特异度,准确度分别为1,0.9652,0.9833.基于判别模型与样本的平均光谱还可实现煤和矸石的分类可视化.研究结果对开发基于特征波长的低成本煤和矸石多光谱分选系统,实现煤矸快速、准确的无损检测具有借鉴意义.
关键词: 高光谱成像;煤;矸石;黑色背景;无损检测


基于SPA-SSA-BP的小麦秸秆含水率检测模型
《农业机械学报 》 2022 EI 北大核心 CSCD
摘要:为提高基于电容法的小麦秸秆含水率检测模型的检测精度,扩大含水率检测范围,提高模型适应性,本文以小麦秸秆为研究对象,使用LCR数字电桥,测量含水率为10.43% ~25.89%的秸秆在频率0.05 ~ 100 kHz、容积密度90.03 ~179.42 kg/m3和温度25 ~40℃内的电容,利用连续投影法(Successive projections algorithm,SPA)和主成分分析法(Principal component analysis,PCA)对原始数据进行预处理,提取特征频率,选用反向传播神经网络(Back propagation neural network,BPNN)在全频率及2个特征频率下分别建立秸秆含水率、容积密度、温度的定量分析模型,引入麻雀搜索算法(Sparrow search algorithm,SSA)优化反向传播神经网络模型.试验结果表明,基于全频率构建的模型较基于SPA算法构建的模型预测效果略好,综合考虑模型复杂度和预测性能,本研究选用基于SPA算法结合SSA算法优化后的BP神经网络模型(SPA-SSA-BP)作为小麦秸秆含水率的检测模型,其预测集R2p、RMSEP和RPDP分别为0.9832、0.00550和7.715.利用该模型对13个含水率为10.62% ~ 25.59%的秸秆样本进行预测,含水率预测结果的相对误差为-5.27% ~5.52%,其中96.8%的预测误差在±5%以内.由此说明,模型具有较高的准确性和较好的鲁棒性.


基于多维随机森林的番茄灰霉病高光谱图像早期检测
《光谱学与光谱分析 》 2022 EI SCI 北大核心 CSCD
摘要:植物病害的自动早期检测对于作物精确保护至关重要.提出了一种基于多维光谱序列(multi-di-mensional spectral series,MDSS)和加权随机森林(weighted random forest,WRF)的番茄灰霉病早期诊断与鉴别方法.目的是利用叶片多个观测维度的光谱曲线整体变化趋势建立作物病害检测模型,以期在肉眼明显可见叶面病斑前对作物病害实现诊断.将健康叶片接种灰霉病菌第3天作为叶片成功染病第1天.试验首先采集番茄健康叶片和染病叶片7天内每天的高光谱图像,提取感兴趣区域并计算平均光谱作为初始光谱数据,经筛选共得到(156×7)组有效样本.将样本数据按时间顺序拆分成分别包含1~7个维度的光谱数据形成多维原始光谱序列,为增加维度间差异性,相邻原始光谱序列相减构成多维关联光谱序列.分别采用符号聚合近似估计(symbolic aggregate approximation,SAX)和符号傅里叶近似估计(symbolic Fourier approxi-mation,SFA)两种符号化方法将光谱序列离散成局部辨别性特征.基于多维光谱序列的局部辨别性特征建立加权随机森林(MDSS-SAX-SFA-WRF)分类模型,实现病害早期检测.相应地,基于单维光谱序列(single-dimensional spectral series,SDSS)的番茄灰霉病识别模型被作为基准模型与MDSS-SAX-SFA-WRF模型比较.试验结果显示,MDSS-SAX-SFA-WRF检测模型在包含2至7个光谱序列维度的56个测试样本数据中均获得90% 以上识别准确率,在包含5个光谱序列维度测试集中得到最高99% 的识别准确率,较SDSS-SAX-SFA-MRF检测模型在染病第5天的识别率高8.2个百分点.另外受随机干扰的影响,SDSS-SAX-SFA-MRF模型准确率在染病5~7 d出现大幅度回落至最低84%,MDSS-SAX-SFA-WRF模型识别率在肉眼可见病斑阶段依然保持超过98% 的较高检测水准,未过度回落.因此,提出的基于多维光谱曲线整体变化趋势和加权随机森林(MDSS-SAX-SFA-WRF)的分类模型能够有效实现番茄灰霉病早期检测,并具有较强的鲁棒性,为染病初期的番茄灰霉病鉴别提供新思路.
关键词: 早期病害识别 高光谱成像技术 番茄灰霉病 随机森林 多维时间序列


利用无人机高光谱估算冬小麦叶绿素含量
《光谱学与光谱分析 》 2022 EI SCI 北大核心 CSCD
摘要:叶绿素含量(SPAD)是作物长势评价的重要指标,可以监测农作物的生长状况,对农业管理至关重要,因此快速、准确地估算SPAD具有重要意义.以冬小麦为研究对象,利用无人机高光谱获取了拔节期、挑旗期和开花期的影像数据,获取植被指数和红边参数,研究植被指数与红边参数估算SPAD的能力.先将植被指数与红边参数分别与不同生育期的SPAD进行相关性分析,再基于植被指数、植被指数结合红边参数,通过偏最小二乘回归(PLSR)方法估算SPAD,最后制作SPAD分布图验证模型的有效性.结果表明,(1)大部分植被指数与红边参数在3个主要生育期与SPAD相关性均达到极显著水平(0.01显著);(2)单个植被指数构建的SPAD估算模型中,LCI表现最好(R2=0.56,RMSE=2.96,NRMSE=8.14%),红边参数中Dr/Drmin表现最好(R2=0.49,RMSE=3.18,NRMSE=8.76%);(3)基于植被指数结合红边参数构建的SPAD估算模型效果最佳,优于仅基于植被指数构建的SPAD估算模型,同时,随着生育期推移,两种模型均在开花期达到最高精度,R2分别为0.73和0.78,RMSE分别为2.49和2.22,NRMSE分别为5.57% 和4.95%.因此,基于植被指数结合红边参数,并使用PLSR方法可以更好地估算SPAD,可以为基于无人机遥感的SPAD监测提供一种新的方法,也可为农业管理提供参考.
关键词: 冬小麦 叶绿素含量 植被指数 红边参数 偏最小二乘回归


交替光谱辐照对叶用莴苣营养元素水平的影响
《光谱学与光谱分析 》 2022 EI SCI 北大核心 CSCD
摘要:在人工光型植物工厂中采用深液流水培法栽培叶用莴苣,依托光谱时空分布可精准调控的智能LED光源系统,应用电感耦合等离子体原子发射光谱技术(ICP-AES),研究了5 min,10 min,15 min,30 min,60 min,2 h,4 h和8 h等不同间隔的红、蓝光谱交替照射对叶用莴苣中K,P,Ca,M g,Fe,M n,Zn和Cu等8种营养元素吸收和累积的影响.结果表明:(1)与同时照射模式相比,所有的交替光谱处理均显著提高了叶用莴苣地上部生物量,其中鲜重提高幅度约为18.6% ~67.4%,干重提高幅度约为5.1% ~88.0%;所有的交替红蓝光谱照射下叶用莴苣体内Mg,Fe和Zn元素的植株累积量均得到显著(p<0.05)地提高;所有的红蓝交替光谱辐射处理均不同程度地降低了叶用莴苣植株中Ca元素含量.(2)间隔为5 min的红蓝交替光谱辐射下莴苣植株Fe元素含量显著高于其他任意处理,较其他处理增加了38.87% ~85.37%,高频次的红蓝光切换照射刺激了叶用莴苣植株对Fe元素的吸收.(3)红蓝交替光谱辐射有利于提高叶用莴苣的能量利用效率,与红蓝同时供光的RB处理相比,所有交替处理均显著提高了叶用莴苣的光、电能利用率,提高幅度分别约为34.3% ~87.5% 和34.6% ~87.9%;其中,间隔为4 h的红蓝交替光谱辐射下叶用莴苣植株的光、电能利用率均最大,分别为6.13% 和2.01%,除间隔为5和10 min的红蓝交替光谱辐射处理外的其他交替光谱处理下的植株光、电能利用率均与处理间最大值无显著性差异.(4)叶用莴苣对K和M g两种元素的吸收在红蓝光交替间隔为10 min,15 min,60 min及4 h等多个处理下呈现拮抗现象.(5)R/B(30 m)处理下叶用莴苣中P,Ca,Fe和Mn等四种元素的含量水平均呈现处理间最低水平,其中P和Ca元素含量水平显著低于对照.
关键词: 交替光谱 非连续光谱 ICP-AES技术 叶用莴苣 营养元素


对比变分自编码器的近红外光谱测量及其在液态样品检测中的应用
《光谱学与光谱分析 》 2022 EI SCI 北大核心 CSCD
摘要:近红外光谱是热门的食品检测方法之一,对于这种高维光谱数据的分析常常需采用数据降维算法提取其中的特征,然而绝大多数算法都只能针对单个数据集进行分析.虽然已有基于对比学习的对比主成分分析成功应用于不同水果表面农残的近红外光谱检测中,但是该方法只能以线性的方式组合原有特征,特征提取效果存在局限性,并且需要调节对比参数来控制背景集影响,需要消耗更大的时间成本.cV A E(contrastive variational autoencoder)是一种基于对比学习和变分自编码器的改进算法,被用于图像去噪和RNA序列分析中,它仍然具备分析多个数据集的特点,同时因为组合了神经网络的概率生成模型而具备了提取非线性隐含特征的能力.将cV A E算法应用于近红外光谱分析,建立了准确的近红外光谱数据降维模型.在实际验证中,使用cV A E算法对购买的不同品牌和批次纯牛奶中掺假三聚氰胺进行检测.结果表明,使用VAE算法只能区分出不同品牌和批次的纯牛奶,而其中是否掺假三聚氰胺这一重要信息无法表现出来;而使用cV A E算法进行数据分析时,由于添加了背景数据集分离了无关变量,能够清晰的将有无掺假三聚氰胺的样本分类.这说明了,cVAE不仅具备了cPCA(contrastive principle component analysis)在近红外光谱数据降维中的优势,而且具备提取非线性特征的能力,同时不需要调节可变参数,能够更方便地建立近红外光谱降维模型.


夏季奶牛场生物气溶胶分布规律与环境影响因子研究
《农业机械学报 》 2022 EI 北大核心 CSCD
摘要:为探究典型季节下的奶牛场生物气溶胶的分布规律和多元环境因子对其影响程度,对天津市某规模化奶牛场生物气溶胶、环境参数进行连续采集,分析了夏季奶牛场生物气溶胶浓度和载体粒径的时空分布规律,同时筛选出对其浓度具有重要影响的环境因子.结果表明,在空间分布上,牛场近地面1 m高度处的生物气溶胶浓度显著高于近地面4 m高度处浓度(P<0.01).在粒径分布上,各采样点的分布规律无显著差异(P>0.05),不同粒径粒子所占比例接近且存在粒径越小所占比例越小的趋势,粒径大于2.1 μm的粒子约占总数的80%.运用随机森林模型得到了 10个影响因子对生物气溶胶浓度的影响程度,其中风向(WD)、温度(T)、紫外辐射强度(UV)、悬浮颗粒物浓度(PM100)等对浓度影响较大.为进一步探究影响因子之间的关系,通过层聚类的方法分析各影响因素之间的共线性关系,发现PM10、PM1与PM2.5之间以及UV与GHI之间具有强共线性关系,可以去除强共线性影响因子,保留组内一种环境因子为代表.以节约采集成本.本研究可为国内牛场空气环境污染排放测定提供参考.
关键词: 生物气溶胶 时空分布规律 浓度预测模型 环境因子影响程度

