• 美文
  • 文章
  • 散文
  • 日记
  • 诗歌
  • 小说
  • 故事
  • 句子
  • 作文
  • 签名
  • 祝福语
  • 情书
  • 范文
  • 读后感
  • 文学百科
  • 当前位置: 柠檬阅读网 > 范文 > 正文

    基于K-均值算法的烟气层高度判定方法

    时间:2023-02-08 10:15:05 来源:柠檬阅读网 本文已影响 柠檬阅读网手机站

    李 昂,侯 岳,任 凯,王康勃

    (海军工程大学动力工程学院,湖北 武汉 430033)

    烟气层高度值是表征室内火灾烟气特性的一个重要参数,是人员疏散时间、建筑防火安全性评估、防排烟设计过程中的关键计算依据[1],在火灾烟气试验中,基本都要对烟气层高度予以判定和计算。对烟气层高度的判定,一般是将温度、CO体积分数、CO2体积分数[2]中的一种作为分层表征参数,许多相关学者通过研究形成了一些烟气层高度判定方法,如:Cooper等[3]提出的N-百分比法;
    Quintiere等[4]提出的基于上层区域平均和质量等效的方法;
    Janssens等[5]提出的基于最大梯度的判定方法;
    He等[6]提出的积分比值法;
    毛少华等[7]针对烟气层温度较低、温度数据梯度较小的问题,提出了采用方差方法分析每层内部温度均一性和层间温度的最大差异性,在此基础上构建一个温度阈值与方差之间的关系式,最小温度阈值对应的高度即是烟气层高度。

    目前应用较多的烟气层高度判定方法是积分比值法。但应用积分比值法确定烟气层高度存在温度数据处理较为繁琐的问题,由于受算法的限制,该法仅能分析对象某一垂直方向上的温度数据,而实际计算过程中,假如要想得知整个空间内的烟气层高度变化情况,基本需要采用两种方式:一是沿烟气蔓延的方向一一处理每个垂直方向上的温度数据;
    二是先将一定区间内的温度数据进行预处理,将若干个热电偶数据合并为一个数据,但烟气层高度在纵向上的变化受到通风、空间结构、火源功率等因素的影响,很难准确判断合理的区间划分位置和数量,而且一般来说由于烟气具有卷吸效应[8],越向下游,烟气层的高度会变得越低,空间内整个烟气层高度较为一致的情况很难出现,因此无论采取何种温度数据处理方式,当烟气温度数据集规模较大时,采用积分比值法确定烟气层高度均存在工作量较大且过程复杂的问题。

    数据挖掘理论中的K-均值算法[9]是利用一定的算法步骤自动抽取数据特征,并将不同数据进行分类,被广泛应用于数据分类问题。因此,本文将K-均值算法用于判定烟气层高度,并通过火灾烟气试验,对比分析了积分比值法、视觉法和K-均值算法3种烟气层高度判定方法所得到的结果,以验证K-均值算法的有效性。

    K-均值算法已被广泛应用于用户特征分类、故障诊断、模式分析等人工智能领域[10],是较为成熟的数据挖掘计算方法,具有模型数学思想较为简单、无需人工标记数据特征、自动进行类别划分的优点,因此非常适用于数据分类问题。其基本思想是通过初始化类别中心点,对样本数据与中心的相似性进行测度,对类间进行测度,从而自动将数据进行分类。

    1.1 K-均值算法的基本步骤

    K-均值算法是一种空间数据划分或分组的重要方法[11],该方法主要是将研究对象的空间距离指标按照相似性准则划分到若干个子集中,使得相同子集中各元素间差别最小,而不同子集中各元素间差别最大。最常用的是欧几里得距离,其表达式为

    (1)

    K-均值算法的计算过程如下:

    (1) 由用户确定所要聚类的准确数目K,并随机选择K个对象(样本),每个对象称为一个种子,代表一个簇(类)的均值或中心。

    (2) 对剩余的每个对象,根据其与各簇中心的距离将它赋给最近的簇。

    (3) 重新计算每个簇内对象的平均值,形成新的聚类中心。

    (4) 这个过程重复进行,直到下式准则函数收敛为止:

    (2)

    式中:E为所有研究对象的平方误差总和;
    p为空间的点,即数据对象;
    mi为簇Ci的平均值。

    按照这个准则生成的结果簇趋向于独立和紧凑,见图1。

    图1 空间聚类过程Fig.1 Spatial clustering process

    1. 2 簇数和聚类中心的确定

    根据K-均值算法的基本计算思路,进行烟气层高度的判定主要涉及到两个核心问题:一是设定最佳的类别数量(K值),数据挖掘中称之为总的簇数,确定了簇数就确定了烟气层的纵向划分区间;
    二是设定合理的初始聚类中心。这是两个影响到后续数据处理和计算量的主要问题。

    在经典算法中初始聚类中心是随机选择的,这样的方式有可能会使聚类结果陷入局部最优,一般来说对于这一问题的处理有多种方法,如CCIA算法、模拟退火算法、遗传算法等[13],但这些算法的计算过程过于复杂,存在计算量较大的问题。

    如何选择较为合理的初始聚类中心从而避免聚类结果陷入局部最优,其基本思路是先设定一个大致合理的初始聚类中心,之后根据算法再确定准确的初始聚类中心。火灾烟气由于卷吸效应的存在,烟气层与空气层之间存在一个“过渡层”,过渡层温度大致恰好位于高低温中间状态,确定了过渡层位置后,根据文献[14],由于各层内温度大致呈现由下向上增加的趋势,因此可以合理假定其聚类中心为几何中心,这样设定的聚类中心就大致吻合了实际的温度分布规律,从而避免了设定的初始聚类中心不准确导致聚类结果陷入局部最优的问题。

    图2 烟气层聚类中心选定Fig.2 Selection of clustering center of smoker layer

    如图2所示,假设已知p1,p2,…,pn点的数据,高度为z1,z2,…,zn,温度为T1,T2,…,Tn,纵向坐标为x1,x2,…,xn,确定烟气层和空气层初始聚类中心的基本步骤如下:

    (1) 划分区间。在纵向上划分区间,根据每一步所设定的聚类数K值,设定划分的区间数Rn=K/2,在纵向上将热电偶所占据的空间均等划分为Rn个。

    (2) 数据点分类。根据所划分的区间空间纵向坐标,将热电偶数据按区间划分,设区间的分界面纵向坐标为xRi,Ri+1,区间内任何一点pi的纵向坐标xi≤xRi,Ri+1。

    (3) 估算过渡层位置。设某一区间内数据点共有n个,因此过渡层竖向坐标和纵向坐标为

    (3)

    (4) 确定烟气层和空气层的初始聚类中心。设烟气层内的数据点为m个,空气层内的数据点为l个,因此两者的初始聚类中心由下式计算可得:

    (4)

    式中:zsj、xsj、Tsj分别为烟气层竖向坐标、纵向坐标和温度值;
    zaj、xaj、Taj分别为空气层竖向坐标、纵向坐标和温度值。

    1.3 K-均值算法确定烟气层高度的计算步骤

    按照前述方法可以设定初始的聚类中心和聚类数,某一烟气层的温度数据应当是在一定区域内聚集,意为针对一个类别而言,除了应使温度数据间的差异最小外,还应使一个类别的数据总体空间几何距离的差异最小,因此样本的向量空间应当包括纵向坐标值、竖向坐标值、温度值3个向量。

    按照K-均值算法的步骤,得到各个簇Ci的分类结果后,需要得到烟气层的高度值,即求解出烟气层与空气层分界面的坐标,具体的计算步骤如下:

    (1) 确定样本集合。设样本集合内包含m个样本,即D={p1,p2,…,pm},其中pi(i=1,2,…,m)代表每一个热电偶采集的数据,每个样本有3个向量,即pi=(xi;zi;Ti),其中,xi为第i个热电偶的纵向坐标;zi为第i个热电偶的竖向高度坐标;Ti为第i个热电偶的温度数据。

    (3) 设定初始聚类中心。初始聚类中心共有K个,即(μ1,μ2,…,μK),初始聚类中心的选定按照第1.2节中所述方法。

    (4) 计算样本与聚类中心的距离。按照下式计算每一个样本pi(i=1,2,…,m)与每一个聚类中心μp(1≤p≤k)的距离:

    (5)

    (5) 进行样本归集。根据欧式距离最小值,将相应的样本归入相应的簇,即Ci=Ci∪{pi}。

    (6)

    (7) 评价聚类结果最优性。对于第(2)步中给出的每一个K值,在聚类算法中,一般采用Silhouette指标评价哪个聚类结果是最优的[14-15],该指标反映了聚类结构的类内紧密性和类间分离度,按照下式计算:

    (7)

    式中:a(i)为样本i与类内所有其他样本的平均距离;b(i)为样本i到其他每个类中样本平均距离的最小值。

    得到了最佳聚类数kopt,即得到了所划分的烟气层纵向区间数,同时根据最佳聚类数,可以得到最优聚类中心的集合:

    (8)

    式中:Cμp为对应kopt的最优聚类中心集合。

    (9)

    将每一个簇的计算结果进行比较,如果xi=xj、Ti>Tj,则簇Ci为

    {(p1,y1),(p2,y2),…,(pk,yk)},yi∈{1}

    (10)

    反之,则簇Ci为

    {(p1,y1),(p2,y2),…,(pk,yk)},yi∈{-1}

    (11)

    式中:yi为样本标记,1代表烟气层,-1代表空气层。

    (9) 确定烟气层高度值。数据样本归类到相应的簇内,从纵向上就划分了区间,对烟气层高度的求解采用一个烟气层区间的平均高度来表征高度,这样可以突出表征烟气层的区间特征,此时只需要找到烟气层聚类中心与样本形成一定夹角范围内的边缘样本[16],求取其对应高度的平均值即可,其计算公式如下:

    (12)

    式中:Hs为某一区间烟气层平均高度(m);
    pci为簇Ci的某一个样本;zq为pci的竖向坐标值(m);z1,z2,…,zr为符合条件的各个样本的竖向坐标值(m);
    zj为得到的某一位置的竖向坐标最小值(m);
    xμ′和zμ′分别为簇Ci聚类中心的纵向和竖向坐标值(m);
    θ1,θ2为簇Ci边缘分布的特征角(°)。

    火灾烟气试验在海军工程大学舰船火灾模拟试验舱进行,试验舱共有3个部分,分别为模拟通道、狭小舱室和典型舱室,其中本次试验选取在典型舱室进行,其尺寸为5 m×5 m×2.5 m(长×宽×高),整体为钢制框架结构,试验舱室外观如图3所示。

    图3 试验舱室外观Fig.3 Appearance of the test chamber

    2. 1 试验测量仪器布置和工况设置

    2.1.1 试验测量仪器的布置

    试验火源采用柴油作为燃烧材料,容器为水浴钢制油盘,形状为方形,尺寸为0.6 m×0.6 m×0.2 m(长×宽×深),油盘内部采用钢制格栅进行分割,用于改变燃烧面积;
    试验布置了热电偶树,从1号门至2号门每间隔0.5 m布置一个热电偶树,其布置了8个热电偶树,每个热电偶树从底部至顶部每间隔0.2 m布置一个热电偶,共布置了108个热电偶;
    此外,试验舱室布置激光片源提供纵剖面光场,利于观察烟气层高度在整个试验过程中的变化情况,同时在光场中布置激光片源和标尺,通过查看标尺的视觉方法确定烟气层高度。试验测量仪器的布置,见图4。

    图4 试验测量仪器布置示意图Fig.4 Schematic diagram of test measuring instruments

    2.1.2 试验工况的设置

    对于试验工况的设定,根据美军所完成的舰艇火灾烟气特性试验表明[17],火源面积位于舱室空间尺寸(除设备占用面积的有效尺寸)的3/50~7/50区间内时,试验结果基本能够表征典型火灾时烟气的运动特征,火源面积占舱室空间尺寸的比例过小,则烟气产生速率不足,火源面积占舱室空间尺寸的比例过大时,其试验结果与典型火源面积比例区间内的试验结果并无本质区别。因此,为了保证试验的典型性,将火源面积占舱室空间尺寸的比例设定为3/50和7/50两种比例,即火源面积设定为0.16 m2和0.36 m2。另外,油盘底部安装了4个液压传感器,通过监测压力变化换算为液面高度变化,从而计算油盘燃料的燃烧速率,大致确定火源不同的燃烧阶段,并选取不同燃烧阶段的典型时间点,进行后续数据分析。试验过程中燃料的燃烧速率按照下式计算:

    为了保证试验工况的典型性,设置了两种工况,两种工况的油盘面积(即火源面积)和通风模式都不相同,油盘置于试验舱中心位置,试验工况见表1。

    表1 试验工况

    2. 2 试验结果与讨论

    按照前述的K-均值算法判定烟气层高度的计算步骤,采用MATLAB软件编制数据处理程序,用于处理温度数据,并针对两种试验工况,分别采用K-均值算法、积分比值法、视觉标尺法计算烟气层高度,通过对比分析来验证K-均值算法的有效性。

    2.2.1 C1工况试验结果及讨论

    图5和图6显示了C1工况时燃料的燃烧速率和距离火源中心0.5 m处不同典型高度处烟气层温度的分布情况。

    图5 C1工况时燃料的燃烧速率Fig.5 Fuel burning rate under working condition C1

    图6 C1工况时距离火源中心0.5 m处不同典型 高度处烟气温度分布图Fig.6 Smoke layer temperature distribution at different typical heights 0.5 m away from the fire source center under working condition C1

    由图5和图6可以看出:在0~120 s区间内燃料的燃烧速率上升较快,在120~200 s区间内燃料的燃烧较为稳定,200 s后燃料的燃烧进入衰减阶段,故选取不同燃烧阶段的时间点,即选定50 s、170 s、260 s三个时间点作为温度数据处理的时间点。

    利用K-均值算法分别对50 s、170 s、260 s时间点的温度数据进行了迭代,图7和图8分别显示C1工况时通过K-均值算法、积分比值法计算所得到的烟气层高度值。

    图7 C1工况时基于K-均值算法的烟气层高度Fig.7 Smoke layer heights obtained by K-means algorithm under working condition C1

    由图7可以看出:K-均值算法将50 s时烟气层高度划分为了6个区间,距离火源最远的位置,烟气层高度为2.38 m,火源中心烟气层高度最低,其值为0.33 m;
    将170 s时烟气层高度划分为了6个区间,其最高点为2.2 m,最低点为0.4 m;
    将260 s时烟气层高度划分为了3个区间,其最高点为1.5 m,最低点为1.3 m。

    图8显示了积分比值法得到的烟气层高度,积分比值法是按照不同的竖向高度来计算其烟气层高度的。

    图8 C1工况时基于积分比值法的烟气层高度Fig.8 Smoke layer heights obtained by internal ratio method under working condition C1

    由图7和图8可知:在50 s、170 s时间点,由K-均值算法计算得到的烟气层高度值在距离火源较远的位置要高于积分比值法的计算结果,而在火源中心位置两者计算得到的烟气层高度较为接近,原因在于K-均值算法计算得到的烟气层高度是一个区间内的高度,而积分比值法本质上是最小二乘法,其计算得到的烟气层高度是单个纵坐标点所对应的烟气层高度,由于算法的差异性,在远离火源的位置,由于卷吸效应较为明显,烟气层温度数据梯度较大,因此两者的计算结果有着明显的差异;
    通过比较两种算法260 s时烟气层高度的计算结果,可以明显看出,无论是距离火源较远的位置还是火源中心位置附近,两者计算结果的差异并不明显,主要原因在于此时烟气层温度较为均一,因此两者计算结果的差异不大。

    2.2.2 C2工况试验结果及讨论

    图9和图10显示了C2工况时燃料的燃烧速率和距离火源中心0.5 m处不同典型高度处烟气层温度的分布情况。

    图9 C2工况时燃料的燃烧速率Fig.9 Fuel burning rate under working condition C2

    图10 C2工况时距离火源中心0.5 m不同典型 高度处烟气层温度分布图Fig.10 Smoke layer temperature distribution at different typical heights 0.5 m away from the fire source center under working condition C2

    由图9和图10可知:在0~140 s区间内燃料的燃烧速率上升较快,在140~200 s区间内燃料的燃烧大体保持稳定,在240~340 s区间内燃料的燃烧进入衰减阶段,故选取典型燃烧阶段的时间点,即选定100 s、220 s、330 s三个时间点作为温度数据处理的时间点。

    利用K-均值算法和积分比值法,对C2工况时烟气层高度进行了计算,其计算结果见图11和图12。

    图11 C2工况时基于K-均值算法的烟气层高度Fig.11 Smoke layer heights obtained by K-means algorithm under working condition C2

    由图11可以看出:K-均值法将100 s时烟气层高度划分为了7个区间,其最高点为2.05 m,最低点为0.31 m;
    将220 s时烟气层高度划分为了6个区间,其最高点为1.6 m,最低点为0.31 m;
    将330 s时烟气层高度划分为了5个区间,其最高点为1.13 m,最低点为0.32 m。

    图12 C2工况时基于积分比值法的烟气层高度Fig.12 Smoke layer heights obtained by integral ratio method under working condition C2

    通过比较两种算法的计算结果(见图11和图12)可知:100 s时积分比值法计算得到的烟气层高度在侧壁附近接近K-均值算法的计算结果,而在火源与侧壁的中间位置附近,K-均值算法的计算结果显示出明显的区间特征,且出现“振荡”现象;
    由于单侧通风存在,最低位置并不位于火源中心,而是在中心靠后的空间区域,因此220 s时同样出现了“振荡”现象,两者的计算结果在烟气层高度值最低点较为接近;
    均值法计算结果显示出,330 s时烟气层高度仍然有较为明显的区间特征。

    利用视觉标尺法观察烟气层高度,可以进一步确定烟气层高度,表2显示了不同工况、不同燃烧时间时,通过3种方法计算得到的烟气层高度值经数学平均处理后的结果。

    表2 不同烟气层高度判定方法计算结果的比较

    通过火灾烟气试验,将K-均值算法与积分比值法进行对比,验证了K-均值法判定烟气层高度的计算步骤,得到如下结论:

    (1) K-均值算法与积分比值法相比较,两种方法对烟气层高度值的计算结果在各个位置点大体上一致,但是具体数值上存在差异,尤其是烟气层温度数据出现较大梯度时,两者的差异较为明显,但总体趋势和数值范围两者基本保持一致,故以K-均值算法为基础构建的烟气层高度判定数学模型是有效的。

    (2) 通过计算结果表明:K-均值算法可以自动将烟气层进行纵向区间的识别和划分,从而得到一个区间的烟气层高度,而积分比值法只能得到单个位置的烟气层高度,并且K-均值算法的计算结果能够更加突出表征烟气层高度的纵向区间分布特征。

    猜你喜欢 火源均值烟气 固体吸附剂脱除烟气中SOx/NOx的研究进展化工管理(2022年13期)2022-12-02火电厂烟气脱硫脱硝技术应用与节能环保分析消费电子(2022年6期)2022-08-25双火源隧道火灾数值模拟中南大学学报(自然科学版)(2022年6期)2022-08-01不同火源位置情况下的内天井结构建筑水上消防(2021年5期)2022-01-18辽宁省森林火源时空分布特征研究辽宁林业科技(2021年4期)2021-08-11水泥窑高温高尘SCR烟气脱硝系统的应用建材发展导向(2021年12期)2021-07-22火源位置对轻型门式刚架竖向位移的影响火灾科学(2020年4期)2020-06-30柴油机烟气排放状况及减排技术船舶标准化工程师(2020年1期)2020-06-12均值—方差分析及CAPM模型的运用智富时代(2019年4期)2019-06-01均值—方差分析及CAPM模型的运用智富时代(2019年4期)2019-06-01
    相关热词搜索: 烟气 判定 算法

    • 文学百科
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章