基于老年用户感知能力的人机界面视觉匹配研究
时间:2022-12-09 14:40:06 来源:柠檬阅读网 本文已影响 人
周橙旻,黄婷,罗欣,Jake Kaner
(1.南京林业大学,南京 210037;
2.诺丁汉特伦特大学,诺丁汉 NG1 4FQ)
视觉过程有难易、级别高低之分。简单的视觉过程,包括对物体形状基本要素的感受(如点、线、角、纹路等),以及感知色彩梯度、光流强度、物体深度等信息[1-2]。高层级的视觉感知可以实现对物体轮廓、形状、边缘的感知,如感知对象的整体亮度特征可通过结合物体的颜色和形状,感知运动状态可通过改变光的流动,感知三维形状可结合物体的形状和深度等[3-4]。老年用户在产品界面人机交互过程中,精准摘取信息的速度受尺寸、数量、间距等因素的影响[5-6]。
1.1 产品界面的感知能力要素
产品界面的人机交互过程中,老年用户的视觉匹配范围是设计痛点[7-9]。
1)尺寸,以直接方便的形式实现信息的传递,在识别方面有着不可取代的优势。
2)布局,有限的空间中需要展现出五花八门的信息,需要通过逻辑算法将这些无关联的信息进行串联,让用户在有限的时间里找到相关信息,提高信息的准确识别。
3)位置,空间有限就要求设计人员进行合理的板块划分,以提升信息处理的连贯性和逻辑性。
多级菜单面板布局的出现,要求用户花费更多的时间并执行更复杂的操作来提取有效的信息。值得关注的是部分老年用户在认知操作的前一步,即视觉搜索的感知过程中便存在困难和障碍。例如Lindberg等[10]进行了图标能力感知的测试研究,结果表明,图标间间距需大于自身尺寸,显示尺寸不小于0.7 cm,以确保老年用户的操作绩效。鄂明顺[11]从设计学角度针对人机界面,确立了视觉记忆和工作记忆为两大关键因素,以此建立不同交互视觉要素的设计法则。
1.2 界面视觉搜索能力评估
界面的搜索能力一般指代用户排除外界干扰因素准确搜寻目标界面的能力[12]。老年用户对科技产品了解甚少,缺乏操作经验,因此在产品多级界面下对目标信息进行精准搜索变得愈发困难。数量、尺寸、形状等都会成为影响老年用户精准搜寻界面信息的影响因素。测评老年用户界面视觉搜索能力的方法主要分为以下两种:
1)绩效评估[13-14]。现有的绩效评价指标通常可分成三种:操作准确率(Action Accuracy rate,ACC),指用户在完成测试任务过程中正确操作数量和总操作数量的比,如将操作正确率作为一项绩效指标;
反应时间(Reaction Time,RT),指用户完成测试任务所耗费的时长,如将任务完成的时间作为一项指标;
正确率与完成时的复合评估(ACC&RT),正确率是判别任务完成与否的唯一指标,发生正确率无明显差别的情况,依据完成时间进行辅助评估,如将操作正确率和反应时两者复合为评价指标。
2)眼动评估[15-18]。眼动评估指标主要有两种:热点图(Attention Heat Map),眼动仪捕捉下,利用热点反应测试者关注区域的时长;
注视次数(Fixation Count),注视次数的数量反映界面的繁简程度[19]。
2.1 实验样本设计
20 种风格相近、色彩类似的家具产品图标,在尺寸、布局、间距的自变量下,依据被试的水平设定参数范围,进行三次重复实验最终选取平均值。图标尺寸分别为24*24、32*32、40*40、48*48 和56*56五种(单位:px²)。布局分为两种,分别为列表式排列、宫格式排列。界面尺寸为375 px*812 px(一倍图),图标间距离分为五种,分别为1/2、1、3/2、2、5/2 图标尺寸。本次实验采用5x2x5 种界面配置,在实验手机界面共展示20 个家居设备图标。老年感知能力实验样本(如表1 所示)图标尺寸分别为24*24、32*32、40*40、48*48 和56*56 这五种,单位:px²。图标距为1~2 倍、2~2 倍、3~2 倍、4~2 倍、5~2 倍进行实验,见表2。
表1 宫格布局尺寸汇总(列数*行数+余数,单位px²)Tab.1 Summary of square layout dimensions (number of columns * number of rows + remainder, unit: px²)
表2 老年感知能力实验样本(部分)Tab.2 Experimental sample of perception ability of the elderly (section)
2.2 实验方法
2.2.1 被试
招募实验被试60 名,29 名男性、31 名女性,年龄为60~80 岁(M=67,SD=6.051),视力正常或者矫正后正常。实验前,被试会被要求填写有关基本特征感知的问卷信息,包括姓名、性别、视力辨识能力、色彩喜爱程度等。
2.2.2 设备条件
采用心理实验软件E-prime 编写实验程序,采用CPU 主频为3.0 GHz 的计算机。采用6.25 英寸显示器显示刺激目标,该设备屏幕分辨率为1520×720 HD,显示亮度为92 cd/m2。实验在室内照明条件正常的家居环境中进行,电脑屏幕背景为黑色,被试与屏幕中心的距离为300~350 mm。
2.2.3 实验流程
实验具体操作为单独个体测验。在测试进行前,被试需要按照实验要求完成基本的练习实验;
通过计算机显示屏向被试显示导语指令,告知实验流程与需求。正式测试开始时,注视点显示在屏幕中央,持续时长500 ms。接着一个图标界面显现在屏幕中,告知被试要找的图标名称,如图1 所示。
当参与者点击正确的图标时,图标突显且界面变暗,屏幕会随机显示一种测试条件下的界面配置。为了避免被试者的点击行为对视觉搜索时间造成影响,实验要求被试者在点击前大声说出“找到了”,由实验员记录被试者的视觉搜索时间、次数,至此一次测试完毕,屏幕随即呈现下一个需要查找的图标,依次类推直到所有测试完毕。每种排列需测试3 次,即进行3 次目标选择,共150 次,实验样本如图1 所示。实验结束后,对用户进行深度访谈,要求用户给出一个可识别度评分用来评估图标的辨识度。在测试中,每完成50 次,被试者有5 min 的休息时间。每个被试者完成所有测试的平均时间约为17.9 min。
图1 老年测试程序界面图表大小和图标间距实验样本举例Fig.1 Samples of aging test program interface
2.2.4 因变量说明
正确率与反应时间之间是否存在科学逻辑关系尚未可知,因此利用综合性绩效指标GP 来同时表述这两种变量。
式中,ACC 为正确率,如全都准确辨认则取1;
否则,以正确数除以全部题数。
RT 是指用户反应所花费的时间(单位:ms),取它的自然对数。GP 与正确率的关系呈线性正相关,正确率越高GP 也越高;
而GP 与反应时间的关系呈非线性负相关,反应时间越短,GP 值越高。特别地,当正确率为0 时,GP 与反应时间无关,定值为0 可以排除错误数据,不包含在性能统计中。
利用SPSS 软件对实验结果进行重复测量方差分析,结果如表3 所示(表中F 值是F 检验的统计量,也就是组间和组内的离差平方和与自由度的比值;
偏Eta 平方:η2(eta-squared)在方差分析中用于估计独立变量的效应大小,等于某自变量的方差与总方差的比值)。
表3 多变量检验aTab.3 Multivariate test A
多变量检验是多变量方差分析中最重要的一个部分。从分析结果中可以看到,对于截距、图标尺寸、图标间距,以及图标尺寸*图标间距,都采用了比莱轨迹、威尔克Lambda、霍特林轨迹、罗伊最大根四种方法进行检验。四种方法的检验结果都是一致的,截距显著性小于0.001,图标尺寸、图标间距以及图标尺寸*图标间距显著性也都小于0.001。模型截距一项小于0.001,表示当自变量取值为0 时,因变量的值并不为0,即图标尺寸或图标间距为0 时,反应时长、正确率、GP 都不一定为0。图标尺寸/图标间距/图标尺寸*图标间距显著性小于0.001,表示不同图标尺寸/图标间距/图标尺寸*图标间距下的反应时长、正确率、GP 存在极其显著的差异。
通过表4 主体间效应检验可知,不同变量对应的因变量的差异情况。图标尺寸对应的反应时长、正确率、GP 的p<0.001,存在极其显著的差异。且偏Eta平方最小为0.655,最大为0.833,表明自变量“图标尺寸”,能很好地区分反应时长、正确率和GP,可信度较高。图标间距对应的反应时长、GP 的p<0.001,而正确率的p>0.05,说明图标间距对正确率没有统计学差异,且偏Eta 平方一栏,正确率值为0.145,可信度较低。在图标尺寸与图标间距的交互作用下,反应时长、GP 的p<0.001,存在极其显著的差异,而正确率的0.05>p>0.001,存在显著差异。偏Eta 平方最小为0.518,可信度较高。
结合表4 可以得出,图标尺寸以及图标尺寸与图标间距的交互作用对反应时长、正确率、GP 的影响较大。图标间距对用户的反应时长产生影响,从而影响GP。
表4 主体间效应检验Tab.4 Test of inter-agent effect
3.1 不同图标间距下,图标尺寸对反应时长的影响
从图2 反应时长的估算边际平均值中可知,除图标间距为图标5/2 倍这一条折线之外,其余四条(不同图标间距)折线的谷值图标尺寸皆为40*40 px,且图标尺寸越大,间距在3/2 倍及以上的反应时长越长,间距在3/2 倍以下的会出现异常突变。表明在图标间距小于图标尺寸2 倍距离的情况下,边长为32~48 px的图标,老年用户的反应时长较短;
边长低于32 px的图标,老年用户反应时间会有所加长;
边长高于48 px,受图标间距影响较大。
图2 反应时长的估算边际平均值Fig.2 Marginal average estimated reaction time
估算边际平均值:是指剔除其他变量影响时算出的均值。例如当自变量唯一时,边际均值和普通均值是一样的;
当有两个自变量时,边际均值和普通均值的结果是不同的。
3.2 不同图标间距下,图标尺寸对正确率的影响
正确率的估算边际平均值反映出,老年用户视觉搜索能力会随着图标尺寸增长,呈现正确率增加的情况。总体峰值在图标尺寸边长为40 px 时,图标尺寸边长为24~40(不包含)px 时,会出现正确率大幅提升情况,大于40 px 会出现波动,正确率皆大于90%,见图3。
图3 正确率的估算边际平均值Fig.3 Marginal mean of accuracy estimation
3.3 不同图标间距下,图标尺寸对GP 的影响
GP 由反应时长和正确率共同计算得出,是两者的综合体现,在一定程度上反应了两者的特征。如图4 所示,除图标间距为图标5/2 倍这一条折线之外,
图4 GP 的估算边际平均值Fig.4 Estimated marginal mean of GP
其他折线的峰值皆在图标尺寸边长40 px 上。图标尺寸边长为24~40(不包含)px,会出现GP 的大幅提升。当图标间距尺寸大于图标尺寸1 倍时,GP会在图标尺寸边长大于40 px 的情况下呈下降趋势。
根据上述分析可得,当图标间距为图标尺寸的1/2~5/2 倍,图标尺寸为40 px*40 px 时测试结果最佳。本研究以探究老年用户可操作能力范畴下的能力余裕范围、能力适配范围、能力不足范围为主要目的,主要关注能力适配范围前后的阈值,即能力余裕-适配阈值(Capability Excess to Adaptation Threshold,EA)和能力适配-不足阈值(Capability Adaptation to Inadequate Threshold,AI)。本实验根据图5a 图标尺寸RT/ACC/GP 描述性结果、图5b 图标间距RT/ACC/GP 描述性结果,即反应时长、正确率,以及两种交互作用得出的GP,可将图标尺寸、图标间距各分为三档。
图5 图RT/ACC/GP 描述性结果Fig.5 Descriptive results of RT/ACC/GP
根据实验研究结果,得出能力余裕-适配阈值EA 和能力适配-不足阈值AI 的具体数值后,即可录入数值,通过逻辑算法最终模拟构建用户的实际能力梯度,为后续用户需求的功能难度系数计算与设定提供了理论指导意义。结合图6a 和图7a 可知,尺寸“余裕与适配”的转折点E=32*32 px,“适配与不足”的转折点A=48*48 px。图标尺寸编码的余裕范围为{ER|ER>48 px},能力适配范围为{AR|32 px≤AR≤48 px},能力不足范围为{IR|IR<32 px}。结合图6(b)和图7(b)可知,间距“余裕与适配”的转折点E=1 倍,“适配与不足”的转折点A=2 倍。图标间距编码的余裕范围为{ER|ER<1 倍},能力适配范围为{AR|1 倍≤AR≤2 倍},能力不足范围为{IR|IR>2 倍}。
图6 实际能力梯度Fig.6 Actual capability gradient
图7 实际能力梯度示意图Fig.7 Schematic diagram of actual ability gradient
针对老年用户群体进行用户感知与界面视觉匹配的相关研究,选取界面设计中的图标尺寸、图标间距为实验变量,以此进行老年用户感知能力梯度构建实验,利用综合绩效指标GP 反映老年用户的信息抓取准确率。试验结果如下:图标尺寸,余裕范围为{ER|ER>48 px},能力适配范围为{AR|32 px≤AR≤48 px},能力不足范围为{IR|IR<32px};
图标间距,余裕范围为{ER|ER<1 倍},能力适配范围为{AR|1 倍≤AR≤2 倍},能力不足范围为{IR|IR>2 倍}。研究表明,在面向老年用户的界面设计中需要更多关注图标尺寸、图标间距两种设计因素,图标尺寸要控制在32~48 px 且不低于32 px,图标间距要控制在1~2 倍,且不超过2 倍距。