【论文笔记】设计一款针对情境障碍的视力减弱型文件浏览应用程序(下)

news/2024/5/18 12:16:42

论文关键点

ps:这篇文章可以学习的内容比较多,笔记内容也比较丰富因此本次论文笔记会分为上下期

提出的问题: 不方便视觉障碍的情况下(通勤、走路、眼睛疲劳也算)会用text-speech 系统,但是这种听觉是线性的,不适合skim

推导出了融合听觉和视觉阅读模式的“减少眼睛”略读的概念,灵感来自参与者如何混合视觉和非视觉交互,生成了一套减少眼睛的略读设计指南

对于视障情景存在的问题有比较完善的呈现


设计

原则

我们对来自多个数据源的含义进行三角剖分,以制定一套稳健且全面的设计准则。数据来源包括:( 1 )我们的需求发现研究结果;

( 2 )现有的关于略读和无视觉反馈交互的理论和实证研究;

( 3 )现有的关于创造语音叙述和设计VUI的指南。

三角剖析

这意味着他们已经整合和比较了来自各种来源的见解,以制定一套更强大、更全面、更可靠的结论或指南。

就本文的情况而言,这些来源包括

  • Needs-Finding Study
  • skim reading and eyes-free interactions
  • existing guidelines for creating voice narrations and designing VUI.

目标是确保由此产生的设计指南是全面的,并且以各种形式的证据和观点为基础

设计原则在产品上的实施

navigation

  • 用户只需轻点屏幕右侧或左侧,即可跳过句子或重听错过的段落(图 1(a))。
  • 段落导航通过上下垂直滑动手势完成。这是因为滚动是人们与生俱来的习惯,而基于 HTML 的文档又是垂直流动的,因此 Skimmer 的目标是促进从视觉滚动到无视觉手势交互的积极转移。
  • 空间参照点进入下一句或跳转到远处的句子时,内容会自动垂直滚动,使参照位置始终位于屏幕正中。这就使得定位(DG5)变得非常简单,只需瞥一眼屏幕,查看指示器指向的文本(图 1 中的红色箭头)。
  • Skimmer 遵循 "减少眼睛 "的理念,还支持通过传统的垂直滚动方式进行视觉导航(DG-2)。
  • 一旦用户触摸屏幕进行导航操作,Skimmer 就会暂停音频(DG-3)

comprehension

  • 首先,书面文本和结构信息用两种不同的声音叙述,以帮助区分元信息(e.g."第 1 节。导言")和正文内容。
  • 其次,Skimmer 会将长长的项目清单或项目符号分解成一组一组的,每次 3 或 4 个项目,以帮助记忆
  • 最后,Skimmer 会以四舍五入的格式读取数字(例如 p < 2.2 × 10-16 会被叙述为 p < .001),因为光听是很难理解复杂数字的。
  • 此外,Skimmer 还提供了数字的放大文本叠加(图 1(b))。

标记跳转

  • Skimmer 支持在不同的话语标记之间选择性跳转(DG-2)。 话语标记和完整句子都由同一个低音调的声音叙述。为了帮助用户从正常的叙述中分辨出话语标记的叙述,Skimmer 会播放微妙的环境音(如蟋蟀声)作为背景音。
    ps:话语标记的例子包括“结论”、“首先”、“另一方面”或“在本文中”等短语。这些短语通常表示新部分的开始、主题的变化、摘要或介绍。它们是帮助读者理解文本不同部分如何相互关联的关键。

structure 跳转

  • overview(图(c))
  • 也满足了个性化阅读顺序的需求

ps:Users appreciate Overview the most

触觉提示(帮助focus)

  • 遇到图会触觉提示
  • 可以跳转(不听这个图的内容)也可以继续听

听觉提示(帮助focus)

  • 用耳标来提供听觉反馈(6个以下,防止混淆)
  • 提示状态变化:用户进行了操作之后, 听觉反馈操作成功

Findings

  • Skimmer可以减少眼睛的使用,而VDR(VoiceDreamReader,比较的竞品)需要近乎恒定的视觉注意
  • 用户最喜欢的是Overview。
  • 听觉反馈和力触觉反馈有助于重新聚焦
  • 用户喜欢导航偏好的个体差异
  • 去掉一个复杂的数字对于那些尝试过这个数字的人来说仍然是一个挑战
  • 用户欣赏叙事的质量和多元的声音(声音没有那么僵硬,而且用了口语话一点的语言)
  • 话语标记语是有用的,但使用者需要更多地接触该特征(好用但是有学习成本)
  • 图形/表格大多被忽视,但参与者赞赏触觉推进器的想法。
  • 参与者对Skimmer的设计理念表示赞赏。

个人思考

  • 场景比较巧妙:讨论的是情景视障,这样实验人群比较好找


http://www.mrgr.cn/p/28446372

相关文章

基于Google Gemini 探索大语言模型在医学领域应用评估和前景

概述 近年来&#xff0c;大规模语言模型&#xff08;LLM&#xff09;在理解和生成人类语言方面取得了显著的飞跃&#xff0c;这些进步不仅推动了语言学和计算机编程的发展&#xff0c;还为多个领域带来了创新的突破。特别是模型如GPT-3和PaLM&#xff0c;它们通过吸收海量文本…

vue封装请求、合并js、合并多个js

vue封装请求、合并js、合并多个js 作为一个后端开发&#xff0c;写前端时发现&#xff0c;每次导入api接口都会有一堆代码&#xff0c;像下面这样&#xff1a; import {footprintList, footprintDelete} from /api/userApi.js import {addressList} from /api/userApi.js impor…

四月二十五日 Android studio关于使用sqlite数据库

昨天早上六点就起来要去排队考科目一,实在是困得很,昨天晚上早早就睡了,其实解释为什么昨天没有博客。 一个好消息就是我顺利的考过了,刚到90,还是很惊险。 还是说一下最近在干什么,之前是一直用的MySQL连接我的Android studio,最近在学习使用它自带的一个sqlite数据库,…

双向循环链表的插入和删除

数据结构 线性表--双向循环链表操作 ~~**注意!!!**怎么说,今天(2024.4.24)找一个小小的运行bug(没有报错)找了非常之久,明天继续把这些代码补齐,啊啊啊,但是感谢还是把这个bug找出来(这段话我不会删的)~~插入 1)头插/******************************************…

前端零代码开发实践:页面嵌套+逻辑连线0开发扩展组件,实现切换开关控制扇叶转动。能无代码封装扩展组件,有别于常规的web组态或低代码平台

前言&#xff1a; 官网:http://www.uiotos.net/ 什么是 UIOTOS&#xff1f; 这是一款拥有独创专利技术的前端零代码工具&#xff0c;专注于解决前端界面开发定制难题&#xff0c;原型即应用&#xff01;具有页面嵌套、属性继承、节点连线等全新特性&#xff0c;学习门槛低…

Ubuntu Pycharm安装

下载PyCharm&#xff0c;https://www.jetbrains.com/pycharm/download/?sectionlinux 然后按照下图执行安装&#xff1a; 安装的时候可能出现的问题&#xff1a; 问题1&#xff1a;No JDK found. Please validate either PYCHARM_JDK, JDK_HOME or JAVA_HOME environment var…

div探索1

当我在div里加了文本内容,嗯?好家伙所?以你是根据文本行高,定点在内容的顶部边缘,然后往下延伸的????想在顶部写一个水平导航来着,结果文字标签的垂直方向怎么也不能居中。 试验了一下,空的div在inline-block的时候是一字排开的,外在显示效果是长板效应,谁高谁撑开…

为什么要使用分账系统

不少现实生活中的场景都可能需要结合分账这一模式来实现结算,这篇文章里,作者就简单讲述了分账适用的场景,以及平台型企业选择分账系统的5个问题,一起来看看吧,或许会帮助你更了解分账系统的重要性。举个例子:在传统收单中,客户消费十块,这十块就直接结算给商家,这就结…

MSE实现全链路灰度实践

技术架构包括以下基础设施和云服务&#xff1a; 1个地域&#xff1a;ACK集群、微服务应用、MSE实例均部署在同一地域下。 1个专有网络VPC&#xff1a;形成云上私有网络&#xff0c;确保核心云资源的网络环境&#xff0c;如容器服务ACK、微服务引擎MSE。 ACK集群&#xff1a;简单…

壁纸测试

本文来自博客园,作者:舟清颺,转载请注明原文链接:https://www.cnblogs.com/zqingyang/p/18156634

文献学习-37-动态场景中任意形状针的单目 3D 位姿估计:一种高效的视觉学习和几何建模方法

On the Monocular 3D Pose Estimation for Arbitrary Shaped Needle in Dynamic Scenes: An Efficient Visual Learning and Geometry Modeling Approach Authors: Bin Li,† , Student Member, IEEE, Bo Lu,† , Member, IEEE, Hongbin Lin, Yaxiang Wang, Fangxun Zhong, Me…

第二期书生浦语大模型训练营第四次笔记

大模型微调技术 大模型微调是一种通过在预训练模型的基础上&#xff0c;有针对性地微调部分参数以适应特定任务需求的方法。 微调预训练模型的方法 微调所有层&#xff1a;将预训练模型的所有层都参与微调&#xff0c;以适应新的任务。 微调顶层&#xff1a;只微调预训练模型…

Net8微服务之Consul、Ocelot、IdentityServer4

前言 情绪的尽头是沉默 1.微服务概念 1.1微服务发展 分布式解决性能问题,微服务解决维护性、扩展性、灵活性。1.2微服务概念 微服务(或称微服务架构),是一种现代化的软件架构方法,它将一个应用程序分解为多个小型、独立的服务单元,每个服务都负责特定的业务功能,并且可以独…

后台管理系统加水印(react)

效果 代码图片 代码 window.waterMark function (config) {var defaultConfig {content: 我是水印,fontSize: 16px,opacity: 0.3,rotate: -15,color: #ADADAD,modalId: J_waterMarkModalByXHMAndDHL,};config Object.assign({}, defaultConfig, config);var existMarkModal…

Net8微服务实战

前言 学习杨中科老师开源项目在线英语网站微服务 1.需求 服务拆分2.项目源码项目 类 说明Peng.ASPNETCore DistributedCacheHelper 分布式缓存帮助类MemoryCacheHelper 内存缓存帮助类UnitOfWorkFilter 工作单元筛选器Peng.Commons Validators文件夹 FluentValidation的扩展类L…

OpenCV 如何实现边缘检测器

返回:OpenCV系列文章目录&#xff08;持续更新中......&#xff09; 上一篇&#xff1a;OpenCV如何实现拉普拉斯算子的离散模拟 下一篇 :OpenCV系列文章目录&#xff08;持续更新中......&#xff09; 目标 在本教程中&#xff0c;您将学习如何&#xff1a; 使用 OpenCV 函数…

java实现wav的重采样

原因是之前写的TTS文件&#xff0c;需要指定采样率和单声道 但是TTS是用的Jacob调用COMsapi实现的 javaWNI10JACOB方式 SAPI底层支持的是C&#xff0c;C#【官方文档】 SpAudioFormat SetWaveFormatEx method (SAPI 5.4) | Microsoft Learn 用C实现的方式【可指定输出的WAV…

vue3的ref和reactive

ref RefImpl&#xff1a;引用对象&#xff0c;如果想让一个普通变量变成响应式的&#xff0c;就需要把这个变量丢给ref。 修改的时候需要使用name.value进行修改。使用的时候直接使用name字段就行。 补充&#xff1a;const obj{name:’li’}定义的对象是可以修改对象里面的属性…

Oracle 脑残 CBO 优化案例

今天晚上下班回来才有空看群,群友发了一条很简单的慢SQL问怎么优化。 非常简单,我自己模拟的数据。 表结构:-- auto-generated definition CREATE TABLE HHHHHH (ID NUMBER NOT NULLPRIMARY KEY,NAME VARCHAR2(20),PARAGRAPH_ID NUMBER ) /CREATE INDEX I…

甘特图是什么?如何利用其优化项目管理流程?

甘特图是项目管理软件中十分常见的功能&#xff0c;可以说每一个项目经理都要学会使用甘特图才能更好的交付项目。什么是甘特图&#xff1f;甘特图用来做什么&#xff1f;简单来说一种将项目任务与时间关系直观表示的图表&#xff0c;直观地展示了任务进度和持续时间。 一、甘特…