可视化是把数值或非数值类型的数据转化为可视的表示形式,并获得对数据更深层次认识的过程。可视化将复杂的信息以图像的形式呈现出来,让这些信息更容易、快速地被人理解,因此,它也是一种放大人类感知的图形化表示方法。
《人工智能之可视化报告》分为以下五个篇章:
1. 概述篇
2. 技术篇
3. 人才篇
4. 应用篇
5. 趋势篇
概述篇主要从阐述可视化基本概念出发,简要介绍可视化的发展历程、研究内容、设计原则与设计标准。
技术篇主要从数据可视化技术出发,对其包含的科学可视化、信息可视化和可视分析学来进行可视化技术层面的简单介绍。
人才篇主要通过 AMiner 大数据平台对可视化领域顶级学术会议及期刊论文的挖掘,提取论文中所有学者信息,从中选出 h-index 排名最靠前的 1000 位领域活跃学者,再通过对各大信息平台的数据挖掘,完善学者信息。
应用篇重点介绍了其中的社交媒体可视化、医疗信息可视化和体育数据可视化。
趋势篇主要是根据 AMiner 数据平台计算出的可视化全球研究趋势图。
本文节选了《人工智能之可视化》报告的应用篇的内容进行介绍,想要进一步了解可点击 “下载报告”~
随着 21 世纪大数据的兴起和发展,大数据可视化广泛应用于各个领域,本章节重点介绍其中的社交媒体可视化、医疗信息可视化和体育数据可视化。
4.1 社交媒体可视化
社交媒体,比如最近几年非常流行的 Twitter、Facebook、微博。它们可以作为强大的在线交流平台,允许数百万用户在任何时间、任何地点产生、传播、共享或交换信息。这些信息通常包括多种多媒体内容,如文本、图像和视频。在社交媒体上传播的大量多媒体数据,涵盖了全球范围内大规模和实时发生的社会动态信息,这种现象为社交媒体可视化提供了很多机会。
社交媒体技术层面上的可视化,主要包括:基于关键字方法的可视化,基于主题方法的可视化和多元方法的可视化。现有的研究大多集中于集体行为的可视化,这类研究的主题包括:信息扩散的可视化,社会竞争与合作的可视化,人的流动性的可视化。
社交媒体数据的可视化分析正在迅速发展,每年都有大量的新方法出现。然而,该领域仍处于起步阶段,面临许多挑战和悬而未决的问题。许多挑战不能仅使用来自一个规程的技术来解决。但是,将可视化、多媒体、NLP 和人机交互相结合的多学科研究,将带来处理和理解社交媒体数据会有更强大、更可行的方法和技术。具体社交媒体可视化如下表所示:
4.2 体育数据可视化
可视化技术在体育行业的运用越来越普遍。例如观众通过电视观看体育赛事时,经常能看到关于比赛情况的解读。以前使用技术数据统计与空间数据的方法来演示比赛实况,但用户并不能从可视化结果中看出比赛的发展趋势。现在,将技术数据统计和时间数据相结合,就能很好地反映比赛过程。基于对整场比赛或者比赛中某个时间段的赛况的可视化,大大帮助了用户分析比赛进程的动态变化。体育可视化使用的时间概念已经对时间做了一定程度的简化,它将客观事件发生的时间作为规律的时间单元进行处理,这种可视化方法能够反映比赛的趋势,很大程度上增加了用户的体验效果。
从数据角度出发,可以将体育数据可视化分为以下几类,如下表所示:
4.3 医疗数据可视化
医疗健康领域是与每一个直接密切相关的重要科学领域。一直以来,科学家在探索生命奥秘,及疾病产生机理的过程中,一直重视对跨学科技术的运用。从基于虚拟现实技术的仿真手术到手术机器人,从医学成像技术到医学图像处理,从大数据分析到人工智能,越来越多的新兴科技正在被应用到医疗领域,每一次技术上的革新与成功应用,都给医疗领域带来了全新诊疗技术,及科研手段,也提高了就诊治疗过程中患者的安全。
2010 年,医疗 2.0 伴随着互联网 2.0 的热潮应运而生,旨在利用一切先进科学技术帮助提升诊疗手段,攻克医学难题。2011 年,美国国家医学院 (MOI) 发布的该年度报告中特别指出,相对于其他技术在医疗领域的引用,信息可视化技术在医疗领域的应用显得尤为滞后,现有技术无法满足信息展现、用户交互、数据分析等众多需求。近些年来,伴随着大数据及人工智能技术在医疗领域的应用与普及,信息可视化及相应的可视分析技术在医疗领域的应用也得到了长足的发展。
可视化技术,尤其是科学可视化技术在医疗领域长久以来一直扮演者重要角色。例如,无论是平面 X 光扫描,还是三维 CT 影像,都应用到了科学可视化的相关技术。然而这些技术仍然局限于对于具象数据 (例如,人体的骨骼、器官组织结构等) 的展现。随着互联网的普及以及可穿戴设备的广泛应用,越来越多的与医疗相关的抽象数据被采集了上来,因此对信息可视化技术提出新的需求,这也正是 MOI 报告中所指出来的相关问题。针对这些新的数据与需求,在医疗 2.0 概念的范畴下,新的信息可视化技术被主要开发用来:
1) 展现用户的个人健康信息。例如,用于展现用户心跳、血压等状态的可视化用户界面;
2) 汇总并展现公众健康信息。例如,用于汇总展现禽流感在扩散趋势,或不同地区的人民健康状况等统计信息的可视化大屏;
3) 分析并展现临床电子病历记录中的规律与模式。例如,疾病的演变过程,以及诊疗方案的疗效等。前两类可视化面向的一般是不具备医疗知识的普通用户,因此,往往采用传统直观的信息可视化形式,如,柱状统计图,折线图等,以便于用户的理解与阅读。第三类技术,主要面向的是医生等具有专业背景,需要对数据进行深入调查,并做出职业判断的用户,因此这类可视化更具有针对性,可视化及相关分析技术的设计也更具挑战性。表 6 展现了上述的具体案例。