智能数字语音教学论文

2022-04-20 版权声明 我要投稿

摘要:网络化数字语言教学平台的建设规划,是将分散的多媒体数字化语言实验室等设备通过网络整合到一起,从而实现课堂教学与网上辅助教学的网络化、智能化管理,达到完善立体化语言教学资源建设的目的。利用信息技术与网络技术整合,将计算机设备、语音设备、网络设备等技术进行优化,实现资源共享,从而实现提高语言实验教学质量的目的。以下是小编精心整理的《智能数字语音教学论文 (精选3篇)》,欢迎阅读,希望大家能够喜欢。

智能数字语音教学论文 篇1:

2018中国智能语音市场投资价值白皮书

近年来,云计算、大数据、移动互联、物联网、深度学习等技术发展,智能语音在智能家居、可穿戴式设备、汽车电子、教育、医疗、金融等场景化应用持续深化,推动市场规模快速增长。为此,赛迪顾问围绕智能语音市场进行深入研究,针对重点行业的场景化应用、市场竞争格局及主要厂商的战略布局进行深刻剖析,并结合市场发展态势和资本关注热点领域进行投资价值与投资机会挖掘,期望能通过此研究为促进我国人工智能应用发展提供有价值的参考。

赛迪顾问

智能语音概念界定及发展演进

智能语音概念界定

所谓智能语音,是一种以语音为载体,利用智能语音交互技术,让机器具有像人一样“能听会说、自然交互、有问必答”的能力。智能语音市场则包含智能语音技术及产品的研发、生产、销售及应用服务等所有活动。

智能语音发展演进

技术演进:从1950年“人工智能之父”马文·明斯基开发出世界上第一台神经网络计算机起,智能语音技术发展主要经历了四个发展阶段:

萌芽期(20世纪50年代到70年代),主要以孤立词和小词汇量句子识别,并通过关键词匹配实现简单命令操作为主要内容。代表系统是1952年贝尔研究所Davis等人研制的世界上第一个能识别10个英文数字发音的实验系统,以及1960年英国的Denes等人研制的第一个计算机语音识别系统。

培育期(20世纪80年代),计算机技术、信息技术、模式识别技术极大促进智能语音技术发展,语音识别的研究开始向非特定人、连续词、大词汇量方向扩展,并且,智能语音技术研究由传统的基于标准模板匹配的技术思路开始转向基于统计模型(HMM) 的技术思路,使语音识别和自然语言理解技术有了较大的进展。1989年卡内基梅隆大学的李开复最终研制出第一个基于隐马尔科夫模型的大词汇量语音识别系统Sphinx。

成长期(20世纪90年代到21世纪初),20世纪90年代语音识别的系统框架并没有重大突破,但智能语音技术由研究走向实用并进入产业化,以1997年IBM推出ViaVoice为重要标志。自此,智能语音产品开始进入呼叫中心、家电、汽车等领域。这一时期也涌现出了很多有代表性的系统,如Nuance公司的NuanceVoicePlatform语音平台、Microsoft的Whisper,Sun的VoiceTone。智能语音关键突破起始于2006年,这一年辛顿(Hinton)提出深度置信网络(DBN),促使了深度神经网络(DNN)研究的复苏。

高速发展期(2010年至今),从2011年到2015年,以深度神经网络为基础的语音识别建模技术发展迅速,人工神经元网络(ANN)、卷积神经网络(CNN)技术等在语音识别中成功应用。从此基于GMM-HMM的语音识别框架被打破,大量研究人员开始转向基于DNN-HMM的语音识别系统的研究,随后也在此基础上派生出各类模型组合,使得语音识别准确率大幅提升。

应用场景:智能语音技术作为人工智能应用最成熟的技术之一,其应用领域非常广泛,目前,智能语音应用主要包括2C端应用和2B端应用两大类,其中,2C端应用有:智能家居、车载语音、虚拟助手、可穿戴式设备等领域应用;2B端应用包括呼叫中心/客服助理、教育、医疗、金融等领域应用。随着移动互联网、物联网应用的快速发展,目前,智能语音在智能家居、智能车载、智能可穿戴领域发展特别迅猛。

智能家居。当前,智能语音在智能家居控制系统中的应用最为广泛,智能语音交互技术重点围绕电视、空调、窗帘等家居设备展开,不仅能实现电视语音播放节目、空调自动温度调节、窗帘自动开关等智能控制,还可根据声纹识别技术确定主人身份,调取主人喜好自动打开电视影片或者播放音乐,根据情感识别技术识别用户情绪状态,制定拟人化情感交流模式。

国外巨头已先后以智能家庭产品与语音相结合的方式进入智能家居领域,如谷歌收购NEST布局智能家庭,不断强化Google Now的语音入口;苹果HomeKit智能家居平台与Siri也不断加强融合;微软也发布语音助手Cortana(小娜),开始在智能家庭领域擴展交互入口。在国内,智能语音龙头企业科大讯飞早在2014年就进军智能家居领域,其研制的智能语音助手灵犀可操控智能家居设备,包括电视、咖啡机、电灯、空调、热水器等。

智能助理。智能语音在智能助理的应用主要有2C端的虚拟个人助理、2B端的智能客服应用。其中,2B端的智能客服应用又主要分布在两大渠道上,一种是应用在呼叫中心IVR系统的自动语音导航,另一种则是分布在网站、微信、手机APP等电子渠道的客服应用。智能客服已经广泛地应用在金融、电信、交通、旅游等多个行业,主要形式有:智能问答、语音质检、语料挖掘等。相比传统客服,智能语音的引入能够发挥三大优势:降低企业运营成本。智能客服能有效减少客服坐席,降低人力成本;提高营销能力。智能客服反应快速,能为重点和热点问题提供快速统一答复,确保服务标准化及24小时全天候在线服务;辅助决策。利用自然语言处理技术分析文本,可挖掘客户信息,辅助制定企业商业决策。随着人口红利的消失,企业对智能客服的需求将越来越强烈,智能语音在客服领域将会有较大的渗透空间。

智能语音市场发展

发展现状

2017年中国智能语音应用市场规模超过60亿元。云计算、大数据、移动互联网、物联网、深度学习等技术发展正加速语音场景化应用进程。智能家居、可穿戴式设备、汽车电子、教育、医疗、金融等智能语音场景化应用持续深化,推动智能语音市场快速增长。赛迪顾问数据显示,2017年中国智能语音市场规模达到60.92亿元,同比增长36.9%。

智能语音在消费电子行业应用投资占比超过25%。从行业结构分布来看,2017年智能语音在消费电子渗透率最高,市场销售额占比高达25.7%。语音、语义等相关技术的可用性不断提高,带来虚拟助手市场的快速发展,从应用方向来看主要用于消费级产品如手机、智能车载、智能家居、可穿戴式设备等。占比次之的市场是教育领域的智能语音应用,智能语音越来越多的应用在学生的口语训练与考试、互动教学等方面。

竞争格局

根据赛迪顾问竞争矩阵评估指标体系数据,当前,在智能语音市场品牌竞争中,技术型厂商占据市场主导地位,特别是随着近年来深度神经网络、機器学习方法在语音识别领域的快速应用,对智能化应用需求日益凸显,技术型厂商凭借在语音识别、自然语言处理、自然语言理解、深度学习等领域深厚的技术优势牢牢占据市场竞争的第一梯队,这类厂商有科大讯飞、百度。

其中,科大讯飞通过实施“平台+赛道”的业务发展战略,打造持续闭环迭代的生态体系,不断在教育、司法、车载等重点领域通过“核心技术+应用数据+领域”支持构建垂直行业刚需及代差优势。百度则实施智能语音平台免费开放战略,迅速扩大百度人工智能生态圈。

在挑战者阵营中,捷通华声是最早成立智能语音的企业之一,凭借深厚的技术积淀,有全面的行业覆盖,成为智能语音市场的中坚力量。近年来,开始深入人工智能领域,以“云+端”的方式,通过构建全方位的灵云平台,将语音交互、图像识别、语义理解、生物特征识别等技术完美整合,为客户提供全方位一体化的人工智能技术与服务,成为市场重要挑战者。另一个重要的挑战者则是搜狗,由于NLP是搜索引擎的关键技术之一,因此搜狗自然而然成为重要玩家,他不仅打造了“知音OS”语音交互平台,还联合四维图新、飞歌等推出全语音交互的车载导航产品切入垂直行业市场,以“任务+应用”的形式在特定场景上发力,布局更多的终端入口,未来发展前景较为乐观。

在可期待阵营中,思必驰是少数拥有自主知识产权、中英文综合语音技术的公司之一,自2016年以来,致力于构建智能的一站式对话定制平台,营造人工智能良性生态圈,打造更加智能的人机交互体验。云知声凭借自身的技术研发优势和物联网战略定位迅速占领智能语音市场,并搭建面向物联网的“云—端—芯”一体化智能语音交互解决方案,在智能家居、医疗、车载、教育等行业落地成效明显。这两家企业发展势头强劲,成为市场中极具竞争力的挑战者。

发展趋势

未来发展趋势

场景化应用成为决胜关键。语音作为人类获取信息最自然、便捷的方式,正成为新一代信息流入口,伴随着互联网、智能家居市场,以及汽车市场的高速扩张,自然语言处理、语义分析、深度学习等技术不断深化,智能语音将加速渗透垂直行业,可穿戴式设备、智能家居、企业级服务、汽车智能化等都将成为智能语音的重要应用场景。未来,智能语音更强调人机多轮交互,更加重视垂直场景下的语义理解,以及后端服务,深耕场景化应用,充分利用更好的交互体验来创新产品与服务,锁定用户真正刚性需求,或将成为未来市场决胜关键所在。

更加注重语音生态建设。智能语音产品演进路线主要有两个方向,一是通过开发平台化占领一定场景下终端入口,如车载、智能家居;另一个则是为垂直服务领域提供智能语音服务,如教育、医疗等。无论是产品还是技术服务,想要获得更大的发展都必须加强与外部企业合作,包括横向与纵向行业企业合作,通过打造良性循环的生态体系,共同做大市场实现共同发展。当前,无论是技术型厂商如科大讯飞、云知声,还是互联网厂商如百度、阿里,无一例外都在加速打造基于语音为入口的生态圈,集聚海量用户与应用数据资源,挖掘用户需求,迭代产品与服务,在产业中构建不可或缺的地位,随着产业的发展不断壮大自身。

深度集成语音AI芯片将大行其道。随着智能终端产品的广泛普及,语音交互需求不断提升,语音服务将逐渐向芯片集成方向过渡。与传统智能语音解决方案相比,直接将语音交互集成在芯片上将大幅提升智能语音处理速度,提升语音交互的便利性,并很好地解决了智能终端设备存在着语音交互“时延”的问题。人工智能产业的快速发展,驱动以GPU、FPGA 、ASIC等为代表的AI芯片快速发展,语音芯片/语音AI芯片也成为最大机会市场,其功能性、智能性的优势,以及定制化、高能效、低成本等应用特点使其更能实现产品市场快速部署,可以预见,未来三年,随着智能音箱、车载语音应用的爆发,会有更多语音芯片的诞生,语音AI芯片也将迎来爆发期。

投资机会分析

自然语言处理是智能语音重要甚至是不可替代的组成部分,未来市场前景广阔。人工智能发展的三个阶段是机器学习、机器智能、机器意识;自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。目前,机器对句子的理解还只能做到语义角色标注层面,属于浅层语义分析技术。未来要让机器更好地理解人类语言并实现自然交互,还是需要依赖深度学习技术。由于智能语音对自然语言理解技术依赖性极高,自然语言处理必定会成为重要甚至是不可替代的组成部分。

智能语音芯片将率先在汽车、家居、机器人等场景下呈现规模化应用部署,有望迎来黄金发展期。未来,随着人工智能快速发展,弱人工智能将逐步向强人工智能转化,芯片作为人工智能重要的底层支撑,重要性不言而喻,以芯片嵌入的形式,能够将智能语音实现快速而广泛地应用,未来,随着下游垂直应用领域语音智能化需求的拉动,AI智能语音芯片有望迎来黄金发展期,AI智能语音芯片将率先在汽车、家居、机器人等场景下呈现规模化应用部署,为深度学习量身定制的ASIC芯片有望在计算速度和功耗上超越GPU和FPGA,是值得投资的重点方向。

车载语音交互将在强人工智能时代使汽车真正无屏化、智能化。语音交互是辅助驾驶的最好交互方式,车载对于语音控制和对话是刚需。智能车载语音能释放驾驶员的手和眼,使其更专注于前方的路况,引导更安全的驾驶习惯。语音交互指令集当中涉及地图、导航命令的解析和学习,而智能语音车载系统可以语音操控接打电话、控制开关车窗、播放广播音乐、实现路线导航等,去屏化应该是未来车载智能语音的发展方向与应用模式,未来,随着无人驾驶技术的推广,人为因素导致的安全问题将不复存在,车载语音将在强人工智能时代使汽车真正无屏化、智能化。

未来市场预测

随着移动互联网、物联网、人工智能、大数据的发展,智能语音将加速垂直行业场景化应用,巨大的移动智能终端、车载语音、智能家居、智能客服等行业需求将拉动智能语音市场的快速增长。预计在未来三年里,智能语音市场将保持高于30%的增长速度,到2020年,智能语音市场规模将达到134.93亿元。

智能数字语音教学论文 篇2:

网络化数字语言教学平台建设方案设计

摘要:网络化数字语言教学平台的建设规划,是将分散的多媒体数字化语言实验室等设备通过网络整合到一起,从而实现课堂教学与网上辅助教学的网络化、智能化管理,达到完善立体化语言教学资源建设的目的。利用信息技术与网络技术整合,将计算机设备、语音设备、网络设备等技术进行优化,实现资源共享,从而实现提高语言实验教学质量的目的。

关键词:网络平台;数字化语音室;网络设备

The Project Design of Building Digital Language Teaching Networking Platform

FENG Haiping

(Experiment Center,Dalian University,Dalian 116622,China)

1 引言(Introduction)

网络化语言教学平台是利用计算机网络技术,建设具有数字化教学资源共享的管理中心,旨在实现数字化的教学与学习、创建虚拟学习空间、实现教育的信息化和现代化,使原来分散的设备技术相对独立运作的网络视听、语言实验室和教学软件开发制作、教学资源管理控制设备和科研实验等设施体系组成一个统一的数字技术平台有机整体。

2构建网络化数字语言教学平台基本思路(The

basic idea for building the networking digital

language teaching platform)

本案是以外语语言实验教学中心为例。它是一个学校公共基础课教学体系的重要组成部分,集教学、科研和服务于一体,承担全校外语语言实验教学任务。大学英语教学模式采用基于网络和计算机的教学模式,实验教学是大学英语教学的重要组成部分,是完成大学英语教学要求的必备条件。大学英语课程教学中我们采用了大量先进的信息技术,开发和建设各种基于计算机和网络的课程,为学生提供良好的语言学习环境与条件。我们根据本校的条件和学生的英语水平,积极探索并建立了网络环境下的听说教学模式,建立的大学英语教学网络中心,可以直接在局域网上进行英语听说教学和训练。因此按照外语实验教学要求外语语言实验教学中心规划建设12个多媒体数字化语言实验室,共计813个座位,需要其将分散的网络教学设备通过网络平台的建设进行整合,实现包括:网络资源平台、全PC自主学习区与学习区数字监控系统、trados专业翻译教学实验平台、卫星地面接收及视频直播系统等互联互通,以及由超强服务器群组成的核心网络平台。

3 数字化语言实验室建设(The construction of the

digital language labs)

随着现代信息技术的发展和运用,多媒体教学已经成为网络化语言实验教学最有利的手段和方法。多媒体节目源数字化传输的可靠性、实时性、可操控性以及资源的共享性都为现代语言教学提供了技术方面的保障,多媒体硬件和多媒体技术为多媒体软件创作提供了有力支持,为数字化语言实验室和自主学习中心的建设和推广使用奠定了坚实的基础。

根据外语语言实验教学特点及需求,数字化语言实验室将建成集多功能于一体的数字化语言学习系统,它应能实现语言学习平台信息化和数字化、教学资源和教学方式网络化、学习模式互动化、功能多样化、学习个体化、操作简单化、测试标准化、管理统一化的要求,更好地与多媒体技术相融合,符合现代多媒体语言教学的发展趋势。所以我们将每个数字化语言实验室都建成包含数字语言实验室、计算机网络教室、多媒体教室三和一功能要求的语音室,实现“互动反馈式的双向教学”,满足特色化语言教学功能。在12套数字化语言实验室建设中,我们采用两套系统进行组合,其中7套是NewClass数字语言实验室系统DL500E型,5套采用蓝鸽数字语言实验室系统LBD2003U型,并且12套系统客户端都分别搭载HP 6280计算机。

NewClass语言实验室系统是建立在以太网的基础上,采用标准的IP协议,将音视频技术、流媒体技术与嵌入式系统设计完美结合。具有基本语言教学中听、说、读、写、译等全部功能,同时具备了学生自主学习、综合无纸化考试和口语考试等功能。功能特性包括:(1)教学功能:多媒体广播、示范教学、讨论发言、录音、分组、听力资料复听、跟读等全部功能以及支持系统自检、课堂学生认证、系统辅助教案播放;(2)自主学习:学生终端实现AOD音频点播、文本点播、自助式考试功能;Internet浏览、课件点播、大学外语教改网络教材自主学习;(3)考试功能:综合试卷考试、AB卷考试、双轨录音技术的口语考试、自动化口语考试、随堂考试、听力考试、试卷考试、写作考试、自动组卷、试卷管理;(4)学生档案管理、教学资源建立与管理、资源服务器群集分布式管理,如图1所示。

图1 NewClass数字语言实验室系统拓扑图

Fig.1 NewClass digital language laboratory

system topology

蓝鸽数字语言实验室系统采用ATM同步以太网,异步网络同步传输通信方式进行高保真声音的实时传输。功能上设计加入专业化师生互动系统,嵌入多种教学模式,配套口语发音自动评估、计算机口语自动领读等先进功能,独创协作式的互动教学环境,营造良好的自学辅导式的课堂教学环境。在拥有满足日常课堂教学的五大教学子系统外,还集成了“口语考试平台”“听力教学平台”“自习辅导平台”“技能训练平台”“口译教学平台”和“管理教学平台”,各平台皆为针对性教学,呈现出一体化的专业平台特色,且切换方便,可协调使用,充分体现了发挥教师主观能动性的教学理念。如图2所示。

图2 蓝鸽数字语言实验室系统拓扑图

Fig.2 LBD digital language laboratory

system topology

4 主干网网络建设(Major-network construction)

目前主流网络已经都是千兆网络,所以此次的布线及机房的接入交换机、核心交换机都是采用千兆的设备。由于学生客户端的数量为813点位,教师机大概100点左右,直接访问网络控制中心的服务器对核心交换设备压力很大,所以选择中高端的核心交换机,要求背板带宽大、包转发率大,这样可以使整个机房的机器在访问服务器上的应用系统时会更加流畅,不会出现等待死机状况。网络架构采用接入交换机直连核心交换机,这样可以增快整体访问速度,不会出现客户端打开BS结构的应用服务程序等待的状态。

在主干网建设中植入了机房管理系统,其目的是实现:(1)系统标准化管理,通过服务器中镜像的更新,实现了机房计算机系统地快速部署和维护,所有使用终端应用软件也得到了实时同步更新,提高了部署速度,真正做到了标准化管理;(2)数据集中化保管,将分散在终端的数据集中存储在服务器端,完成了数据实时备份,从物理架构上实现了数据集中管理,消除由于误操作、终端损坏和恶意操作等原因造成的数据丢失和泄密;(3)病毒彻底化杜绝,由于目前机房计算机病毒感染传播,有的病毒不断的向外发包,影响整个网络的带宽;机房管理服务器端的文件以镜像方式存储,病毒无法侵入,同时机房管理服务器端与外网隔离,彻底消除服务器端感染病毒的隐患;(4)使用终端“零维护”,终端在每次重启后,即可自动恢复到管理员配置系统初始状态,这样就实现庞大终端的系统“零维护”,学生能更便捷的操作使用,极大地提高了机房计算机维护效率;(5)备份存储,可以对所有的服务器进行数据和系统的备份,这样如果服务器的系统崩溃可以在几分钟内进行恢复,如果数据丢失可以在几分钟内对数据恢复,不限服务器端,以后增加服务器不用额外购买,对数据库的支持比较广泛,没有局限性,从而确保该硬件设备安全可靠。

主干网采用了三种网络交换机设备共同组建网络化数字语言教学平台,它将提供一个全千兆、安全、稳定的校园局域网,为教师办公、学生上课营造一个良好的网络环境。具体配备如下:

(1)网络核心交换机采用锐捷RG-S8606,这是一台面向下一代融合网络的高密度多业务IPv6核心路由交换机,满足未来以太网络的应用需求。该交换机融合了VSU(Virtual Switching Unit)、MPLS/VPLS、网络安全、无线网络、IPv6、流量分析等多任务特性。丰富的槽位选择预留了丰富的扩展余地,形成融合统一网络,完善的IPv6特性满足未来的升级改造。为网络化数字语言教学平台提供一个可靠的网络核心支撑。

(2)接入交换机采用RG-1824GT交换机,该交换机采用全千兆电口,有很强的背板带宽和网络稳定性。满足教学网络的需求,为各项教学应用提供良好的网络平台。

(3)出口路由采用RG-EG1000M,该设备是集路由、防火墙、行为管理、流控于一身的网络出口设备,对网络化数字语言实验室内部网络的设备进行流量控制,使带宽有效的被利用,行为管理功能可有效的抑制局域网内的不合理上网行为,对学生的课上、课下上网行为进行约束,防火墙功能有效的抵挡内外网的网络攻击行为,同时该设备的vpn功能,为教师的远程办公提供方便。

5 结论(Conclusion)

通过网络化数字语言教学平台的建设,我们拥有了一个开放的,能够承载语音、视频、图像等数据传输与交互功能的网络平台,得到了最宽广的融合性。网络的开放性、扩展性、融合性、技术领先性,使网络化数字语言教学平台具备了:(1)各种数据应用的合理有效运行分流;(2)抗攻击防病毒能力;(3)支持组播、划分VLAN控制广播风暴减小冲突域;(4)合理的分配带宽和控制学生的上网行为等特性。实现以校园网为基础的网络化语言实验教学、个性化自主学习、语言实践教学、口语考试、多媒体资源共享等教学功能。

参考文献(References)

[1] 王海波.外语网络教学与数字语言实验室的建设[J].中国现代教育装备,2006(8):5-7.

[2] 刘强军.NewClass数字化语言实验室使用和管理及维护[J].计算机光盘软件与应用,2012(9):95-97.

[3] 郑海英,马军,白彦华.数字语音室建设方案分析[J].实验技术与管理,2005(7):116-117.

[4] 高凡.英语数字化语言学习中心的构建与实施[J].湖北第二师范学院学报,2013(6):96-98.

作者简介:

冯海平(1961-),男,本科,高级工程师.研究领域:网络及多媒体技术.

作者:冯海平

智能数字语音教学论文 篇3:

虚拟与现实重构考古场景教学的实践与思考

摘要:本文以埃及吉萨金字塔、中国云冈石窟和忻州九原岗北朝壁画墓场景重构为例,从文物数字化、教学设计与效果、反思与愿景等方面,阐述了如何利用新颖的科技手段和教学方法,给予学生沉浸式的教学体验,使得考古教学方式不再局限于现实课堂,并且超越在线课堂。

关键词:虚拟与现实重构;考古教学;在线课程;体验式教学

● 引言

建构主义者认为,灌输给学生的知识无法被学生理解和接受,要深入理解和内化知识需要由学生在具体的学习情境中去发现和理解。[1]即使是预先规定的、标准化的、指定的和外部决定的内容也必须被放置在特定情境中由学生去掌握。[2]

考古学是以古代遗存为研究对象,根据古代人类各种活动遗留下来的实物来研究人类古代社会历史的一门科学。目前,考古实践教学面临的新问题包括:学生个性化选择与课程内容设置的错位、课堂与实践教学内容相脱节、实践地点的连续性得不到保障和学生兴趣与实践能动性不协调。[3]

传统的考古学科的基于大量数据、文字资料、平面图像,以教师为中心的灌输式教学,现如今已不能满足广大师生乃至社会公众的学习和研究需求。[4][5]虚拟现实技术(Virtual Reality,VR)有着各类学科交叉与相互作用的特性,是近年来被社会各界广泛关注的热点技术之一。[6]如何利用现今的全球化合作和信息技术手段,将丰硕的考古成果反哺教学,让学生从感官上更好地吸收知识?这是一个值得深思和探索的命题。

● 考古教学场景的虚拟与现实重构

1.考古教学场景的虛拟重构

随着VR技术的发展,特别是自2010年Oculus VR公司成立以来,VR设备的便捷性不断增强,成本不断下降,沉浸式体验效果越来越好,其在教育领域的巨大潜力开始得到了关注。2018年,浙江大学与哈佛大学(Harvard University)开始尝试进行基于网络的VR教育合作尝试,面向两校同时异地开设哈佛大学的VR课程:The Pyramids of Giza: Technology, Archaeology, History(《吉萨金字塔:科技、考古、历史》)。

《吉萨金字塔:科技、考古、历史》是近年来哈佛大学炙手可热的全校公共选修课。课程内容源自哈佛大学——波士顿美术馆(Museum of Fine Arts,Boston)联合考古队1902—1947年在埃及的大量考古工作。2000年,波士顿美术馆启动了第一期数字化吉萨项目。第一期数字化吉萨项目耗时十年,完成了吉萨考古资料的数字化与网络共享平台。

随着数字化吉萨项目的不断进展,2006年吉萨考古国际联盟组建,并开始汇总整理分布在全球范围内的吉萨考古资料及最新的吉萨考古发掘成果。2010年,数字化吉萨项目在哈佛大学的支持下进入第二阶段,并开始引入多种先进技术。目前,数字化吉萨项目正在试图发挥Web3D、AI、AR、VR等技术的优势,打造全新的网络学术平台。数字化吉萨项目负责人,也是本课程的主讲人,哈佛大学近东语言与文明学院教授Peter Der Manuelian认为:数字化吉萨项目的最大活力来自全球化合作以及新技术运用的热情。

课程内容主要聚焦于距今约4500年前建成的吉萨金字塔、狮身人面像、墓葬等文物,从古埃及历史、艺术和考古的角度进行理解,并介绍哈佛大学数字化吉萨项目的工作内容、成果、技术与未来计划。课程讲座主要集中在古王国时期丧葬艺术与建筑的考古学信息处理,以及物主身份判定与文物返还等问题。学生除了有机会在课堂上选择感兴趣的命题进行演讲和讨论外,还有机会通过3D建模将自己的成果永久留在数字化吉萨项目数据库中。

2.考古教学场景的现实重构

(1)利用3D打印技术1∶1重构云冈石窟

位于山西省大同市的世界文化遗产云冈石窟,距今已有1500余年的历史。云冈石窟第12窟雕刻了丰富的天人形象和中外乐器,在中国音乐舞蹈史上具有极其重要的地位。2016年8月,浙江大学文化遗产研究院与云冈石窟研究院合作,对云冈石窟第12窟进行了三维数字化信息采集,采集工作包括52站三维激光扫描和55680张用于摄影测量的照片拍摄。经过摄影测量计算和人工交互三维处理,合作团队成功建立了第12窟的高保真彩色三维模型,整体重构复现了云冈石窟的形貌(如图1)。

(2)缩微重构忻州九原岗北朝壁画墓

忻州九原岗北朝壁画墓位于山西省忻州市区南部高地。2013年6月,山西考古研究所、忻州市文物考古研究所、山西博物院对已被盗掘的山西忻州九原岗北朝壁画墓联合实施抢救性考古发掘,并邀请浙江大学文化遗产研究院数字化团队配合考古发掘进程,利用最先进的数字技术进行壁画数字化科学记录,实现了在数字世界永久存储千年前壁画面貌的梦想。(如图2)。

● 教学设计及效果

利用虚拟现实技术模拟考古田野教学,更加具有灵活性、实践性和重现性。通过这种教学方法,学生可以加深对课程内容的理解,并可以在虚拟的环境中进行充分的实践与练习,对学到的考古知识及时巩固。

1.虚拟重构场景教学

哈佛大学与浙江大学在《吉萨金字塔:科技、考古、历史》VR教育合作实践中采用了共同授课、分别评定成绩、分别授予学分的方式。哈佛大学的选课学生包括本科生与研究生,来自多个不同的学科。浙江大学选课学生包括本科生(竺可桢学院)、硕士研究生、博士研究生,来自考古学、文化遗产与博物馆、建筑工程、数字化艺术与设计、信息与计算、遥感与地理信息、中国古代文学、地质工程、旅游管理等多个专业和学科,课程具体设计如下表所示。

在2018年秋冬学期课程结束后,参加课程学习的学生提供了对课程的反馈意见。双方学生认为课程中的VR资源对辅助掌握相关知识提供了非常有用的帮助,基于VR的身临其境学习有助于更直观地理解吉萨遗址的状况和考古发掘过程。特别是,中国、美国的师生在VR技术的支持下共同出现在4500年前的吉萨金字塔前,突破了时间和空间的局限,给大家带来了超出想象的学习体验。课程中的三维建模作业也对学生切实了解和掌握吉萨考古资料非常有帮助。大家认为通过视频连线、VR连线进行的互动促进了中西方文明观点的碰撞和交融,拓展了课堂的知识范畴,是一次“超越在线课程”的体验。[7]

2.现实重构场景教学

3D打印技术1∶1重构云冈石窟第12窟、缩微重构忻州九原岗北朝壁画墓及1∶1打印部分墓内壁画,均在浙江大学艺术与考古博物馆展出。其作为本科生和研究生相关通识和专业课程的现场教学内容,也面向社会大众开放。据不完全统计,有来自本校15个学院12182人次和海内外26所高校7377人次参加了现场教学活动。

通过虚拟和现实重构考古场景教学,有效地提升了学生对古埃及的历史、文化和思想的理解与把握能力,拓展了全球视野,使学生在文明互鉴中理解他人,并更加深刻地理解自己的文化与传统。

● 反思与展望

综合运用多种信息技术不仅可以模拟显示和观察考古数据,而且可以与虚拟考古的对象进行交互,具有多维度观察和操纵考古数据的特点。但数字化重构场景教学也面临一些发展的挑战,需要关注、思考并规避。

1.数字化重构场景教学的困难

(1)实施数字化重构场景教学所需的成本远超传统教育和多媒体教育,体现在硬件、软件和资源制作三个方面。在硬件环境方面,VR教育除了需要为每位学生提供一套VR头盔设备外,还需要投入更多经费建设VR设备的运维环境、全景视频采集与直播平台、音视频切换控制系统等,若有必要还需建设多人VR互动的传感定位系统、大屏幕系统、音响系统等环境。在软件方面,需要开发专门的软件系统以支持针对课堂教学所需的VR资源同步播放、学生自动追踪跟随教师在VR环境中的运动轨迹、按需加载课堂教学VR资源等功能。若要针对不同课程的教学演示需求,可能还需要为不同的课程开发独特的软件展示及互动功能模块。在VR资源方面,既需要满足课程内容体系的资源积累,也需要随着教学内容更新的资源持续制作。实际上,面向多个学科VR资源的持续性制作投入是当前限制VR教育广泛开展的最主要困难,其所需要的成本投入比一次性的软硬件投入更多。[8-9]

基于3D打印的现实重构,在结果呈现的方式上比VR技术更为自然,不需要借助复杂的显示设备即可营造大型的沉浸式体验空间。然而在当前技术条件下,构造大型3D打印复制的教学场景所需的费用和时间都非常多,难以将其作为主要的技术手段支撑数字化重构场景教学。

(2)实施数字化重构场景教学需要教师掌握更多的技能。VR教育需要教师了解VR技术和VR平台的功能、适用范围和操作方法,对于尚未大规模普及的VR技术应用来说,学习的门槛仍然相对较高。VR教育也需要教师具备制作课程资源的能力,这会涉及一系列的三维建模、全景视频甚至是VR编程的工作,对于绝大部分教师而言是难以实现的。[10]

基于3D打印重构小型教学样本在时间和成本上是可行的,大部分的教师都有机会接触到小型的3D打印机并进行少量的打印。但这仍需要教师具备3D建模、3D打印制作的基本能力,甚至需要教师了解高分子材料的相关知识以保障重构质量,或需要教师具备较好的美术功底以实现丰富色彩的手工绘制重构。对于大部分的教师而言,同时具备上述能力也是非常困难的。

(3)数字化重构场景教学采用的技术当前仍然存在一定的不足。笔者在VR教学实践过程中发现,VR体验的连续时间超过10分钟后,大部分学生会感觉到不适。若VR环境中播放的视频或实时渲染场景出现快速的镜头切换,部分学生会立刻感觉到眩晕。当多人VR连线时,会遇到网络延迟导致的沟通不畅、连接不稳定、资源加载失败等问题。对于远程连接的VR课堂,最大的干扰来自多个终端带来的回音,当软件进行回音抑制失败的时候会导致严重的破音或声音中断,影响正常交流。

(4)实施数字化重构场景教学还存在其他问题,包括由于设备水平差异影响学习的效果,从而带来因学生经济条件差异带来的公平性失衡风险;已经有技术提供在VR头盔中集成实时监测学生注意力水平的能力,由此可能带来关于新技术运用过程中学生隐私权利的讨論甚至是冲突;通过VR设备智能化推送与课程相关的知识将有助于拓展教育的广度与深度,但同时可能会带来智能算法影响学习兴趣和知识范畴的风险。

(5)数字化重构场景教学与考古田野教学相互补充,是不可替代的。哈佛大学与浙江大学VR教育实践的成功,依赖数字化吉萨项目多年的VR资源积累、双方在教学环境的大规模投入、双方高校和企业的高水平技术团队的支持,以及课堂教学过程中教授与助教的协作努力。诸多方面的困难和挑战意味着VR教育的大规模推广仍然需要较长的时间才能实现。试图复制这样的教学方式不如结合未来的发展趋势进行更长期的准备。试图用数字化重构场景教学替代考古田野教学既不可取,也不可能。田野考古学是考古学的基础,没有田野考古,考古学就成了无本之木,无源之水。复原实物的原貌及其所处的共存关系,只能在田野考古阶段进行。[11]

2.数字化重构场景教学的展望

(1)随着技术的进步,当前VR教育的一些局限性必然随之消失,如芯片成本的下降必然会使VR设备成本不断降低,芯片运算能力与展示技术的提升必然会带来更为舒适的VR体验,网络技术进步会降低远程互动的延迟,自动化技术会降低VR资源制作的门槛等。

(2)VR技术将逐渐渗透到每个人的生活和工作中,并逐渐培养用户更多、更自然地使用VR技术的习惯。另外,教育领域的不断创新进步将带来大家对更好教育效果的期待,除了在考古学课程的实践,VR技术在医学、建筑学、地质学、生物学、天文学、航空学等学科领域都可应用,也因此会催生出更多对VR技术在教育领域运用的需求。

(3)若把VR技术在教育领域的广泛、深度运用看作必然,就应该提前做好准备。在软硬件方面,应注重研发支持数十人乃至数百人同时在线的网络并行VR体验系统,开发在VR头盔环境下更为便利的语音笔记、资源收藏、课程回放等功能,并结合基于人工智能的实时字幕生成、关联信息推荐等技术提供更多学习辅助功能。

(4)博物馆和遗产展示被公认为大众教育场所,从国际发展趋势可见,这种特殊教育场所在为观众提供“专家视角”的同时,也要鼓励培养“观众视角”,使观众能够通过对各种展示的了解,积极创造个人的体验和意义,从而形成个人的世界建构。

● 结语

创设高沉浸式的教学环境,提升教学的参与体验感,提高教学效率和水平,是信息技术与教育教学深度融合的目的所在。笔者所在学校充分发挥多学科交叉协同优势,与国际顶尖大学深度合作,持续在文物数字化保护利用、数字化场景教学上不断创新发展,对于中外文明交流互鉴和构建人类命运共同体意义重大。

参考文献:

[1]魏兵,郭玉玮,于俊美.化学教学策略与案例分析[M].青岛:中国海洋大学出版社,2019:47-51.

[2](美)Leigh Chiarelott.designing curriculum and instruction for teaching and learning in context[M].杨明全,译.北京:中国轻工业出版社,2007:3-6.

[3]豆海锋.高校考古专业实践教学改革的新路径[J].黑龙江教育:理论与实践,2019,(12):48-49.

[4]韦玲.从建构主义理论看博物馆陈列展览的规划和设计——以山东博物馆“考古山东”展为例[C].广西博物馆文集,2015(00):21-24.

[5]郭丽君,陈中.信息化背景下的大学课堂生态:变革、问题与对策[J].现代大学教育,2017(06):101-107.

[6]杜颖.VR+教育可视化学习的未来[M].北京:清华大学出版社,2017:64-81

[7]杨玉辉,董榕,张宇燕,等.基于虚拟现实的远程教学空间的创建与应用——以哈佛大学与浙江大学的跨国VR远程教学为例[J].现代教育技术,2019,29(11):87-93.

[8]汤显峰,沈丽燕,董榕,等.基于云渲染的VR/AR智慧教室的设计与应用[J].现代教育技术,2021,31(05):82-89.

[9]张枝实.虚拟现实和增强现实的教育应用及融合现实展望[J].现代教育技术,2017,27(01):21-27.

[10]Michael Zollh?fer,Patrick Stotko,Andreas G?rlitz,etal.State of the Art on 3D Reconstruction with RGB‐D Cameras[J].COMPUTER GRAPHICS forum,2018,37(02):625-652.

[11]袁靖.中国科技考古纵论[M].上海:复旦大学出版社,2019:11-18.

作者简介:朱于心,浙江大学艺术与考古博物馆馆员,硕士,研究方向文物数字化教育、博物馆教育。

资助项目:本文受2020年浙江省教育厅科研项目(人文社科类)“基于VR技术的考古教育实践”(课题编号:Y202043915)資助。

作者:朱于心 李志荣 王晨 刁常宇

上一篇:幼儿园总结保教下一篇:配送站经营合同