虚拟数据库设计论文

2022-04-15 版权声明 我要投稿

摘要:近几年来,我国的经济发展愈发快速,且随着我国现代化进程的不断加快,我国信息化产业的发展已经得到了极为充分的发展空间了。今天小编为大家推荐《虚拟数据库设计论文 (精选3篇)》,欢迎阅读,希望大家能够喜欢。

虚拟数据库设计论文 篇1:

数据库测试用例虚拟仿真系统的研究与设计

摘要:本文介绍了数据库测试用例虚拟仿真系统的研究方法与设计思路,提出了以语义知识库推理法则为代表的三种计算机数据库用例生成仿真数据方式,为高等院校数据库类课程实验以及企业应用软件测试提供了相应的仿真数据与实验环境。

关键词:数据库;测试用例;仿真实验

● 研究背景及意义

随着大数据时代的来临,越来越多的应用软件(如电子商务、网上售票、医疗、超市等)在设计数据库时都需要运用海量的真实数据进行性能、功能以及压力测试,以保证软件上线后的正常运行。但是,要想得到海量的真实数据,对大多数测试者而言都不太现实,这一方面是因为渠道问题无法大批量获取原始数据,另一方面如果采用人工录入,需要耗费的巨大的人力、物力,如北京某商厦百货业管理系统,在上线前由4个计算机专业录入员花了近20天的时间才完成了10万条记录的数据录入的初级测试,而离系统饱和测试(100万条)还相差很远。而对于其他大型的软件如12306售票系统等,需要的测试数据会高达上亿条,这对于一般手工录入来说是无法完成的。为此,本项目研究的是一个“数据库测试用例自动生成虚拟仿真系统”,该仿真系统可以借助语义知识库、智能算法,并通过接口程序为主流数据库提供用例自动生成仿真数据,以检验数据库的承载力,以及应用软件的可靠性,从而为数据库课程实验以及企业应用软件提供相应的仿真测试数据。

● 国内外研究现状和发展动态

国外研究创立了一套相对成熟的理论,创造了一批比较优秀的自动化测试工具。其中,典型自动化测试框架比较有名的有Automated Testing Specialists Inc提出的基于数据驱动的自动化测试方法以及GUI测试方法、Mercury Interavtive Inc提出的关键字驱动自动化测试方法及录制/回放式的自动化测试方法。

从国内学者对自动化测试领域的研究现状来看,基于智能优化算法的软件测试用例自动生成技术已经取得了不错的进展。国防科技大学的单锦辉(2002)博士将迭代松弛法改进之后再用于测试用例自动生成,并开发了完整的系统原型[1];贺滢(2015)首次提出了应用粒子群算法自动生成测试用例,并且在智能寻优算法的基础上对TC自动生成方法进行了系统的研究[2];刘慰(2018)等人提出一种以遗传算法为核心的测试数据生成方法,自动生成测试数据并且使用XML文件来记录测试结果[3];侯俊(2018)等人针对现在Web测试主要依赖人工测试的问题,在Web测试生成单个测试用例的基础上提出了一种基于WSDL文档和形式化模型树Web服务操作测试用例的自动生成方法,该方法大幅度提高了Web测试用例生成的效率,节省了测试消耗的时间。[4]

但国内目前数據库用例测试的地位不高,大多数的公司还只是停留在软件单元测试、集成测试和功能(软件交付前的功能、性能)测试上,没有一套完整的数据库用例测试标准化准则,也缺乏完全商业化的操作机构,其主要原因是数据库用例测试需要大量的人力及时间成本。但在大数据发展趋势下,数据库管理系统不断被应用于企业管理中,帮助企业更好地管理大量数据。因此,就国内现状而言,测试用例自动生成技术使用价值大,应用前景广,但研究普遍相对较少,目前还没有成熟的主流数据库的测试用例系统的相关报道,同欧美国家软件测试行业的差距较大。

● 系统的设计思路及方法

本实验方案的设计思路是在大数据测试用例上,不去关心具体应用软件的数据库怎么设计,而是根据现有流行数据库的通用字段结构,按字段类型设计出一个通用的数据结构模型,然后再定义语义知识库、关联条件库、语义种子库,以及原始字库等,并以此作为支撑,提供应用软件数据接口。这样,在遇到不同的应用软件时,只要捕捉到应用软件数据库表的结构(或人工提供),然后通过接口程序匹配,给出生成条件,即可开始生成海量数据。系统设计技术路线如图1所示。数据库测试用例生成,实际上是结合了智能算法、语义知识库、文献研究演绎等相关智能化知识体系加上程序设计而完成的一套比较复杂的虚拟仿真实验系统。

本系统的设计原理是由测试用例自动生成工具自动捕获数据库应用系统表,从而获得数据库中的表、表结构及其属性信息等。在为其生成测试用例的时候,既能判断出表参照关系是否存在循环关系,也能显示生成表测试用例的先后顺序,同时为了能让用户直接明了地看到数据库之间的直接参照关系,自动生成工具也能将表之间的参照关系可视化。[5]

目前,本系统可以通过三种方式生成测试用例,如下页图2所示。

一是基于已有的语义知识库让计算机按照一定的语义规则推理自动生成测试用例。

这种方法主要针对含语义类型的字段内容,如姓名、地名、商品名等,通过构建相关类字段的语义知识库以及普通字库,生成时由用户按需要输入相关语义种子,构建用户自定义的语义种子库,然后结合遗传算法调用字库,生成符合语义规则的数据内容。

二是从已有的同种或异种关系数据库中直接导入生成。

有时在生成某一数据字段时,需要用同种数据库或异种数据库的另一数据表数据来生成,如学生成绩管理系统中学生表包含学号、姓名、性别、系部、出生日期,课程表包含课程号、课程名、学分,选课表包含学号、课程号、成绩,其中选课表中的学号及课程号分别需要从学生表和课程表的数据中生成,这就需要在生成选课表时,调用学生表和课程表的数据进行导入,这是同种数据库的导入生成。有时同类系统如船务管理系统、货物管理系统,用的不是同类数据库,但某些数据类型内容相似,引用时,则需要异种数据库数据的导入。这种导入方式,在导入前提供通常用的数据库的接口程序,需要引用哪种数据库,通过设置接口程序实现对接,然后再由用户设定一些导入规则,如生成数量、时间范围等,即可实现同种或异种数据库数据的导入生成。

三是根据表的结构和属性以及用户指定的约束规则随机自动生成。

此类数据一般是针对时间类、数字类和非语义字符类数据,可以通过用户给定约束条件,如生成数量、数值/时间范围等约束条件,按一定算法自动生成,为了灵活高效管理字段实例引擎,引入“时间、非语义类字符、数字(含整数和实数)、逻辑”四种类型引擎接入插件。整个系统对自动生成的表测试用例可以进行维护。数据库用例仿真实验系统的功能实现如图3所示。

● 系统的仿真实验结果分析

本系统设计完成后,笔者对所在学校设置了数据库、软件工程等课程的班级开设的60多个实验案例及软件作品进行了测试用例实验,实验结果表明,学生实验的数据表中80%的数据可以直接利用本系统生成,剩余的数据通过重新定义语义规则也基本上可以全部实现,同时本系统还针对地方企业进行了应用软件用例测试分析,如某船务代理有限公司的船务代理系统,生成了100多万条数据进行压力测试,还有山东工商学院、浙江大学宁波理工学院、宁波财经学院、浙江万里学院的全国大学生体质上报系统,也是采用该仿真系统瞬间生成数万条仿真数据来进行压力测试,如图4所示。

本系统主要体现出以下两个特色:

(1)通用性。本仿真系统设计完成后,可以通过数据库接口程序,与目前市场上流行的主流数据库对接,实现了主流数据库的测试用例自动生成,具备了数据库用例的通用性。

(2)智能化。通过运用算法模型,设计语义知识库及表与字段的模型库,智能化地与应用案例数据库进行匹配,实时生成海量仿真数据。

● 结论

数据库用例测试仿真系统是按照用户需求,为应用软件特别是数据处理量非常大的应用软件瞬间智能化地生成海量仿真测试数据,以检验软件的可靠性及数据处理压力的最大临界值,为企业数据的备份转储或数据库的升级提供预警,减轻了测试人员繁重的手工劳动。

目前,本系统主要实现了ACCESS、MYSQL、SQL-SERVER几种数据库之间的对接以及常规数据的自动生成,但对一些特殊字段类数据,如图像、声音、二进制等数据格式,还无法自动生成,课题组将在后期继续研究针对大型数据库以及特殊字段的自动测试生成,并将研究成果向社会推广。

参考文献:

[1]单锦辉,高仲仪.面向路径的测试数据自动生成工具及其图形界面Tcl/TK设计[J].计算机工程与应用,2002(01):74-77.

[2]贺滢,徐蔚鸿,李杨林.基于RACPSO的测试用例自动生成方法[J].计算机工程,2016(05):67-70.

[3]劉慰,应新洋.基于遗传算法与XML的测试用例自动生成执行系统研究与实现[J].计算机时代,2018(02):44-47.

[4]候俊,周红,马春燕,等.面向WEB服务的测试用例自动化生成方法[J].西北工业大学学报,2018(02):14-15.

[5]张文祥.关系数据库测试用例自动生成研究[M].北京:科学出版社,2004.

作者:杨爱民 吴志磊 刘洁

虚拟数据库设计论文 篇2:

数据库设计规范及设计技巧研究

摘要:近几年来,我国的经济发展愈发快速,且随着我国现代化进程的不断加快,我国信息化产业的发展已经得到了极为充分的发展空间了。尤其就企业信息收集工作来说,企业信息收集工作是信息化产业链里一个极为重要的组成部分,其是企业满足现今社会信息化要求的基础工作,企业信息收集工作的成功与否,直接决定着企业收集数据的质量以及数据搜索的效率,如何让企业信息收集工作质量满足企业的需求,已经成为企业发展历程里一个重要的课题。同时由于我国市场发展的进程愈发快速,数据库设计的发展也迎来了一个崭新的时期,如数据收集的复杂化、智能化,都可以说是这一时期的最好体现。本文将从数据库设计工作在企业信息收集工作中的意义开始进行分析,就如何更好地使数据库设计工作规范化、智能化进行进一步的探讨、研究。

关键词:企业信息收集工作;数据库设计;信息化

一、数据库设计工作的规范化在企业信息收集工作中的意义

数据收集的高质化以及数据收集的高效化是企业信息收集工作的要求,也是数据库设计的目的。企业信息收集工作是企业跟上时代进程,保有一定市场竞争力的前提,是企业发展历程中的一个重要组成部分,是企业满足现今社会信息化要求的基础工程。数据库设计工作的是否成功,是直接影响着企业信息化建设的进程的。

在我国现代化进程不断加快的今天,我国的信息化产业也得到了空前的发展空间。尤其对于企业信息收集工作来说,企业信息收集工作的发展已经成为了企业信息化建设历程中的一个重要组成部分了,其所独具的信息化特质更直接奠定了其对企业的巨大影响。企业想要从根本上实现信息化建设的目标,就必须倚靠企业信息收集工作的发展。企业信息收集工作对于企业创造效益的效率、企业的信息化建设等等等等都有着极为深远的影响。数据库设计工作的质量更是直接引导着企业信息化建设的步伐的,只有保证了数据库设计工作的质量,才能够真正地让企业信息化建设的各项工作有其意义,才能够真正地体现出企业信息收集工作的信息化特质。

然而,近几年来,有关企业信息收集工作质量的问题频频曝光,在没有突显其应有的效益的同时更直接影响了企业的正常运作,严重地阻碍了企业信息化建设的进程。这往往都是因为数据库设计工作中设计人员的能力不足、设计人员的不重视等因素所导致的。

企业的数据库设计工作的开展原本是为了让企业信息收集工作更为及时地为企业的各项工作数据提供更为便利的搜索途径,但这却也加大了数据库设计工作开展的难度,让企业的管理人员在处理企业信息收集工作与企业信息化建设工作之间的关系的时候往往不够合理、不够正确。

如何在最短的时间内给以企业最大的方便是每一个数据库设计人员都应考虑到的问题,这归根到底,就是如何正确地协调好企业信息收集工作与企业信息化建设工作之间的关系的问题。企业信息收集工作是具有整体性的一项工作,其中每一项工作、每一项要求都是紧密相连、密不可分的。一个企业管理人员只有在真正能够正确、有效、合理地协调好企业信息收集工作与企业信息化建设工作之间的关系的时候,数据库设计工作的质量才能够真正地达到加快企业群信息化建设的目的。

而企业管理人员要想能够协调好企业信息收集工作与企业信息化建设工作这两者之间的关系,就必须通过数据库设计工作的规范化来完成。数据库设计工作是企业信息化建设中不可或缺的一个部分,对于企业信息收集工作来说,更是其突显智能化、高效化的一项重要举措,甚至可以说其是企业信息收集工作与企业信息化建设工作之间的一道桥梁。

数据库设计工作是贯通着企业信息收集工作中每一个阶段、每一项工作的一项工作,是主导着企业开展信息收集工作的方向与进度、决定着企业开展信息收集工作的性质的一个决策性工作,是企业管理人员协调好企业信息收集工作与企业信息化建设工作之间的关系的一个重要途径。只有做好了数据库设计的规范化工作,企业信息收集工作的智能化、高效化才能够得以彰显,企业信息收集工作与企业信息化建设才能够充分地满足企业的要求、市场的要求。

二、设计主要过程

(一)概念结构设计阶段

1.第零步——初始化工程

这个阶段的任务是从目的描述和范围描述开始,确定建模目标,开发建模计划,组织建模队伍,收集源材料,制定约束和规范。收集源材料是这阶段的重点。通过调查和观察结果,业务流程,原有系统的输入输出,各种报表,收集原始数据,形成了基本数据资料表。

2.第一步——定义实体

实体集成员都有一个共同的特征和属性集,可以从收集的源材料——基本数据资料表中直接或间接标识出大部分实体。根据源材料名字表中表示物的术语以及具有“代码”结尾的术语,如客户代码、代理商代码、产品代码等将其名词部分代表的实体标识出来,从而初步找出潜在的实体,形成初步实体表。

3.第二步——定义联系

IDEF1X模型中只允许二元联系,n元联系必须定义为n个二元联系。根据实际的业务需求和规则,使用实体联系矩阵来标识实体间的二元关系,然后根据实际情况确定出连接关系的势、关系名和说明,确定关系类型,是标识关系、非标识关系(强制的或可选的)还是非确定关系、分类关系。

4.第三步——定义码

通过引入交叉实体除去上一阶段产生的非确定关系,然后从非交叉实体和独立实体开始标识侯选码属性,以便唯一识别每个实体的实例,再从侯选码中确定主码。为了确定主码和关系的有效性,应通过非空规则和非多值规则来保证。

5.第四步——定义属性

从源数据表中抽取说明性的名词开发出属性表,确定属性的所有者。定义非主码属性,检查属性的非空及非多值规则。此外,还要检查完全依赖函数规则和非传递依赖规则,保证一个非主码属性必须依赖于主码、整个主码、仅仅是主码。以此得到了至少符合关系理论第三范式的改进的IDEF1X模型的全属性视图。

6.第五步——定义其他对象和规则

定义属性的数据类型、长度、精度、非空、缺省值、约束规则等。定义触发器、存储过程、视图、角色、同义词、序列等对象信息。

(二)逻辑结构设计阶段

将概念结构转换为某个DBMS所支持的数据模型(例如关系模型),并对其进行优化。设计逻辑结构应该选择最适于描述与表达相应概念结构的数据模型,然后选择最合适的DBMS。

将E-R图转换为关系模型实际上就是要将实体、实体的属性和实体之间的联系转化为关系模式。

(三)数据库物理设计阶段

这一阶段是数据库设计满足企业需求的一个重要阶段,是直接影响着数据库的适用性的重要阶段。其主要工作是把虚拟的逻辑数据模型投入到物理结构中,根据各项因素的要求,进行设计索引等工作,以试验设计的适用性。

三、数据库的主要设计技巧

(1)要想提高数据库的设计质量,以及让数据库的设计工作具有相应的实效,就必须让数据库设计工作满足市场的需求,而要让数据库的设计工作满足市场的需求,首要工作便是洞悉市场对数据库的具体要求,而这一点,就必须通过与市场的沟通来完成。在数据库开展设计之前,应先行了解市场的需求,与市场进行沟通,对市场的需求有一定的把握度,通过试验等方式手段,从实际出发,确立数据库设计的目标和方向,从根本上提高数据库设计的实效性。

(2)在开展设计工作之前,除了需要了解市场的动态,还应对本公司的业务发展有一定的了解,这可以极大程度地提高设计工作的效率。同时,还能够让数据库的设计更切合企业发展的实际,才能够从根本上避免设计过程因不了解企业业务而引生的设计质量不足等问题。

(3)ER图表与数据字典的创建。数据字典以及ER图表的创建是能够形象具体地告知数据库使用者如何使用数据库的一项工作,是数据库给数据库使用者以更大方便的一个重要途径。而要真正实现数据字典和ER图的实效性,就必须对数据库进行规范化的整理,对数据库使用过程中的各个名词进行专业化地统一。只有这样,才能够让数据字典和ER图表起到应有的实效,才能够让ER图表和数据字典的创建不流于形式。

四、结束语

企业的数据库设计工作的是否规范是贯通着企业信息收集工作的每一项工作的质量的,是直接决定着企业整体运作效率的一个重要举措。只有对企业的数据库设计工作起到足够的重视,对其设计进行规范化的处理,才能够从根本上提高整个数据库设计工作的质量,才能够真正的体现出数据库设计工作的效益。

参考文献:

[1]李金靖.浅析软件开发中的数据库设计的理论和实践[J].计算机光盘软件与应用,2011,15

作者:郝进义

虚拟数据库设计论文 篇3:

虚拟数据库技术在电信传输网管中的应用

摘要:本文从虚拟数据库技术出发,着重分析了该技术在电信传输网管当中的实际应用方向,即集成构架和访问构架的设计工作,希望为电信传输管网相关的行业工作提供合理参考。

关键词:虚拟技术;虚拟数据库;电信传输网管

引言:虚拟数据库技术当中的集成构架和访问构架是该技术的核心,自我国北京同步传输网建设以来,已经实现了多次扩容,目前已经形成了较大规模,由于该技术的先进性,在未来的电信传输管网当中,必将取代PDH,逐渐成为主要传输技术投入使用。

一、虚拟数据库技术

虚拟数据库技术又叫做包装器/ 中介器技术,此种技术使用了和以往数据仓库法完全不同的体系结构。该技术将数据保存在异构数据源上,仅仅依靠集成系统提供一个虚拟集成视图和相关的查询机制,即可自动将用户对集成模式提出的查询请求最终转化成为对异构数据源的查询。由于用户不是直接在数据源的局部数据模式当中提交查询请求,而是在中介模式当中提交,因此,虚拟数据库当中的中介层需要将用户的查询请求转化成数据源查询语句,融合数据查询结果之后再返还给用户[1]。

二、虚拟数据库技术在电信传输网管当中的应用

虚拟数据技术的研究和该技术在电信传输网管当中的应用研究,主要集中在以下两方面,具体应用细节如下:

(一)数据集成架构

电信传输网管应用当中的数据集成架构设计细节可以分层研究。架构中的数据集成中间件层的主要功能是屏蔽局部数据源的异构性,该层由保障、模式转换器和虚拟数据库共同构成,且核心是VDB,除了记录VDB数据空间和异构数据源之间的关系以外,还要记录数据源的地理位置,保证后续工作人员能够对数据源正确访问。包装器则是要根据不同数据源展开定制工作,能够使用统一格式将分布异构数据源的数据模式提取出来,再将抽取结果传达给模式转换器,该构架当中包装器需要的同构数据是异构数据当中的关系数据,因此,包装器想要完成的核心功能在于异构数据源对于各类型数据的转换工作当中。

同时,模式转换器的工作是根据用户设定的集成规则,将包装器所提交的局部数据模式映射成为全局数据模式,映射的结果就是会形成全局元素据结构表,这也就是最终提交给数据应用层的中央数据视图。简单讲就是集成规则当中记录的主要是同名数据源的换名规则等信息。

数据集成是数据提取的过程,主要是从中介层对于底层异构数据源数据信息的抽取过程,此种工作方式也就是避免了数据库底层的编程过程,具有简化数据抽取过程的优势。

若数据集成构架中,中介层使用的是SqlServer数据库负责异构数据信息的存放工作,底层使用的是oracle等数据库,那么数据集成过程中的数据类型转换工作是需要考虑的主要问题。

以上述两种数据库之间的数据类型转换工作为例,数据集成时的转换策略如下:在工作过程中,工作人员需要将元数据信息从oracle转换到SQL当中,并将相关工作信息记录在SQL数据库表当中。元数据信息表的建立方式是按照数据源表,将信息构建成树状结构图,同时,还要注意相关的数据类型转换工作需要由不同类型的数据源对应包装器完成。

面对Oracle和SQL之间大小写敏感的问题,可以在数据转换时,将表名以及数据项都用大写字母书写。且Oaacle数据库的命名不能超过30个字符,在使用单纯的SQL语句时,若是多条语句,则使用的Oracle数据库必须封装在begin/end语句中。面对视图数据迁移的问题,可以使用sql生成的方式展开,而其余涉及到数据的查询过程,在工作中可以不做考虑。为提高对于底层数据库同步问题的重视程度,可以拟定两种数据同步策略方便选择,一种是定期进行元数据收集工作,保障VDB全局元数据结构表的更新及时,但此種方法存在信息不能实时传达的弊端。另一种是在工作人员和用户查询数据时建立临时的全局元数据结构表,此种方式的优点在于信息实时,但实际工作效率不高。

(二)数据访问架构

传输网管应用当中的数据访问架构设计工作主要是由应用层对VDB查询到各个局部数据源转化以及查询结果合成。若在工作中使用合成器,将VDB中记录的集成规则将从数据源采集到的数据进行统一加工之后,存放在中介层数据库建立的临时数据表当中。有关部门在此阶段可以由上层在查询分阶段根据查询语句的要求建立临时表,底层操作中读取用户信息并将信息整理到临时数据表当中,信息录入完毕后,底层还需要给上层发数据写入结束的信息,此时上层就可以到临时数据表当中抽取需要的用户数据信息,操作全部结束后,就可以删除临时数据表。

建立临时数据表的过程中需要注意的是并发问题,一般在查询语句分析结束时同步展开对于多数据源的查询工作,在此种情况下,建立临时数据表是必要环节,但若只需要查询单数据源,在此种条件下最适宜的做法是使用统一的策略在中介层建立临时数据表存放数据信息。

临时数据表的迁移工作可以准备两种策略应对,一种是直接在工作中生成简单的SQL语句将数据从oracle当中转移到sql当中,但要注意此种方式仅适用于数据量小的情况。另一种是若数据量大,则可以使用数据通道展开数据的导入工作,此种方式的优势在于转换效率较高,能够为电信传输网管相关工作提供更强的发展推动力[2]。

结束语:综上所述,虚拟数据库技术虽然还没有在全国范围内实现广泛应用,但该技术的发展前景已经得到了多家权威机构的认可,因此。为顺应未来科学技术的发展,我国电信传输网管行业相关的工作人员需要加深对该技术的研究力度,提升该技术在我国电信传输网管当中大范围使用的可行性。

参考文献:

[1] 刘晴,汤玮,刘旭.基于虚拟数据库技术的异地异构数据源整合[J].信息技术,2020,44(01):130-133+139.

[2] 朱中仁.基于虚拟数据库的多系统集成实现[J].安徽电子信息职业技术学院学报,2017,16(02):1-3.

作者:王芳 王凯

上一篇:英语小学教案(精选2篇)下一篇:幼儿园老师工作计划(精选2篇)