《多媒体数据库及基于内容检索.ppt》由会员分享,可在线阅读,更多相关《多媒体数据库及基于内容检索.ppt(46页珍藏版)》请在第壹文秘上搜索。
1、第六章多媒体数据库及基于内容检索信息量爆炸式增长信息量爆炸式增长数据库系统数据库系统数据库作为一种独立的应用领域已得到了计算机界的认可,数据库已和计算机、网络一起成为用户应用系统的三大支柱。数据库系统(DBS)由四个要素组成:用户、数据库、数据库管理系统(DBMS)以及支持它的 硬件和软件。DBMS是管理数据库的系统软件,它是DBS中最主要的成分。数据库管理系统数据库管理系统数据库管理系统具有哪些功能 实施对数据的管理,包括存储、查询、处理和故障恢复等,同时也保证能在不同用户之间进行数据共享。数据库管理系统的三种模式: 物理模式:物理模式的主要职能是定义数据的存储组织方法,如数据库文件的格式、
2、索引文件组织方法、数据库在网络上的分布方法等 概念模式:定义抽象现实世界的方法。概念模式通过数据模型来描述,数据库系统的性能与数据模型直接相关。 外部模式:又称子模式,是概念模式对用户有用的那一部分。数据库管理系统数据库管理系统数据库系统的三级管理模式结构6.1.1 6.1.1 传统的数据管理传统的数据管理层次型网络型关系型 采用关系框架来描述数据之间的关系,通过把数据抽象成不同的属性和相互的关系,建立起数据的管理机制。具有比较完整的理论基础,同时“表格”等概念易于被用户理解,在数据库市场上占有明显的主导地位。6.1.1 6.1.1 传统的数据管理传统的数据管理层次模型用树形结构来表示各类实体
3、以及实体间的联系,每一结点表示一个记录类型(实体型),每个记录类型包含若干个字段(实体的属性)。 多媒体数据库多媒体数据库需处理的数据包括数值、字符、文本、图形、图像、声音、动画和视频等多种类型,对这些类型的数据进行管理、运用和共享的数据库就是多媒体数据库。6.1.1 6.1.1 传统的数据管理传统的数据管理6.1.2 6.1.2 多媒体带来的问题多媒体带来的问题数据量巨大且媒体之间量的差异也极大,从而影响数据库的组织和存储方法媒体种类的增多增加了数据处理的困难数据库不仅改变了数据库的接口,使其声、图、文并茂,而且也改变了数据库的操作形式。接口的多媒体化,对查询提出了更复杂,但对用户更友好的设
4、计要求。传统的事物一般短小精悍,在多媒体数据库管理系统中长事务较多。多媒体数据库管理环境多媒体数据库管理环境多媒体数据的存储环境容量大、质量好、存取速度快、价格合适;4类存储介质 可更换的硬盘,既可做工作介质也可做档案介质; 磁带备份介质,容量一般为1.23GB,平均存取时间小于1分钟; 光盘档案介质; 磁盘阵列,有效存储海量多媒体数据的介质,支持用户并发读写。多媒体数据的传输环境多媒体数据的传输环境多媒体数据在不同硬件结构和不兼容的操作系统之间传输;使用可更换的介质进行人工传输,适合小范围操作;使用串口实行点到点传输;使用网络系统,实现计算机之间的传输。6.1.3 6.1.3 多媒体数据与数
5、据库管理多媒体数据与数据库管理在数据库中,一般常用的多媒体数据有字符、数值、文本、图像、图形一类的静态数据,也有像声音、视频、动画等基于时间的媒体类型。字符数值文本数据 关键字检索 全文检索声音数据MIDI、波形6.1.3 6.1.3 多媒体数据与数据库管理多媒体数据与数据库管理图形数据描述图形数据的关键是要有可以描述层次结构的数据模型。图形数据可以分解为点、线、弧等基本图形元素图像数据图像数据库较早就有研究,已提出许多方法,包括属性描述法、特征提取、分割、纹理识别、颜色检索等。视频数据对视频的管理还要在时间空间上进行。检索和查询的内容可以包括镜头、场景、内容等许多方面,多媒体数据库的软件环境
6、多媒体数据库的软件环境文件管理系统 Windows 的文件管理器或资源管理器; 图形、图像浏览工具软件; 文件系统方式一般只适用于小的项目管理或较特殊的数据对象,所表示的对象及相互之间逻辑关系比较简单,如管理单一媒体信息;建立特定的逻辑目录传统的字符、数值数据库管理系统 把文件管理系统和传统的字符、数值数据库管理系统结合起来; 由文件管理系统来建立和管理非常规数据(音频、视频、图形等),把数据文件的全文件名作为一个字符串数据纳入传统的数据库系统进行管理。多媒体数据库的软件环境多媒体数据库的软件环境扩充关系数据库的方式 引入新的数据类型,以便存储多媒体对象字段,大小可以达到GB字节,用于存储文本
7、信息和任何形式的二进制信息,包括图像、声音; 用专用字段存放全部多媒体文件; 多媒体资料分段存放在不同字段中,播放时间重新构建;超媒体方式 超媒体的方式就是以超文本的思想来实现对多媒体数据的存储、管理和检索; 一种非线性的网状结构,这种非线性技术可以按照人脑的联想思维方式把相关信息联系起来,供读者浏览; 超媒体是由称为结点和表达结点之间联系的链组成的有向图、用户可以对其浏览、查询、修改等操作。多媒体数据库的基本功能多媒体数据库的基本功能多媒体数据库系统必须能表示和处理多媒体数据: 在多媒体数据库中,数据在计算机内的表示方法比传统数据库的表示形式复杂,对非格式化的媒体数据往往要用不同的形式来表示
8、,多媒体数据库管理系统要提供管理这些异构表示形式的技术和处理方法。多媒体数据库系统必须能反映和管理各种媒体数据的特性,或各种媒体数据之间的空间或时间的关联: 在客观世界里,各种媒体信息有其本身的特性或各种媒体信息之间存在一定自然关联,包括时序关系(如多媒体对象在表达时必须保证时间上的同步特性)和空间结构(如必须把相关媒体的信息集成在一个合理布局的表达空间内的有关特性)。因此,在多媒体数据库管理系统中,除了要对多媒体数据的内容与结构建模外,还要提供对各种媒体数据的特性和集成机制的时空关联的组织和管理方法。多媒体数据库系统除必须满足物理数据独立性和逻辑数据独立性外,还应满足媒体数据独立性。 物理数
9、据独立性是指物理数据组织(存储模式)改变时,不影响概念数据组织(逻辑模式); 逻辑数据独立性是指概念数据组织改变时,不影响用户程序使用的视图(外模式); 媒体数据独立性是指在多媒体数据库管理系统的设计和实现时,要求系统能保持各种媒体的独立性和透明性,即用户的操作可最大限度地忽视各种媒体的差别,而不受具体媒体影响和约束;同时要求他不受媒体变换的影响,实现复杂数据的统一管理。 由于多媒体数据库的数据种类繁多,语义关联丰富,内部结构表示各异,故各种模式及映像比传统数据库复杂得多,涉及的数据量也大得多,要真正做到物理数据独立性、逻辑数据独立性和媒体数据独立性并非易事。多媒体数据库的基本功能多媒体数据库
10、的基本功能多媒体数据库的数据操作功能 提供比传统数据库管理系统更强的适合非格式化数据查询的搜索功能: 允许对Image等非格式化数据做整体和部分搜索; 允许通过范围、知识和其它描述符的确定值和模糊值搜索各种媒体数据; 允许同时搜索多个数据库中的数据; 允许通过对非格式化数据的分析建立图示等索引来搜索数据; 允许通过举例查询和通过主题描述查询使复杂查询简单化; 提供浏览功能 允许浏览数据库信息的目录结构 允许对某一具体题目,浏览与此题目有关的一般信息; 允许浏览数据库去寻找用户假设的信息支持;多媒体数据库的基本功能多媒体数据库的基本功能多媒体数据库的数据操作功能 提供构造解功能 使用一系列的应用
11、约束和触发条件,解决要求访问大容量数据问题和数据库的一致性问题; 对非格式数据还应视不同多媒体提供不同的操纵如下: 图类数据:覆盖、邻接、镶嵌、交接、比例、剪裁、颜色转换、定位等; 声音数据:声音合成、声音信号的调度、声调和声音强度的增减调整等; 多媒体数据系统的网络功能 多媒体数据库由于它的数据来源、应用、数据量等原因,往往被分布于网络的不同结点上。对于此种情况,应解决分布在网络上的多媒体数据库中数据的定义、存储、操纵问题,并对数据的一致性、安全性、并发性进行管理。多媒体数据库的基本功能多媒体数据库的基本功能多媒体数据库的数据操作功能 信息重组织 应支持符合媒体在各通道分离后存入数据库。例如
12、,将Vedio分解为影像、配音等信息,把这些信息分别存储到数据库中,必要时各种分离的信息可以重新组织后输出。 多媒体数据库管理系统应具有开放功能 提供多媒体数据库的应用程序接口API(Application Program Interface); 多媒体数据系统还应提供事务和版本管理功能 长事务:在MDBMS中,长事务的运行意味着在 一个可靠的方式下花费大量的时间传输大容量的数据。检索一场电影就是长事务的典型例子。多媒体数据库的基本功能多媒体数据库的基本功能多媒体数据库的体系结构多媒体数据库的体系结构协作型结构 针对各种媒体单独建立数据库,每一种媒体的数据库都有自己独立的数据库管理系统。虽然他
13、们是相互独立的,但是可以通过相互通信进行协调和执行相应的操作。 特点:对多媒体数据库的管理是分开进行的,可以利用现在的研究成果直接进行“组装”,每一种媒体数据库的设计也不用考虑与其他媒体的区别和协调; 缺点:对不同类型媒体的联合操作实际上是交给用户去完成了。使得对多种媒体的联合操作、合成处理、概念查询等较难完成。多媒体数据库的体系结构多媒体数据库的体系结构协作型结构多媒体数据库的体系结构多媒体数据库的体系结构集中统一型结构 只存在一个单一的多媒体数据库和单一的多媒体数据库管理系统。各种媒体被统一的建模,对各种媒体的管理与操纵被集中到一个数据库管理系统中,各种用户的需求被统一到一个多媒体用户接口
14、上。 优点:建模统一、管理/操作统一、用户接口统一、查询和检索结果统一表示; 理论上,能够充分的做到对多媒体数据进行有效的管理和使用。但实际上这种多媒体数据库系统是很难实现的。多媒体数据库的体系结构多媒体数据库的体系结构集中统一型结构多媒体数据库的体系结构多媒体数据库的体系结构主从型结构 不同数据类型的媒体数据仍然相互独立,系统将每一种媒体的管理和操纵各用一个服务器来实现。所有服务器的综合和操纵也用一个服务器来完成。与用户的接口采用客户进程来实现。 优点:可以针对不同的需求采用不同的服务器、客户进程组合,所以很容易符合应用的需求,对每一种媒体也可以采用与这种媒体相符合的处理方法; 缺点:但采用
15、这种体系结构必须对服务器和客户进行仔细的规划和统一的考虑,采用标准化和开放的接口界面。多媒体数据库的体系结构多媒体数据库的体系结构主从型结构多媒体数据库的体系结构多媒体数据库的体系结构超媒体结构 强调对数据时空索引的组织。在这种结构的理论下,世界上所有计算机中的信息和其他系统中的信息都应该连接在一起,而且信息也要能够随意扩展和访问。多媒体数据库的层次结构多媒体数据库的层次结构最低层增加对多媒体数据的控制和操作最高层支持多媒体数据的综合演示与用户查询的描述中间层增加多媒体数据的关联和超链接。多媒体数据库基于内容的检索多媒体数据库基于内容的检索由于多媒体数据库中包含大量的图像、声音、视频等非格式化
16、数据,对它们的查询和检索比较复杂,往往需要根据媒体中表达的情节内容进行检索,基于内容的检索(CBR)就是对多媒体信息检索使用的一种重要技术。多媒体数据库基于内容的检索多媒体数据库基于内容的检索基于内容检索的特点 从媒体内容中提取信息线索 力图突破传统的基于关键字检索的局限,直接对图像、视频、音频进行分析、抽取特征,使得检索更加接近媒体对象; 提取特征的方法多种多样 以图像的特征为例,可以提取形状特征、颜色特征、纹理特征、轮廓特征等; 检索过程人机交互进行 一般来说,人对于特征比较敏感,能迅速分辨出目标的轮廓、音乐的旋律等,但是,对于大量的对象,一方面难以记住这些特征,另一方面人工地从大量的数据中查找目标效率较低,而这正是计算机的长处 基于内容的检索是一种近似的匹配 一般来说,在检索的过程中,采用逐步求精的办法,每一层的中间结果是一个集合,不断减少集合的范围,知道定位目标,这一点与数据库检索的精确匹配算法有明显的不同。多媒体数据库基于内容的检索多媒体数据库基于内容的检索媒体的特征 音频 常利用的音频特征包括基音、共振峰等音频底层特征,以及声纹、关键词等高层次的特征; 静态图像 其底层特征