电脑知识与技术 ・・・・・・ 数据库与信息管理・ 多媒体数据挖掘技术研究 郑伟。吉根云 (江阴职业技术学院计算机科学系,江苏江阴2144 ̄3) 摘要:本文提出一种多媒体数据挖掘系统的一般结构和挖掘的过程,说明了不同类型多媒体数据挖掘的基本方法和技术,并对多媒 体数据提出了阐述和展望。 关键词:多媒体:知识挖掘:数据挖掘 中图分类号:TP311 文献标识码:A 文章编号:1OO9—3044(2006)20-0040-02 ZHENG WeiJl Gen——yun Multimedia Data Mining Technology Research (Computer Science DepartmentJiangyin Polytechnic CollegeJiangyin 214433,Ch_ma】 Abstmot:This paper introduces the architecture and process of mulitmedia data mining technology,discusses the base methods and technob ogy and shows the trends ofmultimedia data pareparation. Key wordS:multimedia;knowledge discovery;atda mining ≤# 多媒体图像数据挖掘的过程。 随着信息技术的发展,人们日常生活中所接触的数据形式不 断地丰富,多媒体数据库的日益增多,原有的数据库技术已满足不 了应用的需要,人们希望从这些媒体数据中得到一些高层的概念 和模式,找出蕴涵于其中的有价值的知识。这种将数据挖掘技术 和多媒体信息处理技术有机地结合起来形成的在多媒体数据中 进行知识发现的信息处理方法就是“多媒体数据挖掘”。 0 1多媒体数据挖掘的一般系统结构 多媒体数据挖掘系统是在基于内容的多媒体数据检索系统 发展的基础上出现的。它的一般结构图如图1所示。从图中可以 图2多媒体图像数据挖掘的过程 看出。多媒体数据挖掘系统主要由3部分组成:多媒体数据库 (Multimedia Database,简写为MD),多媒体数据挖掘引擎(Muld. media Mining EnglRe,简写为MME)和挖掘的界面(Multimedia Mining Interface,简称MMI)。其中多媒体数据库利用了多媒体检 2.2文本数据挖掘 所谓多媒体文本数据挖掘.就是从大量的多媒体文本数据中 发现有意义的模式的过程。多媒体文本数据挖掘的过程对多媒体 文本数据挖掘最行之有效的途径就是将多媒体文本数据结构化 后,再对结构化数据采用数据挖掘方法。举个例子,在客户服务中 心,把同客户的谈话转化为文本数据,再对这些数据进行挖掘,进 而了解客户对服务的满意程度和客户的需求以及客户之间的相 互关系等信息。 2.3视频数据挖掘 视频包括丰富的内容特性,除了图像具有的视觉特性和空间 特性外.还具有时间特性、视频对象特性和运动特性等。运用视频 处理技术.可以将视频按照各种属性(如场景、视频对象或运动特 性)进行分割。然后进行分类、聚类等操作,得到视频的结构模式。 也可以从视频中提取视频对象,跟踪其运动,结合时间特性分析 其模式以及与其他对象之间的关联。从而发现高层次的事件摘 要、概念或模式。 视频挖掘可以广泛地应用到新闻视频、监控视频、纪录影片、 数字图书馆等应用系统中,如从交通监视视频中,提取交通事故 的模式.分析交通拥塞的原因、趋势。从连续的侦察图像中分析出 战场情况的变化等。 2.4音频数据挖掘 音频是听觉媒体,其主要特征有基音、音调、韵律或旋律等。 音频挖掘通常有两种途径:运用语音识别技术将语音识别成文 字。将音频挖掘转换成文本挖掘;直接从音频中提取声音特征,如 音调、韵律等。运用聚类的方法分析声音模式,机器学习技术,包 括粗糙集、人工神经网络和决策树技术能够用于分析音频的基 频、能量分布及其他特征,从而获得音频事件和对象的结构,挖掘 出隐含在音频流中的信息线索、规律和模式,如通过对海量语音 数据库中语音特征的提取和学习,获得音调和韵律变化的模式, 使得语音合成更加自然化和智能化。 . 2.5 Web挖掘 . 随着Web技术的发展,各类电子商务网站风起云涌,建立起 个电子商务网站并不困难,困难的是如何让您的电子商务网站 一索系统的数据库,包括媒体库、特征库、知识库;挖掘引擎是多媒 体数据挖掘的重要部分,它包括多媒体数据特征空间和挖掘功能 模块两部分:挖掘的界面主要用于挖掘过程的交互和挖掘结果的 可视化。 图1 多媒体数据挖掘系统结构 2多媒体挖掘的内容 多媒体数据包含着十分丰富的内容特性,对于这些特性的分析、 提取以及获得它们之间的关系和模式都属于多媒体数据挖掘的 范畴。 2.1图像数据挖掘 多媒体图像数据挖掘就是从大量的多媒体图像数据中发现 有意义的模式的过程。多媒体图像数据挖掘的一个十分关键的问 题是图像数据本身的表示问题。这也是图像处理和模式识别的关 键。一般说来,可以用颜色、纹理、形状和运动向量等基本特征来 表示图像的基本特征。高级概念可以看成是一种特征模式。例如, 河流可以认为是具有某种颜色特征的长条形;大片庄稼区可以认 为是具有某种颜色分布和纹理特征的大片图像区域。高级概念是 我们所关心的,它可能是某种物体的存在或某种现象的发生等。 底层的基本特征与高层概念之间必然存在着某种映射关系,这种 关系可以用数据挖掘的方法来发现。因此,提出了如图2所示的 收稿日期:2006-03-18 作者简介:郑伟(1976一),女,江苏徐州人,江阴职业技术学院计算机科学系讲师,教育硕士在读,主要研究方向:多嫌体、信息管理。 44} ¨细 技术 维普资讯 http://www.cqvip.com
\.数据库与信息管理...... 电脑知识与技术 有效益。要想有效益就必须吸引客户,网站的内容和层次、用词、标 类型的)元数据组织成有效的元数据库是一个关键问题。 题、奖励方案、服务等任何一个地方都有可能成为吸引客户的因 3.2挖掘 素。而同时电子商务网站每天都可能有上百万次的在线交易.生 目前一个主要的方法是通过构建多媒体数据立方体来对大 成大量的记录文件(【Dgfiles)和登记表,如何对这些数据进行分析 型的多媒体数据库进行多维分析。多媒体数据立方体可以包含针 和挖掘,充分了解客户的喜好、购买模式,设计出满足于不同客户 对多媒体信息的维和度量,如颜色、纹理和形状维及其度量,多媒 群体需要的个性化网站,进而增加其竞争力,几乎变得势在必行。 体数据立方体可以有很多维,如图像和视频的名称;图像的尺寸 2.6电子商务网站数据挖掘 和视频的长短;建立时间;图像和视频的格式;关键字等。其中很 在对网站进行数据挖掘时,所需要的数据主要来自于两个方 多属性是集合值而不是单值,如一个图像可能包含一组关键字, 面:一方面是客户的背景信息,此部分信息主要来自于客户的登 设计多媒体数据立方体也十分复杂,维数过多.数据立方体计算 记表;而另外一部分数据主要来自浏览者的点击流(Click— 复杂度过高;维数太少,模型过于粗糙,不利于数据的多维分析。 stream),此部分数据主要用于考察客户的行为表现。但有的时候. 3.3结果表达 客户对自己的背景信息十分珍重,不肯把这部分信息填写在登记 多媒体是一种视觉和听觉媒体,挖掘的结果更有效的呈现方 表上,这就会给数据分析和挖掘带来不便。在这种情况之下。就不 式应该是可视化的呈现。根据最终用户的任务要求和目的,把最 得不从浏览者的表现数据中来推测客户的背景信息。进而再加以 有价值的信息区分出来,一目了然地以时间展开、空间分布和运 利用。 动趋向等方式向用户呈现开采结果可视化地呈现事实、事件的叙 就分析和建立模型的技术和算法而言,网站的数据挖掘和原 事和因果关系。另外一种可能的方式是以多媒体特有的导航式知 来的数据挖掘差别并不是特别大,很多方法和分析思想都可以运 识呈现方式引导用户一步步发现感兴趣的知识,如果挖掘结果不 用。所不同的是网站的数据格式有很大一部分来自于点击流.和 够满意,可以调整参数重复以上挖掘步骤,直到得出满意的结果。 传统的数据库格式有区别。因而对电子商务网站进行数据挖掘所 多媒体挖掘得出的知识可用概念、事件、规则、规律、模式、约束等 做的主要工作是数据准备。目前,有很多厂商正在致力于开发专 形式可视化表示和解释出来。 门用于网站挖掘的软件。 4结束语 3多媒体数据挖掘过程 多媒体数据挖掘是多媒体和数据挖掘的结合.是一个新的研 3.1数据准备 究方向,一些概念和方法正在形成中,有很多问题函待解决。尽管 集成处理大型的、异构的媒体资源。选择有效的和与任务相 多媒体数据挖掘面临着许多问题和挑战。但它是一个很有前途的 关的媒体数据集合,提取多媒体内容特征和属性,形成基础的元 研究方向,随着研究的深入,一定会取得更多的成就。 数据库。对于多媒体数据,需要利用内容处理技术获取多媒体对 参考文献: 象和数据的时空、运动和视听特性。以及对于多媒体结构元素的 【1】邵峰晶,于忠清.数据挖掘——原理与算法【M】.北京:中国水 语义,把这些特性有效地组织成为一个或多个多维元数据库(立 利水电出版社.2003. 方体),支持多媒体挖掘。如何从大规模多媒体数据中提取有效的 [2]Jiawei Han.数据挖掘概念与技术【M】.北京:机械下业出版社. 元数据,并把这些多维的(多维特征)、异构的(复杂结构的和各种 2O00. (上接第39页) 由于C/S在逻辑结构上比B,s少一层,对于相同的任务,CJS C/S软件一般采用两层结构,而B/S采用三层结构:这两种结 完成的速度总比B/S快。使得C/S更利于处理大量数据。 构的不同点是两层结构中客户端参与运算,而三层结构中客户端 2.7交互性与信息流‘ 并不参与运算,只是简单地接收用户的请求,显示最后的结果。由 交互性强是C/S固有的一个优点。在 C/S中,客户端有一套完 于三层结构中的客户端并不需要参与计算,所以对客户端的计算 整的应用程序。在出.错提示、在线帮助等方面都有强大的功能,并 机电脑配置要求较低。虽然B,s采用了逻辑上的三层结构,但在 且可以在子程序间自由切换。B/S虽然由Javaseript、VBScript提供 物理上的网络结构仍然是原来的以太网或环形网。这样,第一层 了一定的交互能力。但与C/S的一整套客户应用相比是太有限了。 与第二层结构之间的通信、第二层与第三层结构之间的通信都需 3结论 占用同一条网络线路,网络通信量大。而C/S只有两层结构,网络 B,s与C/S这两种模式是各有利弊的。C/S技术主要运用于内 通信量只包括Client与Server之间的通信量,网络通信量低。所 部局域网,因而缺乏作为应用平台的一些特性,难以扩展到互联 以。C,s处理大量信息的能力是B,s无法比拟的。 网这样的环境上去,并且要求开发者自己去处理事务管理、消息 2_3处理模式 队列、数据的复制和同步、通信安全等系统级的问题,这对应用开 B/S的处理模式与C/S相比,大大简化了客户端,只要装上操 发者提出了较高的要求,而且迫使应用开发者投入很多精力来解 作系统、网络协议软件以及浏览器即可,这时的客户机成为瘦客 决应用程序以外的问题。这使得应用程序的维护、移植和互操作 户机.而服务器则集中了所有的应用逻辑。 变得复杂。而单纯采用100%的B/S模式也将造成应用系统响应 2.4系统维护 速度慢、服务器开销大、通信带宽要求高、安全性差、总投资增加 系统维护是在软件生存周期中开销最大的一部分。OS程序 等问题。而使用C/S和B/S相结合的开发模式是一种较好的方法。 由于其本身的整体性,必须整体考察并处理出现的问题。而B/S 首先它充分发挥了B/S与C/S体系结构的优势,弥补了二者 结构。客户端不必安装及维护。B,s结构在构件组成方面只变更个 不足。信息发布采用B/S结构,保持了瘦客户端的优点。装入客户 别构件,开发、维护等工作都集中在服务器端。当需要升级时,只 机的软件可以采用统一的WWW浏览器。而且由于WWW浏览器 需更新服务器端的软件,而不必更换客户端软件,实现系统的无 和网络综合服务器都是基于工业标准,可以在所有的平台上工 缝升级 这样就减轻了系统维护与升级的成本和工作量,使用户 作。其次,数据库端采用C/S结构,通过ODBC/JDBC连接。这一部 的总体拥有成本大大降低。 分只涉及到系统维护、数据更新等,不存在完全采用C/S结构带 2.5对安全的要求 来的客户端维护工作量大等缺点。并且在客户端可以构造非常复 由于C/S采用配对的点对点的结构模式,并采用适用于局域 杂的应用.界面友好灵活,易于操作,能解决许多B/S存在的固有 网、安全性比较好的网络协议(例如NT的NetBEUI协议),安全性 缺点。第三。对于原有的基于C/S体系结构的应用,只需开发用于 可得到较好的保证。C/S一般面向相对固定的用户群,程序更加注 发布的WWW界面,就可非常容易地升级到这种体系结构,并保 重流程。它可以对权限进行多层次校验,提供了更安全的存取模 留原来的某些子系统。这样就充分地利用现有系统的资源。通过 式。对信息安全的控制能力很强。一般高度机密的信息系统采用 在浏览器中嵌入ActiveX控件可以实现在浏览器中不能实现或实 C/S结构适宜。而B/S采用点对多点、多点对多点这种开放的结构 现起来比较困难的功能。总之,B/S结构与C/S结构各具优缺点, 模式,并采用TCP/IP这一类运用于Intemet的开放性协议,其安 我们应将B/S与C/S模式结合起来,根据实际情况进行系统的选 全性只能靠数据服务器上管理密码的数据库来保证。 型与构建,扬长避短,开发出高效、安全的数据库应用系统。 2.6速度
因篇幅问题不能全部显示,请点此查看更多更全内容