登陆注册
3289000000021

第21章 内容的表达和元数据(5)

MPEG-7一致性和MPEG-7扩展性以及描述部分的应用仍在发展之中。前者将包括概要指导和测试MPEG-7插件一致性的过程,后者将提供摘录和选择使用MPEG-7描述工具的材料信息。

MPEG-7力图概括内容描述的全部方面,它与该领域的其他标准有联系,如EBU/P-Meta、SMPTE元数据字典以及都柏林核心。其他相关的标准还有TVAnyTime和W3C。

4.4.3SMPTE元数据字典

电影与电视工程师学会(Society of Motion Picture and Television Engineers, SMPTE)开发了SMPTE元数据字典作为一个捕获和交换元数据的标准。它强调元数据字典不是一个具体的数据模型、编目协定或者描述方案,而只是提供了一个支持系统定义的元数据标记以及元数据元素的通用标签之间的交互操作的框架。在这个框架中,各种处理元数据的组织可以将现存的方案标识在框架结构中,或者发展适合其各自需求的规定。

SMPTE元数据字典定义了特殊的类,这些类由元数据元素组成,它们有共同的特征和属性。类的组织和类中的结构是层级式的。字典中使用了通用标签概念来标识元数据元素。

元数据字典是一个动态、实时的文档,它支持定义新的输入。SMPTE扮演注册组织者的角色,即它保证了与字典的一般结构和输入唯一性的兼容,只要输入是已经注册的。描述管理流程的文档(MAP)以及工程概要指导(MEG)进一步扩充了标准。作为一个标准体系,SMPTE可以进行标准的修改和添加。

4.4.3.1元数据字典结构

元数据字典由许多章节(或者子字典)组成,每个章节又分成不同的类。

以下是定义的7种标准类:

·类1标识符和定位器,包括与用于描述全部比特流或文件素材的标识信息有关的所有元数据元素。需要特别注意的是,以单个、标准的数字方案进行素材的模糊标识,如用SMPTE UMID(见4.4.3.3)。该类也包括有关元数据元素的标识信息(称为Meta-Metadata)。子类有:全局唯一标识符(Global Unique Indentifier, GUID)、ISO标识符、对象标识符、设备标识符、唯一IPR标识符、局部定位器和标题等。

·类2管理,包括元数据表示的管理和商业信息,也包括权利信息、使用规则、加密信息和财务信息。其子类有:供应商、权利、财务信息、安全、出版输出、参与团体、播出以及重播统计数据等。

·类3翻译,由描述性信息组成,包括手动的人工生成的描述(如主题和分类),以及由自动素材分析过程检索到的信息。类3的信息用于索引、编目、管理查找和内容(或素材)的检索。翻译信息和文本描述(如内容和注解描述、脚本、关键字、分类等)以及低等级技术描述符(如配色方案、文本图、对象形状、表面特征等)共同作用。子类别包括:基本部分(如ISO语言编码、长度和时间系统)、描述部分、分类部分、赋值部分以及描述符(及其赋值或计算)。

·类4参数,包括有关镜头、传感器或系统等组成素材和元数据的技术特征的信息,素材和元数据的技术特征也是其中一部分。该类包括制作参数和原始系统设置。子类别有:视频素材编码特征、元数据编码特征、数据素材编码特征、音频素材编码特征、音频测试参数、影片播放特征、基础序列和检测、MPEG编码特征以及时码特征。

·类5处理,包括描述素材生命周期的处理过程(或者处理结果)。例如,它包括EDL参数、所有变化的审计、压缩和解压步骤记录、存储媒体和格式的变化。其子类包括:处理说明、放大器、下载流处理历史记录、调制和增强、音频处理设置以及编辑信息。

·类6相互关系,具体处理对象之间的关系,可以是对象间的关系、任何相连的素材、对象和元数据的关系。其子类包括:一般关系、相关性、素材与素材的关系、元数据与素材的关系、元数据与元数据的关系、对象与对象的关系、元数据与对象的关系以及关系结构。

·类7空间—时间,包括和与内容有关的或与原始镜头、传感器、系统有关的时间、地点、空间方面的元数据。地理空间信息定义了素材的对象、传感器、个体或其他任何组件的绝对或者相对地址。另外,该类也包括时间元素如日期、时码、同步标记、时间关键字和运动矢量参数等。其子类包括:位置和空间矢量、绝对位置、图像位置信息、位移率和方向、抽象定位、具体角度、距离测量、延迟、设置日期和时间、相关时长、绝对时间和日期、操作时间和日期以及权利时间和日期。

还有3个类,用来表示在SMPTE元数据字典中注册的组织或者试验用的元数据。这些类在字典中与以上7种类分开保存和管理。这3个类是:

·类14公众使用的组织注册,是为具体组织和个人注册的个体元素定义的。该元数据可以被发布,并且使用元数据字典的任何组织都可以使用它。类14是为组织间的个人元数据的交换而设立的,该类元数据的信息放置于元数据字典的某一章节中。它由SMPTE注册机构和SMPTE管理机构联合管理。

·类15私人使用的组织注册,包含由具体组织或个人为了内部使用而注册的元数据元素。该元数据元素本身并不是公开的,但是其元数据标签是在元数据字典中注册标识的,因此该类元素就只能让注册的组织来使用。它由SMPTE注册机构和SMPTE管理机构联合管理。

·类16试验,定义了用于多媒体检索、权限系统的元数据,以及需要新的元数据元素的试验环境。该类元素的定义和使用不需要遵守元数据字典中的定义,该类元数据只能在试验环境和实验室中使用。

4.4.3.2元数据字典元素结构

SMPTE元数据字典定义了属性、集和数据类型的集合体,被称为SMPTE通用标签,以特别标识一个元数据实体。字典定义了属性和属性集合的意义。SMPTE中还注册了(并可以发布)公共标签和属性(类14)。一个条目的标签由两部分16个字节的数值组成,该值独立于语言并且是唯一的,即元数据元素概念的通用表示。前8个字节用于第二个标志进行标引。然后数据元素标记就用来定义元数据元素(或者定义其意义),这样就以层级结构标识出了具体的元数据元素。字典中的元素名称是英文的,另外还使用英文定义了元素所代表的意义,然而这些不能限制字典的通用性。

SMPTE元数据字典指定了作为关于元数据值所需格式信息的元素类型。该定义也给出了元数据元素的边界值,值的长度定义了所允许的字节或者字符长度,它本身是可以变化的。需要重点说明的是,单个数据元素的值可以以不同方式表示,例如文本值可以以ASCII码或者Unicode值来表示。因此,这种表示需要被识别和注册。标签的最后一个值定义了正在使用的表示方式。

元数据字典以节点和叶的形式组成,字典中含有子类的不同类节点定义下一级类节点。节点由没有被赋值的标签来表示。数据元素本身由可以赋值的叶子来表示。

为了转换SMPTE元数据字典元素定义了键—长度—值策略(见4.5.1),或者也可应用XML编码(见4.5.2)。

4.4.3.3SMPTE唯一资料标识符

唯一资料标识符(Unique Material Identifier, UMID)在SMPTE元数据字典类1中有重要的地位。UMID是一个本地生成的标识符,因此它具有全局唯一性。它支持内容的明确标识。扩展的UMID(64字节)支持单帧粒度标识,是为存储和流技术的广泛应用而定义的,应可以随素材自动生成并且在其整个生命周期内保持与内容对象的关系。UMID的主要目的是定义和定位存储中的材料,支持整个制作过程中的持续标识、存储和传输、生成元数据和素材的链接。

素材和其相关元数据的共同目的是使用同一个UMID。然而,这并不意味着UMID必须是全部内容对象的唯一标识符,这对于通用的内容管理应用来说是不可行的。因为这要求内容对象只能在数据库中创建(只有在素材存在的时候,UMID对内容管理系统才是可用的,因为UMID是在素材产生时生成的)。如上所述,此时的操作有可能阻止工作流的进行。然而将UMID作为用于描述内容对象的元数据集的重要属性来存储是很好的。

UMID支持SQL技术用于素材和元数据的检索。UMID数据的表示可以分为两部分:

1.32-字节(强制)基本UMID,它包含的信息包括:

·SMPTE-UMID的通用标签标识符。

·UMID长度的长度描述。

·剪辑的副本(版本)实例数字标识。

·剪辑的材料数字标识,特殊号码。

2.32-字节(可选)签名的UMID,包含以下信息:

·时间或日期,例如制作剪辑的时间(具体到单个帧的时间)。

·镜头位置和原始剪辑的空间配合。

·制作国家的国家码。

·制作组织的组织码。

·制作人的编码。

基本UMID是在一个镜头对镜头的层面进行操作。每次生成一个新记录时,就产生一个独特的UMID加入到素材中。需要再次指出的是(很重要),UMID是自动生成的。

4.4.4都柏林核心

都柏林核心元数据向导计划组织(Dublin Core Metadata Initiative, DCMI)创立于1995年,是一个推动广泛传播的交互元数据使用标准的机构。有很多组织参加了这个协会,如Deutsche Bibliothek、国会图书馆、国家信息研究所、国家科学基金会等。DCMI发展了元数据词汇来描述资源,因此优化了信息发掘和检索。在都柏林核心(Dublin Core, DC)中的资源是有地址的实体、网络站点、文档集合以及非电子形式的媒体(如物理存储)。

DC的目标是:

·简化制作和存储素材元数据集合。

·通用语义,以支持不同用户的存取和检索。

·将元素集合翻译为各种语言,推动国际化使用。

·链接其他元数据集合的元素到DC来进行扩展。

都柏林核心在所谓的都柏林核心元数据元素集(Dublin Core Metadata Element Set, DCMES)中指定了15种元数据元素的集合。这个描述语义定义的核心集合要适合不同产业、规定和贯串组织的内容描述。

个人研究所和单个组织是不能产生新的除了15种元数据元素之外的都柏林核心元素的。都柏林核心并不限制各个领域的长度。属性/值对用于表示内容对象的特性,都柏林核心可以用不同的语义来表示,特别是用HTML和RDF/XML(使用XML的W3C资源描述框架)。

4.5元数据交换和传输的标准

为了在组织中和组织之间交换元数据,要在系统间和组织单元间对元数据进行转换。在不同系统的数据交换中,要应用不同的元数据来表示内容对象。因此,在传输中保存元数据的意义,对处理该元数据的不同实体具有参考文档或者具体的转译数据是很重要的。在上下文中,交换的准则是确保系统和组织之间的互用,因此为元数据交换定义了很多标准、传输协议和编码方案。

本节介绍的编码标准和方案都是为了便于元数据在系统间交换而定义的,然而它们的背景和考虑的主要需求是各不相同的。键—长度—值协议的目标是给出一个有效的节省存储和带宽的元数据编码协议,并且为了实现结构化内容的灵活表示和交换而定义了XML。媒体对象服务器(Media Object Server, MOS)协议是为新闻工作室环境中的信息交换特别定义的。简单对象访问协议(Simple Object Access Protocal, SOAP)是由W3C为结构化信息的传输特别定义的。以上两个协议都是基于XML的。在具体的系统环境下,了解这些协议的结构、对象和特性,从而选取适合的方法是很重要的。其他技术,如CORBA和TCP/IP协议,当然也能够用于元数据的传输,然而它们是单纯的传输协议,而元数据还是要根据定义好的元数据编码方案和标准进行编码。

4.5.1键—长度—值协议

键—长度—值(Key-Length-Value, KLV)数据编码协议是由SMPTE标准化了的为在系统间传输而对元数据元素进行编码的协议。它支持在各种传输媒体上的元数据变换,为所有应用提供了一个共享交互点。KLV考虑了SMPTE元数据字典(见4.4.3)的具体要求,而且特别为电视制作环境进行了设计。

该标准定义了使用八位字节级的数据编码(如源于字节的数据编码)来表示元数据和数据组。它使用键—长度—值三位一体,键标识数据类型,长度定义数据值长度,值指的是实际数据本身。也可以在数据集合中使用三位一体的方式。此时KLV编码用于集合的元素和集合本身。

同类推荐
  • 爱让我们长大

    爱让我们长大

    要想在教育这池水里,潜得再深一些、再久一些,发现其中奥妙,领会其中真谛,就必须让全身的每一个细胞都充满氧气,而且是有质量的纯氧。曾经逝去的每一分、每一秒,汇聚成现在,并将我们引向未来。
  • 信仰导航

    信仰导航

    信仰是人的一种精神追求,它存在于人的心灵深处,融化在人们的价值取向和行为上。信仰对人的行为有巨大的导向、鼓舞和激励作用。正是基于这一认识,这本小册子,侧重于大学生信仰的教育与引导,着重阐述如何科学、生动、有效地开展以“六个为什么”为核心的大学生理想信念教育,引导大学生树立科学信仰,坚定中国特色社会主义的道路自信、理论自信、制度自信。
  • 地方高校体育专业研究生产学研培养模式探索

    地方高校体育专业研究生产学研培养模式探索

    本书稿是一部关于地方高校体育专业研究生“产、学、研”培养模式的探索与实践的专著,本书通过对国内“产、学、研”联合培养研究生模式进行深入研究,透析了研究生的“产、学、研”联合培养对于经济社会的发展、人的发展、科技发展的作用。对研究生“产、学、研”联合培养的框架体系、模式、机制及实施效果进行了探讨,并梳理了联合培养实践中存在的问题根源,提出了进一步推进研究生“产、学、研”联合培养的策略。以期能够为“产、学、研”联合培养研究生政策的建立与完善提供参考依据,推进地方高校“产、学、研”联合培养研究生的长远发展。
  • 中国古代文化知识(语文知识小丛书)

    中国古代文化知识(语文知识小丛书)

    《语文知识小丛书:中国古代文化知识》以国家正式颁布的语言文字规范为依据,以中学课本经典文章为实例,对常见的语文现象进行明晰透彻的辨析。从字、词、句、段、文,循序渐进、深入浅出地讲析,包含了语文常识的方方面面。是酎亍各业不同年龄、不同层次读者的好帮手,特别有助于学生提高正确使用语言文字的能力。
  • 实用公安文书写作大全

    实用公安文书写作大全

    侦查文书,是公安机关(含国家安全机关,下同)在办理刑事案件的过程中,依法制作并使用的具有法律效力和法律意义的文书。侦查文书是侦查活动的产物,是公安机关行使侦查权的主要表现形式,是对侦查活动的真实记载。
热门推荐
  • 东白山情第一部

    东白山情第一部

    故事以汉族的奋斗入手,中间道出了无数修炼秘招、修仙套路,从而演绎出为人当自强的励志故事。书友交流群796696020
  • 凤仪天下

    凤仪天下

    -------------------------------------------凤仪简介她只是个平凡的人,象她这样的迷糊个性,一生也没有什么太大追求,只希望能过着平静平凡的生活。可是老天偏让她不得安生,穿越在一个未知的过去时代,重重历历,步入皇权,凤仪天下。请支持乜乜,给我票票!用力的用票票砸我吧!没有票票也请踩上一个脚印,好让乜乜知道,还是有人喜欢看我的文,给我一个努力下去的鼓励!乜乜新申请了QQ号:942044031凤仪天下终于有群了,谢谢玲珑MM!群号:53350278敲门暗号:皇后驾到欢迎大家进来对乜乜的文多提宝贵意见!多多交流!——————————————厚着脸皮推荐自己新作品!乜乜精心新作《女不韦》——给你一个很不一样的穿越文!连接:
  • 追妻无门:女boss不好惹

    追妻无门:女boss不好惹

    青涩蜕变,如今她是能独当一面的女boss,爱了冷泽聿七年,也同样花了七年时间去忘记他。以为是陌路,他突然向他表白,扬言要娶她,她只当他是脑子抽风,他的殷勤她也全都无视。他帮她查她父母的死因,赶走身边情敌,解释当初拒绝她的告别,和故意对她冷漠都是无奈之举。突然爆出她父母的死居然和冷家有丝毫联系,还莫名跳出个公爵未婚夫,扬言要与她履行婚约。峰回路转,破镜还能重圆吗? PS:我又开新文了,每逢假期必书荒,新文《有你的世界遇到爱》,喜欢我的文的朋友可以来看看,这是重生类现言,对这个题材感兴趣的一定要收藏起来。
  • 大国工匠

    大国工匠

    书中剖析了中国何以缺少工匠精神,也提出为什么工匠精神才是核心竞争力。笔者提出问题让人思考的同时,不忘给出方法和解决之道,这也是推荐《华夏智库·新管理丛书大国工匠:寻找中国缺失的工匠精神》的原因所在。无论办企业还是在企业做工,都该秉持这种工匠精神,知其然也要知其所以然,然后从根本上认识到问题,从而改进和传承。如今可能有人觉得这种精神已经落伍。其实,很多时候我们不缺一流的设备和材质,缺的正是这种“工匠精神”。工匠精神是一种态度、一种精神、一种情怀,就像书中笔者呼吁的那样,让新时代的我们一起匠心归来吧!
  • 浴血凰唳愿来生错过

    浴血凰唳愿来生错过

    她是受千夫所指的血族少主,他是令万生倾服的星辰之子。他们命中注定不能共存。他初见她:“你额间的花美的张扬。”她冷笑:“嗜血之花,自然张扬。”她从记事起就背负着仇恨,他出生的夜群星璀璨,恰巧那日血浴花遍布了断生崖,山崖之内,只有一片血腥。“既然你我从这里相识,那么今日,一切便从这里结束吧。”她的目光冰冷,他只是苦笑,任凭冰冷的剑端刺进他的心脏。“抱歉,杀了我,放下仇恨活下去,好不好?”她眼中的杀戮被冲淡,最终长剑从手中坠落。她怎么忍心伤害他。或许从一开始,他们的相遇就是一场过错。彼此都曾庆幸能够遇到对方,但此刻,惟愿错过。
  • 武出法随

    武出法随

    侠以武犯禁!泱泱武国,岂容宵小。杀大侠,斩大圣。“普天之下,莫非朕土。率土之滨,莫非朕臣。”三步杀一人,手停心不停。
  • 大霹雳系统

    大霹雳系统

    这个江湖有两种人。制定规则的强者;遵守规则的弱者。我都不想做,所以……我早就不在这个……江湖了。异世界获得霹雳布袋戏武学系统。我生在华夏,但霹雳负我,所以抱歉,停更!
  • 妖孽传之夜明

    妖孽传之夜明

    何为妖孽,能从一片无尽黑暗中寻求得那一点光明的,就是妖孽!少年从深山中走出,身负一百几十种“神通”,为挣脱命运的牵引,在已无人知仙的路上越走越远...
  • 当代学者自选文库:谢冕卷

    当代学者自选文库:谢冕卷

    本套书选收我国当代人文社科领域著名学者具有代表性的学术论文和专著中的重要章节,旨在总结和展示新中国成立以来学术研究之精华、学术繁荣之盛况,使优良的学术传统、严整的学术规范得以承传光大,使一代学人的优秀学术成果以新的面貌进入21世纪以至更远的时代。
  • 喜欢你这件事你知道

    喜欢你这件事你知道

    青春,是一次告白,一场暗恋,一个你。励志成长,以温柔对待万物,无论世界多么嘈杂,我们一直都在。