音乐推荐系统中音乐情境信息源研究
摘要:本文研究了情境信息在音乐推荐系统中的重要作用,梳理了情境信息的类型,重点研究了音乐相关情境信息的来源,对各情境信息源的特点功能进行了比较分析,探讨了音乐情境信息相比于音乐内容特征所具有的优势和存在问题,指出融合基于情境的方法与基于内容的方法是提高音乐推荐系统性能的有效途径。
关键词:音乐情境信息;音乐推荐系统;情境信息源;情境感知
1 引言
音乐在人们生活娱乐和社会活动中发挥着重要作用。随着互联网技术和数字音乐技术的发展,大量的创作者和音乐作品在网上出现,世界各地网民可以越来越容易地获得大量的音乐内容,但是要选取自己需要的音乐确越发困难,大量具有潜在价值的音乐难以被发现。这些数量巨大开放可获取的音乐数据为音乐信息检索和推荐领域的研究带来了新的机遇,研究开发可支持音乐发现、查找、导航、共享以及听众建群的音乐推荐系统具有很强的必要性。
2 音乐推荐系统中的情境信息
2.1音乐推荐系统
音乐推荐系统是一种决策支持工具。它根据用户的音乐偏好信息来检索可能与用户需求相关的音乐曲目,以此来降低音乐信息过载。如Last.fm就是一种较流行的音乐推荐系统。它允许用户标记所喜欢的音乐或音乐家,记录听众的收听习惯,并根据这些信息识别推荐用户可能感兴趣的音乐内容。然而,目前大多数音乐推荐系统在推荐音乐时,未考虑有关的情境因素,如用户的情绪、当前位置和活动等。一项对用户音乐信息需求的研究表明,人们通常因特定场合、事件或一种情绪状态而寻找音乐。此外,Lee等人[z]认为对外加音乐信息的需求正在增加,这类信息将用户现实世界的音乐查找情境化,从而提供更有用的检索结果。
2.2基于情境的音乐推荐
基于情境音乐推荐的基本思想就是根据用户的实际情况推荐音乐,如用户的情绪状态或可能影响用户感知或评价音乐的其它情境状况。这种音乐服务具有明显的现实应用价值,例如,位置感知系统可检索与用户所处位置相关的音乐:选择由生活在这个地域的作曲家创作的音乐;移动旅游指南系统播放适合旅游者正参观景点的音乐,所挑选的音乐与由此地所生情感相匹配;车载音乐播放器根据汽车正经过的景致选择音乐。
2.3情境信息种类
在计算应用领域,情境的概念出现于上世纪九十年代中期,B.Schilit[33将情境定义为:描述你在哪,你同谁在一起,身边有何资源的信息。而A.K.Dey[40则给出更正式的定义:情境可以是描述实体状态的任何信息;这个实体可以是用户和应用程序交互时相关的一个人、位置和对象,也包括用户和应用程序本身。针对音乐信息服务这一领域,我们可以将情境划分为环境相关情境、用户相关情境和音乐相关情境。
(1)环境相关情境用户的位置:通常以地理坐标、景观类型(如城市、乡村等)、附近的山脉、河流、建筑等来表示。听众的周边环境会强烈影响其对音乐的感知和偏好,如行走在繁忙的城市街道相比于漫步在林间小道,所唤起的情感大不相同,进而产生不同的音乐偏好。
时间信息:指一天的早晨、午后、晚间或一周的工作日、休息日等。这些时间因素潜在地影响用户的音乐喜好,如紧张的周一早上肯定不同于放松的周末晚上。
天气信息:指天气状况,如晴天、雨天、阴天等,温度寒冷、温暖、炎热等。用户的音乐偏好会因潮湿阴冷的秋季和阳光明媚的春季有很大的差异。
(2)用户相关情境用户活动或状态:用户活动包括行走、跑步、驾驶等,还有描述用户状态的量化参数,如步行速度、心率等。这类信息对用户的音乐偏好有直接影响,同~个人在放松和健身时会倾向不同的音乐。
用户人类学信息:包括听众的年龄、性别、国籍、语言、社会团体、个人特质等。根据音乐心理学的研究,听众的个人特征和社会生活方式与其音乐偏好高度相关。[51用户情感状态:人类的情绪对其音乐偏好有最直接的影响。人在悲伤和高兴等不同的情绪下,所需要的音乐各不相同。早期的音乐心理学研究认为人们选择音乐来缓和其情绪[6],而新的研究则表明人们喜欢用音乐感受来强化其情绪。[7]
(3)音乐相关情境包括音乐作品名称、音乐家、演奏家姓名及其文化政治背景、语义标签、专辑名称、乐曲歌词等。与获取基于内容的音乐特征不同,获取基于情境的音乐特征,无须直接处理实际的音乐文件。如果采用音乐家列表等情境要素,不用任何的音乐声学表示内容也可以构建音乐检索或推荐等应用系统。另外,如果没有诸如音乐家或作品名称这些情境数据,大多数基于情境的音乐系统也无法应用,除去应用用户排序的系统,其它所有基于情境的系统都要依靠音乐相关情境数据。
3 音乐情境信息濠的种类
3.1基于文本的情境信息源
音乐知识的文本化表现很多来自于网页、用户标注或歌词等,因此它们自然成为音乐情境的一类重要信息源。
(1)Web文本术语档数量庞大的Web页面提供了相关于音乐的广泛信息,这类信息的获取目前主要是应用搜索引擎,从非结构化的web文本中检索相关文档并创建音乐家等术语档。为将检索限定在音乐相关页面,人们在用音乐家姓名检索时进行了一些扩展,如S.Baumann等人[83用“音乐评论”,P.Knees等人[93用“音乐类型”这些短语来扩充提问。
(2)协作标签作为Web 2.0的一个重要特征,web网站鼓励、需要其用户参与内容的创建,对可获得的照片、电影、音乐由用户群进行标注。标签几乎可以是任何东西,但通常是对被标注音乐某典型方面(如类型或风格、配器、情绪、表演者等)的简单描述。使用某一标签标注一作品的人越多,则该标签与作品的相关性越大。目前全球最著名的使用这种方法的音乐网站就是Last.fm。它使用标准化方式收集标签,因此为音乐情境信息提供了很有价值的来源。
(3)歌词歌词是音乐语义内涵的重要表现方面,通常揭示了有关音乐家、表演者的重要信息,如通过不同语言或俚语反映的文化背景、政治倾向,使用某些音乐流派中的特定词汇反映的音乐风格等。J.P.G.Mahedero等人L1叫指出歌词在四个方面具有重要作用:语言识别、结构提取(即:前奏、主歌、副歌、衔接、结尾等)、主题分类和相似性测量。
3.2基于共现的情境信息源
原则上,两段音乐或两个音乐家出现在同~情境中,则认为二者具有一定相似性。这种相似性的信息源包括网页(或搜索引擎返回的网页数)、微博、播放列表和P2P网络。
(1)基于Web的共现和网页数网络环境下,音乐实体的情境与Web页相关,确定和利用这些音乐相关页,可以为音乐检索与推荐提供信息源。为确定相关于音乐领域的网页,w.W.Cohen等人[1嵋向搜索引擎Altavista和Northern Light提问,返回的HTML页面用DOM(文档对象模型)树进行解析,所有具有最少250个字符的纯文本内容被进一步分析实体名共现情况。这一过程析取出音乐家姓名的共现信息,随后用于音乐家的推荐。
另一种基于共现的方法不是真正检索共现信息,而是依赖搜索引擎查询返回的网页数。制定由两位音乐家姓名构成的复合提问并返回搜索引擎所估计的网页数,这种方法可看作是标准共现分析方法的一种简化。
(2)微博推特作为全球最广泛的微博服务,在过去几年得到了极大的增长。因为很多用户通过推特分享其欣赏音乐的感受,它为推断音乐的相似性提供了有价值的信息源。研究通过微博推测音乐家或音乐之间的相似性近几年受到重视,E.Zanger—le等人[12]和M.Schedl等人D3]提出了相似的处理方法。两种方法都利用推特的流API过滤输入的微博来收集经常用于指示音乐欣赏事件的标签,然后使用MusicBrainz数据库对过滤后的微博挖掘音乐家及作品名称的共现情况。与音乐家或音乐匹配的微博随后按每个用户聚合,生成各自的欣赏历史。将共现分析应用于每个用户的欣赏历史,便可完成相关性测度,其中被同一用户经常欣赏的多个音乐家或作品被视为相似。由于微博140个字符的限制,其文本处理相比于网页要更省时间。
(3)播放列表早在2001年,Pachet等人提出一种从音乐实体的情境中获取相似性信息的方法,利用广播电台的播放列表和编辑的CD数据库提取音乐作品之间和音乐家之间的共现信息。作者统计了在播放列表和编辑过的CD中的两个音乐家或两段音乐的共现次数,根据不同的频次,通过对共现数正规化,可得到一部作品或一位音乐家的受欢迎程度。
(4)P2P网络因为其用户通常希望揭示有关共享内容的各种信息,P2P(Peer—to—peer,点对点)网络提供了一种挖掘音乐相关信息的丰富来源。对于可共享的音乐文档,文档名和ID3标签通常是公开的,而ID3标签中包含了乐曲演出者、作者、标题、专辑名称、年代、风格等众多有益的音乐情境信息。
3.3用户的排序
另一种获取情境信息的来源是显式的用户反馈,也称作协同过滤。基于用户排序的方法经常用于实际的音乐推荐系统,如Last.fm和Area—zon等。该方法的核心是必须进入大型和活跃的交流群并参与其中的活动。
4 几种慵境信息源的比较分析
上述几种涉及音乐服务的情境信息各有其特征,在信息来源、用户群体参与、数据描述对象、数据稀疏性、流行偏见性、潜在噪音等方面亦有各自的表现,具体比较如下表。
总体而言,这些情境信息不依赖于音乐本身的物理特征,主要由社会公众根据自身的需求、感受进行创建,在揭示相关音乐、音乐家等内容特征同时,相比于基于内容的音乐处理更简单便捷,更面向用户。这些音乐情境信息所具有的优势主要体现在以下几方面。
4.1 汇集大众智慧
网络时代每个信息的使用者同时又可能成为信息的创建和提供者,对于音乐欣赏与理解这种个人性和主观性很强的心理活动,如果没有足够多的用户参与,音乐推荐的结果必然有很强的主观性和片面性。上述音乐情境信息大多以网络为平台,聚集广大听众对音乐作品和音乐家的各种判断评价,反映人们在信息交流过程中丰富的思想与感受,集众人所长,充分实现对音乐内容揭示的客观性与普世性。
4.2节约时间成本
Web2.0、“云计算”等新一代互联网技术的发展,为社会每个成员参与情境信息的创建提供了可能,音乐情境信息不再只是专业标引人员的工作成果,也不再局限于单个系统的采集与提供。对于网上海量音乐资源的信息处理这一浩瀚的工程,广泛的公众群体的加入,众多信息系统的合力,实现了高效的社会分工与协作。每部音乐作品都会有其知音,每个听众都会找到自己喜欢的作品,各取所需,各负其责,在保障工作整体性与系统性同时,有效缩短信息处理时间。
4.3提高信息多样性
每个人的能力水平有限,对于描述音乐这种复杂的信息对象,一个人很难做到全面深入。如果一个用户的认知能够反映音乐的某个方面,则多个听众的不同感受会带来对音乐理解的全面性与广泛性,实现作品描述信息的多样性与系统性。音乐语义信息产生作用的核心特征就是因人而异,而大众不同个体对某部音乐认知的差异性和多样性,正是保证社会对该音乐作品认识完整性和一致性的必要前提。
音乐情境信息由公众参与集思广益所带来的特点在数据规模适中情况下能充分发挥优势,但在数据大规模出现时,却又会暴露出一些问题。
(1)“冷启动”问题当一部新音乐作品和一名新用户加入到交流平台时,往往很难被已有用户关注,因此新作品和新用户无法与其他作品和用户生成更多联系。
(2)数据稀疏问题当公众用户和音乐作品数量很大时,无论是一个用户还是一部作品,其在整体中的覆盖率都会很低,因为一名听众通常只关注有限的音乐作品。这种基于邻接对象相似度所做出的预测可靠性自然不高,因为对象之间相似度是在少量共现或共排序样本上估计得出的。
(3)“长尾”或“流行偏见”问题占比很小的流行曲目热门音乐一般会受到大众的追捧,其对应的音乐情境信息密度很大,作品被推荐的概率很高。而大量知名度不高的作品,则少有用户去关注,情境信息分布广但密度低,形成“长尾”现象,难以进入推荐名单,被“流行偏见”所歧视。