微博话题研究.doc
- 文档编号:8740330
- 上传时间:2023-05-14
- 格式:DOC
- 页数:22
- 大小:579KB
微博话题研究.doc
《微博话题研究.doc》由会员分享,可在线阅读,更多相关《微博话题研究.doc(22页珍藏版)》请在冰点文库上搜索。
硕士学位论文 工作总结与展望
摘要:
在近几年里,作为一种新兴的社交媒体与信息交流平台的微博正飞速的发展和广泛的应用,但相比之下,微博信息的分析与挖掘还处于起步阶段。
如今,因为微博信息具有海量、短小、不规范、重复度大等特点,传统的信息分析方法难以满足微博信息分析的需求。
所以,为了能够将内容相近或相似的微博聚集到一起,识别出微博话题,本文引入文本聚类方法,并针对微博信息的特点展开研究和试验。
这样不仅能够节省用户查看微博的时间,帮助用户实现信息的有效组织,还对微博舆情的预警有一定的帮助作用。
本文主要完成了以下几个方面的工作。
第一,先分析了微博文本信息的特点,再根据其特点研究了常用的微博信息分析方法,比较了各种方法的优缺点从而确定本文基于文本聚类的研究方案。
第二,分析微博信息的特点以及其处理效率等因素设计了基于文本聚类的微博信息处理流程,包括微博文本预处理、微博文本表示及聚类处理;第三,对文本表示方法和文本聚类算法进行了深入的分析,使用向量空间模型描述微博文本,用k-means算法对微博文本进行聚类,并且介绍微博信息处理流程的具体实现,第四,利用预处理后所得的微博数据进行试验,并深入讨论了特征维数和距离对聚类结果的影响。
本文的研究工作表明,采用“最小最大原则”能够较好地
处理k-means算法对初始点敏感的问题;在计算文本相似度时,相比欧氏距离,利用余弦距离对微博文本进行聚类会更加好,且能够获得更高的正确率和召回率,因此从实践上论证了k-means文本聚类算法对微博信息分析的可行性和合理性。
并为微博信息的深度分析和后续应用系统的开发提前做了一些基础准备。
本文的研究工作对微博舆情监控等方面的应用开发有着重要的参考意义。
关键词:
聚类技术;K-Means;微博话题
1绪论
1.1课题背景与研究意义
最近3年,微博服务在迅猛地发展。
例如,国外最大的微博服务提供商推特(Twitter:
http:
//www.T)目前每天产生超过5500万条微博(字数不超过140字符的短文本),微博用户访问数超过1.8亿,其注册用户数则超过1亿。
在近几年,国内的微博服务也开始兴起。
目前主流的互联网门户都提供了微博服务。
其中比较典型的代表是新浪微博。
截止2016年8月它已经拥有超过5.4亿的微博注册用户。
由于当今互联网的飞速发展,社交网络的影响力已经超过报纸、广播、电视等传统社交媒体,也日益成为人们日常生活中收发信息的主要渠道,与人们的生活越来越密不可分了。
人们越来越倾向于通过网络来结交朋友、发表观点。
社交网络有很多种不同的形式,微博就是其中一种重要形式。
微博是一种基于用户关系的社交平台,在微博上,用户以文字、图片、链接等形式发布信息,实现信息的即时发布、传播与获取。
微博的进入门槛非常低,用户个人能够在短时间内注册自己的微博账号并且发布信息,因此,近几年来,微博正飞速地发展。
在国内,新浪微博是微博的一个典型模范。
之所以微博服务正蔚然成风,是因为它满足了草根快速交流分享信息的需要。
在微博平台上,任何用户可以就任何话题发布任何消息,此外,微博用户还可以关注其他用户且追随他们关注其他的微博,或者向追随者推荐关注其他的微博,使得微博平台成为一个巨大的社会化网络。
正是因为微博拥有巨大的信息量和庞大的用户群体,所以它如今已经成为一个最重要的实时信息源和一种影响力日益增强的新的社会媒体。
一些重要的热点事件,都是由微博首先报道的,例如,2009年迈克•杰克逊逝世的消息,2010年智利大地震以及2011年的本•拉登被击毙等。
作为一种媒体形式,微博对热点话题十分敏感,事实上,微博已经成为热点话题传播的重要媒介。
相比传统媒体,微博具有发布便捷、内容简单、热点话题传播实时迅速等优点。
就目前情况来看,微博热点话题往往会对社会造成较大的影响。
在当今社会,微博热点话题往往会很大程度地影响到社会,其影响范围、传播力度以及扩散速度都超乎想象。
比如在近几年出现的西安药家鑫案、河北大学“李刚门”案和“茉莉花革命”案等微博热点话题讨论中,既有保护弱者的仗义执言,也有心怀不轨的故意煽动。
因此,在新兴社会媒体对社会影响日渐显著的背景下,实时掌控微博热点话题对行业调研、商业情报分析、网络舆情预警、信息安全以及国家灾难应急响应等方面都具有重要意义。
然而由于目前微博文本短小,兼备结构化特性,且具有数据噪声大、动态变化快等特点,使得目前对微博热点话题的研究备受诸多限制,进而使得传统的文本挖掘算法不能很好地应用于微博文本建模。
同时,微博平台每天产生成千上万的微博数据,这对微博热点话题预判方法的实时性提出了更高要求。
为了实时掌握微博舆情热点,本课题对微博热点话题分类技术进行相关研究,这些相关研究在一定程度上突破了热点话题发现方法的应用屏障,提高对微博舆情的快速感知能力。
本课题是基于某国防项目进行的课题,其研究成果为突发事件预警、网络热点发现等实际应用提供技术支持,对解决专业部门实际问题具有一定的实用价值。
对微博文本对微博文本的分类算法研究是一项具有实际应用意义的十分重要的理论研究。
对微博文本的分类,可以帮助用户从海量的微博数据中区分出不同话题的微博,进而提高用户的浏览效率。
1.2国内外研究现状和趋势
1.2.1微博发展的研究现状和趋势
微博是一种允许用户及时查看、公开发布信息、以及更新简短文本的微型博客形式,微博始于美国Twitter[6],其英文原译为小鸟的唧唧喳喳声,在2006年3月,EvanMilliams创建的Obvious公司,首次推出大微博(Twitter)服务。
初始阶段,Twitter仅仅用于好友间手机发送文本信息。
随着Twitter发展,2005年以校内网起家的王兴,建立了饭否网,但因各方面原因,于2009年这类网站相继关闭。
随后,新一批微博相继建立开放,并在短期内注册了大量微博用户,如2009年7月份的新浪微博。
其它较为大型门户网站,如腾讯微博,搜狐等[7]网站也建立它们的微博平台。
当前微博,无论是Twitter还是国内微博,包括新浪微博,腾讯微博,微博用户不仅包括个体用户,还包括企业用户,名人用户。
随着移动终端的发展,微博用户量和使用率会进一步提升。
艾瑞咨询网民行为监测系统iUserTracker数据[8]显示,微博已发展成熟,其用户人群逐渐呈现稳定趋势,用户粘性也逐渐可观,并且其商业化进程逐步推进,就目前国内而言,微博具有以下几个特点[9]:
1)碎片性
当今社会高速发展,信息流动速度快,人们往往更喜欢阅读碎片化的信息来了解当前社会的各类事件信息,微博提供了一个碎片化信息平台,因为当今社会信息流动速度快而且信息量巨大,人们越来越喜欢通过阅读碎片化的信息来了解当前社会的各类事件信息,所以微博提供了一个碎片化信息平台,让人们更加便捷地知道当前热点事件,也提供了一种人们交流的方式,使更多的人可以倾诉自己的碎片化情感,释放个人压力。
2)海量性
由于微博的碎片性,每个微博用户可以随时随地的实时发布一条微博信息,从而导致微博产生海量性的数据。
又因为在微博中,用户无需任何验证变可以任意关注微博任意用户,并且转发别人的信息,使得微博数据量变得更加庞大。
3)原创性
越来越多的用户参与微博使用,包括一些名人明星艺人,都可以通过微博传播生活琐事。
此外,也有不少的谐音词、简写词等词汇广泛出现在微博中,如“稀饭”代表“喜欢”、“杯具”代表“悲剧”。
而这些词汇并不是一成不变的,会随着时间不断变化,新的词语也会不断出现,这些都体现了微博的原创性。
随着互联网和移动终端的发展,微博的使用途径较为宽广,包括使用Web访问、WAP以及各种客户端组建个人社区,如图1-1所示会图1-1微博多种访问途径
1.2.2微博话题发现和预测的发展动态
微博热点发现与预测属于网络舆情分析和预测的研究范畴。
通过研究发现目前微博热点主要有基于词频统计、分类和话题演化的热点发现方法。
当前微博平台上发现热点的主要方式是词频统计,该方法来源于传统的TF-IDF索引方法。
词频统计方法简单易行,而且具有较好的效果,目前在服务商中被广泛采用。
然而,词频统计方法基本无法解决同义词和一词多义的语义现象,并且在微博平台上,内容量大,用户个性强,高频词也未必代表热点话题,因此这类方法适应性还有待改善。
基于分类的方法,Sakaki等[30]在面向灾难事件检测的特定应用中,对微博进行时空划分和地域划分,在此基础上应用三类特征(统计特征、关键词特征和关键词内容特征)将微博划分到活跃类和消极类,从而判断相应话题是否为热点;Sankaranarayanan根据每个话题中消息发布的平均时间与现在时间的间隔评判话题是否活跃,进而达到分类效果;Hong等人利用转发行为作为测量微博流行性的途径,使用二元分类的方法,判断某个微博在未来是活跃的还是消极的,这种方法的判断结果比较粗浅,吸纳了大量活跃话题,需要在后续传播预测过程中进一步界定。
基于演化分析的方法,Cataldi等人[22]提出,现有许多聚类和分类的方法往往忽略了与特定事件相关的文档间的时序关系,并不适合话题演化的分析,为了解决这个问题,该文献根据“内容老化理论”建立内容时序模型,此模型是基于单词生命周期的一个模型,简单地来说,就是把每个单词看作一个生命有机体,其生命周期类似于生物的生命周期,如果有充足的营养(如相关微博消息)则可以继续生存,生命周期延续,否则寿命终止。
基于这种假设,使用“能量”一个词来评价关键词的生命力,并根据“能量值”对关键词排序,选择新增高频关键词以定位突发事件,和Cataldi等人类似,文献[35]引入生命周期理论,用来指导建立话题识别与追踪模型。
针对如何预测微博话题热点这个问题的相关研究一般是在发现微博热点的基础之上进行的。
目前,很多舆情预测方面的研究成果值得借鉴。
文章[2]结合微博平台上的时序特征和文本特点提出了一个迭代式的语义分析和热点话题预测模型—TopicRank,对话题在未来一段时间内的影响力变化趋势作出预测;S.Jamali等人[36]将用户评论量和社会关系网络属性作为话题特征,提出了话题流行性分类预测算法;Hong[34]等人基于数据挖掘和小波分析的话题特征的分析和传播趋势预测算法提出了一些预测的算法;V.Gomez等[37][38]就于用户参与话题讨论的回复时间分布特征进行分析,并提出了短期和长期的用户行为预测方法;Wu[39]通过分析用户在话题传播过程中扮演的角色,发现话题信息大多数被影响力高或知名度高的用户进行选择性的传播,同时不同的用户关注的话题类型也是不同的;孙胜平[7]是用用户的微博粉丝数评判其影响力,从而预测微博的潜在受众,但Cha和Romero[40][41]指出粉丝在社会网络中是信息的被动接受者,仅仅依靠粉丝数并不能准确评估用户影响力,反而会阻碍话题在用户关系网络中的传播。
同时,Yu等[32]强调了在新浪微博中普遍存在转发行为的现象,相对于Twitter更显著,这是是形成热点话题的决定因素。
Hong等人[34]也从转发行为分析微博的流行性,并使用二元分类的方法对热点话题进行预测。
微博转发行为不仅与转发的话题本身一些特性有关,也受用户兴趣以及情感分析等研究范畴影响。
所以,对微博转发行为的分析有助于对话题传播的趋势及其成为热点的可能性进行科学的分析和评判。
另外,当前有很多研究工作都涉及微博的转发机制,比如文献[42][43]分析了微博转发的原因和其影响因素,发现了用户影响力及其关注关系和微博内容特征均影响到转发行为。
而另一方面,Petrovic等通过实验证明了转发预测的可行性,文献[34][46]分别基于分类和协同过滤的方法设计转发行为的预测算法,效果并不理想。
张旸等人提取了可能影响转发的22个特征,使用信息增益的方法对各个特征进行加权预测微博的转发行为,结果发现用户粉丝数的多少和微博是否提及他人是影响微博转发的重要因素。
综上所述,发现和预测热点话题一般是通过常规的概率统计、数据挖掘、时序分析等方法且在得知话题特征的基础上进行。
在特定应用中选取恰当的话题特征和分析方法效果会更好[30][22]。
但是有些相关研究比较片面地分析话题热度,其研究结果准确性有待提高。
这主要是因为微博信息网络是一个复杂信息系统,具有社区结构复杂、用户群体庞大、话题内容丰富以及用户行为不确定等特点。
如何对微博话题相关特征进行统一描述,是微博热点话题预测的关键问题。
1.3工作和结构安排
本课题主要完成了以下几方面的工作:
(1)把微博文本信息作为研究对象,分析其文本的特点,并将文本聚类相关技术应用到微博上进行分析,识别出微博中有意义的聚类,然后通过实验对该方案的效果进行评估。
于此同时,还要从多个因素对聚类结果可能造成的影响进行了实验分析与研究。
(2)深入研究如何将文本聚类技术引入到微博信息的分析上。
文本聚类技术作为文本挖掘的一个重要研究方向,涉及到数据挖掘、自然语言处理、信息检索等众多领域的知识。
也包括预处理、文本表示、聚类算法的实现等一系列流程。
怎样对微博文本进行预处理,如何把微博文本表示为数学上可以计算的形式,用什么聚类算法,这些都是要研究的问题。
(3)文本聚类之后,文本集合被划分成若干个簇。
得到的簇结果的质量如何,该怎样评价簇的质量,哪些因素会影响到聚类结果等问题也是下一步工作的研究方向。
依据以上内容,本论文的章节安排如下:
第一章:
绪论。
介绍本课题的研究的背景和意义,简要分析国内外与本课题相关的研究现状,并重点论述微博研究的现状。
最后给出了本文的主要工作内容和组织结构。
第二章:
相关理论介绍。
首先探讨了微博话题的定义;然后分析微博数据;接着深入探讨分析了文本聚类的基本思想,处理过程及主要应用;最后深入研究了文本表示的五类表示模型。
第三章:
微博话题聚类技术研究。
设计了微博信息预处理流程,包括对微博文本进行噪音分析、分类词语及过滤停用词;接着讨论了如何表示微博文本,重点比较和选择不同文本表示模型,及特征降维方法的分析对比。
第四章:
聚类算法K-Means在微博话题的应用。
阐述了目前一些基于文本聚类的微博信息分析的实现。
本章实现了整个聚类相关的工作流程,包括文本预处理、文本表示、文本聚类三个阶段的具体实现,使用java语言描述了每一个阶段中的重点子流程。
第五章:
微博话题聚类实现及结果分析。
首先说明了实验环境和实验数据,并简要描述整个实验过程,且展示运行结果。
最后对本文采用的方法得到的聚类结果进行了评价,设计了实验,也深入分析了特征维数和距离对聚类结果的影响,并得出一些结论与建议。
第六章:
工作总结与展望。
总结本课题所做的工作和研究内容,指出本系统设计的优缺点,并展望未来需要进一步优化和改进工作。
2相关理论介绍
2.1微博话题概念
微博热点话题聚类涉及微博文本信息预处理、话题识别、热点话题评估、微博社会网络分析以及其用户影响力分析等研究内容,下面对相关概念进行介绍:
定义1微博:
是指微博用户在微博平台上发布信息以表达自己的某种情感或诉求,其内容可能涉及某些社会事件或个人情感。
定义2微博话题:
是指与微博文本关联的一个核心事件或活动以及与之直接相关的事件或活动。
定义3微博用户关系网络:
是指微博平台上,由彼此相互关联的微博用户群体及与其相关联的关系构成的网络结构。
该网络结构一般表示为节点和边的集合,如G(V,E),其中非空集合V为节点的集合,代表了微博用户的集合,集合E⊆V×V为边的集合,表示用户关系集合。
微博关注者称为被关注者的粉丝,依靠粉丝关系建立起来的关联关系网络称为用户粉丝关系网络。
定义4微博热点话题:
是指被大多数微博用户关注和讨论的微博话题。
这是一个相对的概念,利用用户关注的广泛性进行阐述是为了可以提供一个客观依据去判断与选择热点话题,实际应用中以话题热度值予以量化。
2.2微博数据分析
微博逐渐成为一种重要的信息载体,和传统的新闻语料一样,微博语料也被很多研究人员纳入为关注的对象。
微博数据不应该只是用来表示成普通文本,还可以分析其特有的一些数据特性,更加有利于提取其中的珍宝。
例如结构化特性等。
为了分析微博数据特性,下面先给出一个微博示例,如图2-1所示。
图2-1微博示例
从中可以发现微博数据的一些特性:
微博文本比较短小,并且除了正文文本内容外,还提供了发布用户资料、发布时间、转发数目、评论数目、url链接以及一些特有的文本标记等丰富信息。
在对微博热点话题预判技术进行研究需要先分析微博的数据特性,因为这些微博数据特性使得微博平台的热点话题与传统新闻媒体的热点话题之间存在区别。
微博平台拥有众多的用户群体、海量的文本数据以及丰富的话题信息。
用户可以通过“评论”、“转发”其他用户发布的微博实现信息互动,使得微博数据具有结构化特性。
在具体的对话中,用户可以使用“@用户”标识在众多用户群体中指定一个或多个用户接收信息,还可以使用“#话题#”标识微博讨论的特定话题,使用URL指定外部链接,这些标识有益于还原用户对话以及整理微博内容,使之更易于检索。
用户在微博平台发布的微博文本具有字数限制,不同于传统媒体的长文本形式,微博文本的特征维数高且其特征空间稀疏,我们称之为短文本特性。
所以,传统的基于TF-IDF和向量空间模型(VSM)的相似度计算方法不适宜使用在研究微博文本的。
虽然一些关于微博短文本特性的研究改进对传统的话题识别方法,但大多只是优化聚类策略,并未从根本上解决话题特征空间稀疏对文本相似度计算的限制问题。
另外,微博文本数量巨大,新浪微博每天产生的微博数据有五千万之多,然而众多的微博数据也包含了大量的与热点话题没有联系的数据,这部分数据往往会影响热点话题的预判效果。
此外,在微博数据中热点话题具有突出的动态特性,几乎每个小时都会产生不少热点话题,这需要更高的实时处理微博数据能力。
2.3文本聚类
2.3.1文本聚类的基本思想
聚类是将数据对象进行分类、划分成一些子集的过程,每个子集就代表着一个簇,要求同一个簇内的对象相似度尽可能地大,不同簇之间的对象相似度尽可能地小[24][25]。
分类是对大量预先分类好的训练样本进行学习类的描述,然后对一个新的未标注对象进行分类。
而聚类却不一样,并不能通过示例学习,也提供不了类别标号,它要划分的类是未知的,需要通过聚类才能够产生的。
文本聚类简单地来说,就是对文本数据对象进行聚类,它的基本思想是:
相同类别的文本之间相似度较大,而不同类别的文本之间则相反[26]。
2.3.2文本聚类的处理过程
文本聚类的处理过程可以粗略地划分为文本预处理、文本表示、聚类处理这三个阶段,而每一个阶段的任务又可进行细化。
1)文本预处理阶段。
在这个阶段,通常是把信息的原始数据转变成规范格式,一般包括分词处理、停用词过滤等任务,有的时候还需要依据具体的应用来确定应有的其它任务,以获得恰当的原始数据。
2)文本表示阶段。
在此阶段中,则要将预处理所得的文本描述成计算机可以理解的形式,该阶段的任务一般包括特征降维、建立特征空间、特征权重表示。
3)聚类处理阶段。
把经过文本表示阶段所得的文本根据它们的相似度关系来进行聚类分析。
文本聚类的具体过程如图2-2所示。
图2-2文本聚类具体过程
2.3.3文本聚类的主要应用
文本聚类技术可以将大量的文本聚合成少数有意义的簇,并提供导航、摘要等机制,其主要应用包括:
1)信息的过滤和推荐。
随着Web2.0时代的到来,人们每天被互联网上浩如烟海的信息资源所轰炸。
为了解决“信息爆炸而知识贫乏”这个问题,利用文本聚类技术对用户感兴趣的文档聚类,可以发现用户的兴趣模式,从而可以主动为用户提供精准且称心遂意的信息推荐服务。
2)实现自动文摘。
虽然每天都会产生浩如烟海的信息,但是一个人不能通过阅读所有的资料来找到自己所需要的信息,如果可以对文本进行自动摘要可以让用户不用看全文就可以快速的掌握文本的主要内容,进而减少他们浏览相关文本所需的时间。
文本聚类可以作为自动摘要等应用的预处理步骤,例如哥伦比亚大学开发的文摘系统Newsblaster将每天发生的重大新闻文本进行文本聚类,并对同一主题的文档进行去除重复的内容、信息融合等处理,最终生成简明扼要的摘要文档。
3)改进搜索引擎结果。
用户在浏览器中输入检索关键词后,系统先把根据关键词搜索到的文档进行聚类处理,并简明描述聚类处理得到的各个类别,从而缩小了用户检索的范围,帮助用户迅速定位到所需的信息。
4)热点识别与追踪。
把大量的新闻网页进行聚类,这样可以识别出一段时间内的新闻热点,进而对该新闻热点进行后续追踪。
2.4文本表示模型
在自然语言处理和信息检索等领域,人们提出了布尔模型、向量空间模型、概率模型、统计主题模型、概念模型等多种文本表示模型[29]。
1)布尔模型。
这是最简单的信息检索模型,它使用二元逻辑进行严格匹配,即用1和0这两种状态显示特征值的比较结果。
它们分别表示特征项出现在文本中和不出现在文本中。
由此可见,虽然布尔模型具有清楚的表达形式且易于实现,但是不够精确,该模型是将所有的特征项同等对待,如果只关心特征项是否在文本中出现,这样是无法体现特征项对一个文本的重要程度。
2)向量空间模型(VectorSpaceModel,VSM)[30],是由现代信息检索的奠基人GerardSalton提出的,是当前自然语言处理中非常普遍使用的一种文本表示模型,该模型是利用向量之间的相似度来表达文本的相似度。
VSM文本用一组特征项及其在文本中的权重组成的向量表示文本,而把向量空间中的一维表示每一个特征项,那么一个文本就成了向量空间中的一个向量。
其表达形式为:
Di=Di(Wi1,Wi2,…,Win),其中Wij表示文本Di的第j维的权重。
文本的向量表示如图2-3所示。
图2-3文本的向量表示
3)概率模型[31],是信息检索领域中的一种比较成熟的模型。
其基本思想是:
利用贝叶斯概率原理计算检条件与文本相关和不相关的概率来解决检索条件与文本相似度衡量的问题,并根据此概率对结果文本进行排序。
概率模型是先把文本集合分为内容相关文本集合R和不相关文本集,对于给定检索条件q,以d=(x1,x2,…,xn)表示文本d,n为特征项的个数,如果特征项i在文本中出现,则xi=1,否则xi=0。
那么文本d与检索条件q的相似度计算为:
其中,表示相关文本中出现特征项xi的概率;表示不相关文本中出现特征项xi的概率。
4)主题模型是近年来被提出的文本表示模型,如今被人们广泛应用于自然语言处理和机器学习等领域。
它是一种针对隐含主题的文本的建模方法。
通过大量的训练,我们从庞大的文本集中提取出可以人们可以理解的隐含语义结构或主题。
Hofmann于1999年提出了概率潜在语义索引[32],该模型试图寻找一个从特征词空间到隐含主题空间的变换,是一个真正意义上的主题模型[33]。
在Hofmann提出的概率潜在语义索引的基础之上,目前最常见的主题模型是Blei等人于2003年提出了潜在狄利克雷分布。
5)基于概念的文本表示模型是将文本中的词语用该词语在概念词典(如WordNet、HowNet)中对应的概念来代替,建立文本的概念向量空间,从而体现出文本的语义信息[34]。
在基于概念的文本表示模型中,词与词之间的相似度,不是根据词形的相似度来进行匹配,而是由词语对应的概念之间的相似度来匹配,这样在很大程度上解决了同义词与多义词的问题。
2.5本章小结
本章主要介绍微博相关理论技术,首
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 话题 研究