城市形象媒体监测方法

http://www.sina.com.cn 2010年10月27日 17:59 新浪城市
城市形象媒体监测方法
图1-1 媒体监测系统原理示意图

  城市形象媒体监测系统的基本原理是:依托先进的搜索引擎,覆盖国内互联网全网,对海量新闻报道数据进行实时监测和抽样抓取,并运用多种高性能数据挖掘和人工智能技术对新闻报道进行自动分类和语义评价。并针对各类城市形象,把评价模型植入到了监测评价系统中,这样就可以通过对新闻报道监测产生的客观数据,按预设的模型汇总计算不同的城市形象单项得分和综合得分。监测系统的原理如图1-1所示。

  监测过程中各阶段的技术要点主要有:(1)互联网实时监测的日期:按照全年52周划分监测周期,每周根据随机数字随机产生一天进行监测。(2)监测和处理范围:城市形象媒体监测系统的监测范围是全国县级市以上城市,按照直辖市、省会及计划单列市、地级市、县级市4个级别分别计算得分和排名。由于不同级别的城市新闻曝光量差异较大,考虑数据处理时效性和工作量的平衡要求,采用对直辖市的新闻报道按照5%的抽样比抽样、对省会及计划单列市的新闻报道按10%的抽样比抽样、对地级市及县级市的新闻报道全部抽样的方法设定数据处理范围。事实上,为了验证对新闻报道抽样处理之后城市形象的评价结果和新闻报道全部处理的评价结果是否一致,我们曾针对新浪网2008年前45周的新闻报道分别进行了全部处理和抽样处理以比对,结果发现两种方法的评价结果是非常一致的,因此可以认定抽样处理的结果是准确的。(3)数据的准确性:我们建设了一个60人的高效稳定的编码员团队,对需要分析的新闻报道的自动分类和语义评价情况逐条进行核查和纠错,有效地保证了数据的质量。

发表评论 转发此文至微博
Powered By Google