本期推送为大家带来的是由武大城市化研究室本科生小分队依托空间分析课程,自主开发完成的新闻地图系统——图讯 News Map,该系统先后获得全国大学生计算机设计大赛一等奖、高校GIS论坛创新创业大赛一等奖。这么优秀的系统,小编已经迫不及待地想使用起来了!
假如你是一位母亲,孩子在外地上大学,你很关心孩子的健康安全,却总是找不到专门的渠道来获取孩子所在地周边的新闻实事儿;
假如你是一位新闻编辑,常年奔波在海量的新闻资讯中,却苦于没有专门的平台对这些新闻进行专业分类和深度分析;
假如你是一位政府决策人员,你非常希望能通过目标区域的新闻舆情分析,快速把握民众的情感倾向,然而少有平台能从新闻中深度挖掘社会的“热点”和“痛点”。
在现在这样一个大数据时代,新闻资讯作为获取信息的有效途径,存在信息冗杂、分类不清、表达不直观等问题。地图,作为一类重要的信息载体,在信息展示方面具有直观、多维的特点。调查表明,目前市面上少有新闻地图结合产品,且大多并未形成时空上的多维呈现,缺少关联性,因而无法满足人们对于个性化新闻推荐、新闻分析等信息的需求。
由此,“图讯News Map”应运而生。作为一款以地图为导向的时空新闻交互网页应用,它以权威新闻网为数据源,旨在基于地图对不同时段的新闻进行可视化展示,并提供多样化的新闻数据分析服务。不管您是普通用户,还是新闻专业人士,都能从中得到多维度、个性化的新闻资讯服务。
该系统将地理时空大数据、人工智能、爬虫等技术与GIS充分结合,实现新闻数据的空间分析与统计,以便更好地服务目标群体。
图讯共有四大设计亮点。首先奇异果APP官方网站,它能够反映新闻的时空特征,使传统地图成为一个媒体入口,不再只满足于简单的导航需求,而是可以将每一个具有地方属性的资讯内容直接呈现于其上;其次,它具备强大的个性化定制推荐功能,能根据用户浏览记录以及兴趣管理进行用户分析,从而实现信息精准推送,高效实现供需匹配及活动与受众的匹配。
与此同时,图讯还具备强大的数据分析功能,它运用丰富的图表、网络实现了对地图的深度分析,并提供可视化分析结果,因而改变了新闻“以文为主,图片为辅”的传统模式。分析结果的呈现方式多样,包括饼状图、折线图、直方图、聚类图等。
目标用户主要分为三种类型,分别是普通群众、新闻工作者以及政府部门新闻资讯。各类型目标用户特征介绍如下:
普通群众:适用于习惯利用新闻渠道获取信息,对信息多维呈现需求较大的普通群众。他们可以直观地了解到新闻发生的地理位置及其分布,也可以基于兴趣区域或兴趣主题进行信息筛选和查询,有助于拓宽新闻传播视野,而个性化的精准新闻推送也有助于用户高效获取有用信息。
新闻工作者:权威新闻网的新闻工作者可直接通过本网站进行新闻发布与编辑,随时获取用户反馈并进行内容调整奇异果APP官方网站、运营方向调整,也可以通过数据分析增加对区域内新闻的整体认知。
政府部门:政府部门能从新闻时空信息角度了解新闻内容,并通过时空热点分析、情感分析、舆情导向功能,迅速把握目标区域内大事件以及民众情感倾向,从而及时采取相关措施。
在系统架构方面,图讯总体上可分为表现层、逻辑层、数据访问层共3层,主要涉及五大关键技术,分别对应数据获取、自然语言处理、数据可视化、时空数据空间分析以及空间统计新闻资讯。
为了完成新闻源的调度、爬取与编码,该平台使用了Scrapy,Celery框架以及BERT模型。根据Scrapy编写了新闻爬虫,并借助Celery,实现了爬虫任务的分布式调度、计划与管理。而通过BERT模型,实现了下游的命名实体识别任务,并配合百度、高德地理编码服务,完成了新闻中地点的地理编码。
在自然语言处理分析与推荐方面,运用TF-IDF、LDA等算法对文本进行向量化,从而实现关键词、主题、相似度等分析。同时,使用传统自然语言处理推荐作为冷启动数据,训练GRU4Rec模型,并将它应用到个性化新闻推荐中。