1、基于Python的手机舆情系统设计与实现摘要系统主要就是针对手机行业文章进行抓取并分析统计,根据用户定义关键词在数据库中全文搜索匹配相应文章,然后给用户进行展示,为用户提供便利。系统利用Python urllib对权威手机资讯网站进行网页抓取,然后用Python re包和正则表达式在网页中匹配到相关数据,再用Python w3lib.html去掉页面中臃肿的html标签。进行网页提纯,并利用MySQL进行存储。系统后台运用Python flask进行开发实现,前端则运用html、css、javascript、jquery进行开发并实现简单的页面交互。利用Python和Sublim工具对系统的页
2、面和服务器进程编程和部署,系统主要是服务器端入手建立基本的前后调一体化流程。系统主要有自定义频道、自定义栏目(同时设置栏目关键词)、查看更多等功能,用户在栏目中查看根据关键词匹配到的文章列表。关键词:舆情手机资讯The Design And Implementation Of Mobile Public Opinion System Based On PythonAbstractSystem is mainly aimed at the mobile phone industry articles to grab and analysis of statistics, based on use
3、r-defined keywords full-text search matching corresponding articles in the database, and then to users to display, provide convenience for the user.System USES Python urllib cell phone information to web sites for authority to grab, and then use Python re package and regular expression matching to t
4、he relevant data in the web page, then use Python w3lib. The bloated HTML tags in HTML to remove page for web data refinement, and deposited in the MySQL database for storage.Systems use Python flask framework for development background, front end uses HTML, CSS, javascript, jquery interaction to de
5、velop and implement a simple page.Using Python and Sublim tools page on the system and the server process programming and deployment, before and after the system is mainly the server side of the basic integration process.Channel system mainly include custom, custom columns (at the same time set up k
6、eywords), read more, and other functions, users in the section view based on keyword matching to the list of articles.Key words: Public opinionPhone informationII目录前言1第1章课题研究背景与价值2第1.1节 选题的意义与价值2第1.2节 研究综述3第1.3节 课题的研究意义与目的3第1.4节 研究范围与内容4第2章手机舆情系统技术的概况7第2.1节 系统开发环境7第2.2节 系统开发技术8第3章 系统数据采集与存储10第3.1节 系
7、统数据的采集10第3.2节 系统数据的存储11第4章 系统功能设计与实现16第4.1节 用户登录16第4.2节 自定义频道18第4.3节 自定义栏目20第4.4节 爬虫设计与实现24第4.5节 系统数据库结构24第5章 系统测试27第5.1节 系统测试目的与意义27第5.2节 测试过程27第5.3节 其他错误29结论32附录34参考文献35致谢37IV前言伴随着计算机技术,通信技术的发展,网络的规模也越来越大,互联网多元素也随之不断的添加。随着互联网的快速发展,网络已经是成为了一种新的信息传播形式,已经潜移默化的影响着人们的日常生活。网友活跃言论已经达到超前卫的程度,不论是国内大事件还是国外新
8、鲜事件,都能马上参与进来发表言论,通过网络来表述论点、言论思想,从而产生非常大的舆论压力,达到任何单位都没有办法忽略的地步。那么网络舆情早已经悄悄的进入到了我们的生活。用来调侃那些每天都抱着手机过日子的人们段子在网上为数不少,这正成为许多人的真实写照。目前手机基本上已经离不开人们的生活了,手机可以能让一个人的生活变得“充实”而不单调。随着手机越来越智能化,功能也越来越多元化,在生活上也给予我们带来了极大的便利,手机正在成为大多数人生活中“接触最频繁的人”。在这里不过多评价对于手机改变了我们生活的利与弊。我们主要想说的是,既然我们队与手机如此的依赖。那对于我们购买手机的要求条件越来越苛刻。不仅是
9、对它打电话、发短信等的基本功能的要求,还要通过品牌、配置、性价比等综合因素考虑。于是我们花费大量的时间在网上搜索关于手机的各种配置信息、用户评论、性能分析等等。尽管我们花费了大量的时间来搜集相关信息,然而大多数的情况,我们还是找不到我们真正需求的内容来供我们进行参考。然而这个平台就是为你量身定做,我们在各大购物网站来搜集手机销量做统计,在各大手机权威平台网站做最新资讯的采集。从而精确、条理的展现在你的面前,进而解决我们最初的需求。人工智能就是大量数据的采集与分析从而的得到的产物。我们也应该追寻时代的脚步来满足我们的需求。第1章课题研究背景与价值第1.1节选题的意义与价值1.1.1 理论价值与意
10、义现如今,何事物都必须用数据来说话。面对互联网上海量的数据信息,我们呢难以想象通过人工来挑取其中对我们有用的数据。那问题就来了,结合网络信息采集技术和信息文本处理等技术研发一个用户有用的舆情系统是有必要的,它将我们帮助我们在互联网大量数据中。快速的筛选出对自己有利的信息进行分析。它将免去我们面对互联网海量数据的困扰。伴随着互联网信息时代的来到,我们通过在互联网进行数据的采编与处理,可以准确过滤掉对自己没有用的垃圾信息,并通过我们对各大购物网站的信息采集,来判断行业的趋势,免去我们在铺天盖地的大数据中迷失方向。我们可以及时的搜集到准确有用的信息,把我们的时间消损失降到最低。1.1.2 实践价值与
11、意义互联网先如今已经发展成为当今世界上最大的信息库,中国网民人数,全球规模第一。互联网是网民最快最新发布与获取信息的渠道之一,越来越多的信息都是通过互联网散发的,对于其影响力不容小视。根据中国互联网络信息中心(CNNIC)的统计,中国网民规模达到5.13亿,互联网普及率攀升至43.3%,其中20岁以上网民占80%。随着网络在全球范围的快速发展,网络媒体已逐步被公众认可。关于手机,中新社上海2月19日某知名信息技术顾问和研究公司19日发布报告称,2015年全球智能手机销量达14亿部,较2014年增长超过14%。看到如此高的成交量,难道这是巧合。有供求关系才可能达到那么高的交易量,从而那并不是巧合
12、现在手机行业迅速发展,竞争激烈。对于我们来说也是一个好消息,有竞争才能够让用户的到更多的实惠,那么面对这么多的手机厂商的产品,那我们应该如何面对与抉择呢。据不完全统计,消费者在购买手机前的信息搜集来源:40%信息来着亲朋好友,25%信息来源于实体店体验,45%信息来源于电视广告、网络。可见网络信息也是同样影响消费者选择产品的重要力量。所以每天都有海量的文章每天在互联网上传播,时刻影响着消费者的选择结果。那么做一个针对专一行业的舆情系统是很有必要的11。第1.2节研究综述1.2.1 国内研究根据舆情分析发展来说,国外研究比较早。自19世纪中期初级发展,到20世纪中期已经逐渐成熟。我国舆情研究主
13、要起步于20世纪末,到党的十六届四中全会后,舆情研究与实践迎来高潮。虽然我国舆情研究落后于外国,但我们不怕落后,奋起直追国内的舆情研究也渐渐向世界最前沿靠拢。我国在研究方面,主要是根据政府的舆情信息进展的,研究层次相对于外国来说,深度达不到。就个人观点来看,现在国内舆情的研究存还存在许多的缺口。比如现在国内对于舆情研究主要服务于政府和少数的企业。研究和实践范围太过于单一,然而我认为应该应用于多方面,才能真正的对舆情研究达到一个新的高度。对于服务人群来说,应该每个人都有享受服务的权利。1.2.1 国外研究国外的舆情研究主要是民意调查以及媒体舆论相关方面的,尤其是研究关于民意调查,国外已经对民意调
14、查形成了一个相对完整的理论,并且有一个完成正的应用体系。另外,国内外文化差异和社会形态影响。国内的舆情开展主要是服务于政府,而国外与国内不同,国外则除了服务政府之后还涉及社会经济、社会文化。就个人观点来看,国外的舆情研究比国内研究起步就早,国外的舆情研究多元化,是舆情研究发展的好现象。第1.3节课题的研究意义与目的1.3.1 理论意义正如上文提到,网络信息已经是消费者选择手机产品的有力影响力之一。那将会花掉我们大量的时间去网上查资料,并花大量的时间来阅读,然到最后发现并没有找到我们想要找的信息。然而最大的痛苦莫过于此,我们花费了时间,花费了精力,还没有得到自己想要的数据或者文章。这也是互联网海
15、量数据带来的困扰。面对互联网上海量的数据信息,我们难以想象通过人工来挑取其中对我们有用的数据。那问题就来了,结合网络信息采集技术和信息文本处理等技术研发一个用户有用的舆情系统是有必要的,它将我们帮助我们在互联网大量数据中快速的筛选出对自己有利的信息进行分析。它也将免去我们面对互联网海量数据的困扰。从而改变我们对互联网大数据时代的进一步了解并利用。1.3.2 实践意义那么对于消费者来说有价值的数据就是购买力,那么什么叫有价值的数据呢。首先,你要保证真实性,任何不真实的数据都是在欺骗消费者;然后还要保证时效性。所以一定要保证数据的真实时效性。通过在互联网进行数据的采编与处理,可以准确过滤掉对自己没有用的垃圾信息,并通过我们对各大购物网站的信息采集,来判断行业的趋势,免去我们在铺天盖地的大数据中迷失方向。我们可以及时的搜集到准确有用的信息,把我们的时间消损失降到最低。国内关于,互联网信息采集技术已经愈发的成熟。实现关于手机舆情系统的信息抓取已经没有问题,再加上处理信息的技术逻辑比较简单,技术上的完全可以实现。现在国内的舆情报告大多数则是针对企业用户而设计的,完全针对个人用户的寥寥无几,所以这种针对个人用户和专一行业的舆