毕设开题报告及开题报告分析
更新时间:2023-04-07 14:34:01 阅读量: 教育文库 文档下载
.
Word资料开题报告如何写
注意点
1.一、对指导教师下达的课题任务的学习与理解
这部分主要是阐述做本课题的重要意义
2.二、阅读文献资料进行调研的综述
这部分就是对课题相关的研究的综述落脚于本课题解决了那些关键问题
3.三、根据任务书的任务及文件调研结果,初步拟定执行实施的方案(含具体进度计划)
这部分重点写具体实现的技术路线方案的具体实施方法和步骤了,具体进度计划只是附在后面的东西不是重点
.
Word资料邮电大学通达学院毕业设计(论文)开题报告
.
信息。并行爬虫拥有较好的加速比,可以快速抓取数据。
文献[5] 基于信息数据分析的微博研究综述[J];研究微博信息数据的分析,在这类研究中,大多数以微博消息传播的三大构件---微博消息、用户、用户关系为研究对象。以微博消息传播和微博成员组织为主要研究容,目的在于发祥微博中用户、消息传博、热点话题、用户关系网络等的规律。基于微博信息数据分析的研究近年来在国外都取得了很多成果,掌握了微博中的大量特征。该文献从微博消息传播三大构件的角度,对当前基于信息数据分析的微博研究进行系统梳理,提出微博信息传播三大构件的概念,归纳了此类研究的主要研究容及方法。
对于大多用户提出的与主题或领域相关的查询需求,传统的通用搜索引擎往往不能提供令人满意的结果网页。为了克服通用搜索引擎的以上不足,提出了面向主题的聚焦爬虫的研究。文献[6]综述了聚焦爬虫技术的研究。其中介绍并分析了聚焦爬虫中的关键技术:抓取目标定义与描述,网页分析算法和网页分析策略,并根据网络拓扑、网页数据容、用户行为等方面将各种网页分析算法做了分类和比较。聚焦爬虫能够克服通用爬虫的不足之处。
文献[7]首先介绍了网络爬虫工作原理,传统网络爬虫的实现过程,并对网络爬虫中使用的关键技术进行了研究,包括网页搜索策略、URL去重算法、网页分析技术、更新策略等。然后针对微博的特点和Ajax技术的实现方法,指出传统网络爬虫的不足,以及信息抓取的技术难点,深入分析了现有的基于Ajax 的网络爬虫的最新技术——通过模拟浏览器行为,触发JavaScript事件(如click, onmouseover等),解析JavaScript脚本,动态更新网页DOM树,抽取网页中的有效信息。最后,详细论述了面向SNS网络爬虫系统的设计方案,整体构架,以及各功能模块的具体实现。面向微博的网络爬虫系统的实现是以新浪微博作为抓取的目标。结合新浪微博网页的特点,通过模拟用户行为,解析JavaScript,建立DOM树来获取网页动态信息,并按照一定的规则提取出网页中的URL和有效信息,并将有效信息存入数据库。本系统成功的实现了基于Ajax技术的网页信息的提取。
文献[8]引入网页页面分析技术和主题相关性分析技术,解决各大微博相继提供了抓取微博的API,这些API都有访问次数的限制,无法满足获取大量微博数据的要求,同时抓取的数据往往很杂乱的问题。展开基于主题的微博网页爬虫的研究与设计。本文的主要工作有研究分析网页页面分析技术,根据微博页面特点选择微博页面信息获取方法;重点描述基于“剪枝”的广度优先搜索策略的思考以及设计的详细过程,着重解决URL的去重、URL地址集合动态变化等问题;研究分析短文本主题抽取技术以及多关键匹配技术,确定微博主题相关性分析的设计方案;最后设计实现基于主题的微博网页爬虫的原型系统,实时抓取和存储微博数据。本文研究的核心问题是,根据微博数据的特点设计一种基于“剪枝”的广度优先搜索策略,并将其应用到微博爬虫中;同时使用微博页面分析技术使得爬虫不受微博平台API限制,从而让用户尽可能准确地抓取主题相关的微博数据。通过多次反复实验获取原型系统实验结果,将实验结果同基于API微博爬虫和基于网页微博爬虫的抓取效果进行对比分析得出结论:本文提出的爬行策略能够抓取主题相关的微博数据,虽然在效率上有所降低,但在抓取的微博数据具有较好的主题相关性。这实验结果证明本论文研究的实现方案是可行的。
文献[9]阐述了基于ajax的web应用程序的爬虫和用户界面状态改变的动态分析的过程和思路。文献[10]对于全球社交网络Twitter,设计并实现了,一个爬虫系统,从另一个角度阐明了Python在编写
Word资料
.
Word资料
.
Word资料
.
Word资料
.
Word资料
.
Word资料
.
Word资料
正在阅读:
毕设开题报告及开题报告分析04-07
黄冈智能辅导四年级数学上册 体育场一课一练(无答案) 北师大版06-01
传感器介绍05-24
过保前工程遗留问题整改通知函04-23
个人近期对党的认识思想汇报精选范文8篇08-04
2019~2020学年部编版四年级语文上册第一单元表格式教案教学设计 - 图文10-13
扬州市建筑系统中级职称复习题(答案)10-03
古典诗词鉴赏:陈与义《临江仙·夜登小阁忆洛中旧游》赏析01-22
英文商务邀请函范文02-16
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 开题
- 报告
- 分析
- 毕设
- 中小学班主任网络知识竞赛(资料库)
- 《拇指班长》读后感800字.docx
- 时间的脚印 公开课 公开课教案
- CAD底图无法绑定解决办法
- 山东省东营市河口区实验学校七年级上学期期中考试生物试题
- 护理疑难病例讨论记录文本
- 企业能效分析报告提纲完整版
- 组态王命令语言函数手册
- 齐纳二极管 - BDTIC 半导体事业部代理ON 安森美齐纳稳压二极管
- 控制工程基础简答题
- CDO定价初探及我国CDO市场投资机会
- 西安电子科技大学通信与信息系统博士培养方案
- 英语课程总体目标和分级目标.docx
- 如何建设与管理销售网络——培训体系搭建流程模版资料
- 物理高一上册 第三章 相互作用——力单元测试卷 (word版,含解析)
- 最新中国共产党的发展历程
- 初三化学酸碱盐知识点(最全整理版)
- 2022虹口二模数学卷(含解析)
- 2022年电子政务云发展及问题
- 多媒体技术技术应用考试试题文件