1. 研究目的与意义
随着移动设备的普及应用,人们花在手机上的时间也越来越多,特别是短视频App和短视频网站的风靡,让人们的手机在网时间逐渐增加,并占据了部分人们大部分的日常以及工作时间。
可以预见的是,人们对于短视频之类App或者网站的依赖性也会越来越强。
对于企业来说,该类网站和App的数据也是理解用户行为,判断企业决策的重要依据。
2. 课题关键问题和重难点
1、关键问题(1)使用python语言对www.bilibili.com 上视频数据爬取,采用ES进行数据存储(2)Uiautomator2移动端抓取框架,Elasticsearch实现海量数据存储(3)Kibana数据可视化组件,Kibana图表,基本图形,data图表,map图表,时序分析工具Timelion,使用Dashboard功能整合图表2、课题难点(1)Uiautomator2(u2)自动化抓取,u2连接移动设备,weditor控件可视化工具的使用。
Uiselectoxpath定位app控件,atx-server2多设备管理,Mitmproxy与Python交互(2)Elasticsearch数据存储,合理的数据库设计,尽量合理地减少数据库数据的冗余,占用更少存储空间,实现ES海量数据存储(3)实时可视化爬取视频数据信息,可视化界面布局美观以及视频数据清晰易见,方便使用者更加直观的和简洁的对数据进行分析。
(4)数据爬取和可视化界面显示尽可能快捷(5)根据可视化结果推荐视频类型
3. 国内外研究现状(文献综述)
1.国内外研究现状近年来随着短视频市场的繁荣,视频分析成为一个热点研究课题,其中的数据分析 及可视化受到广泛关注. 用户的选择趋势分析可以通过 用户对于不同短视频类型的喜爱分析让短视频公司了解到用户的喜好,有利于事业的发展. 数据可视化是将数据以不同形式展现在不同系统中,其中包括属性和变量的单位信息。
国外的可视化研究系统已经接近成熟。
像Wanner和其他人共同设计了可视化系统 ForAVis。
4. 研究方案
1.该方案实现通过python对与哔哩哔哩视频数据进行爬取,存储在DB中,从而对所获取视频数据进行可视化和分析的研究 2.Uiautomator2移动端自动化抓取框架,weditor控件进行可视化,Uiselectoxpath进行定位App控件。
3.es索引进行DB数据增删4.Kibana图表进行可视化显示,Dashboard功能整合图表。
5. 工作计划
第1周:学生撰写开题报告和完成外文翻译。
第2周:指导学生进行课题总体规划和课题的详细设计。
第3-5周:指导学生进行课题模块化设计并进行模块代码编写与调试。
