Github项目

DXY-COVID-19-Data:2019新型冠状病毒疫情时间序列数据仓库

本项目是关于2019新型冠状病毒疫情状况的时间序列数据仓库,数据源于丁香园。因高校师生科研需求而创建,推送csv文件方便数据使用。数据由爬虫获取,每天0点更新数据至Release。不...

标签:

【Github】项目名:DXY – COVID – 19 – Data:2019新型冠状病毒疫情时间序列数据仓库

项目简介

本项目是2019新型冠状病毒(COVID – 19/2019 – nCoV)疫情状况的时间序列数据仓库,数据来源为丁香园。因高校师生做科研时不熟悉API使用和JSON数据处理,所以创建此仓库,直接推送大部分统计软件可直接打开的csv文件。数据由2019新型冠状病毒疫情实时爬虫获得,每天0点程序准时执行并将数据推送至Release中。

项目数据的特殊情况

部分数据存在重复统计情况,如河南省部分市级数据存在特定的重复计算情况。还存在数据异常情况,浙江省/湖北省部分时间序列数据存在异常,可能是丁香园数据为人工录入导致,例如浙江省治愈人数曾出现错误数据,吉林省长春市和吉林市的确诊人数也曾有颠倒情况。项目爬虫仅获取和储存丁香园公开数据,不处理异常值,若用于科研请自行清洗数据,同时可在Issue中反馈异常数据。

相关项目推荐

如果希望使用R语言对数据进行分析,可以参考pzhaonet/ncovr项目;还有jianxu305/nCov2019_analysis、lyupin/Visualize – DXY – 2019 – nCov – Data、Avens666/COVID – 19 – 2019 – nCoV – Infection – Data – cleaning等项目可供参考其功能。

项目总结

这个项目为研究新冠疫情数据提供了一定的便利,但也存在一些数据方面的问题需要使用者注意。希望大家对这个项目有什么想法或者见解可以在评论区留言讨论。

项目地址

GitHub链接直达

数据统计

数据评估

DXY-COVID-19-Data:2019新型冠状病毒疫情时间序列数据仓库浏览人数已经达到5,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据为准,更多网站价值评估因素如:DXY-COVID-19-Data:2019新型冠状病毒疫情时间序列数据仓库的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找DXY-COVID-19-Data:2019新型冠状病毒疫情时间序列数据仓库的站长进行洽谈提供。如该站的IP、PV、跳出率等!

关于DXY-COVID-19-Data:2019新型冠状病毒疫情时间序列数据仓库特别声明

本站链氪巴士提供的DXY-COVID-19-Data:2019新型冠状病毒疫情时间序列数据仓库都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由链氪巴士实际控制,在2024年12月6日 上午12:00收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,链氪巴士不承担任何责任。

相关导航

暂无评论

暂无评论...