关闭菜单 参考资料…… William & 玛丽
w m菜单 关闭 William & 玛丽

全球行政数据库:准确的、开源的次国家边界指南

new-geo-475.jpg
仅供专业人士使用: geoBoundaries团队是组成geoLab的四个团队之一。geoLab是由Dan Runfola指导的一组学生驱动的数据科学项目。他们的全球行政数据库是一个地方边界的开源汇编。屏幕截图

分析师和研究人员提出的问题需要更好地处理世界上的“地点”。

谁可以在选举中投票?哪里的疾病发病率增长最快?哪些学区正在改善?落后了?

如果你想回答这些问题中的任何一个,你需要对次国家边界有一个精确的理解——那些将州、省和县分开的边界。

而获得这种理解并不总是那么容易,甚至不可能。直到现在。

Dan Runfola说,目前还没有准确的、公开的、开源的世界各州、省和县的数据库。这种情况即使在繁荣的国家也存在。

“如果你想知道沙特阿拉伯各省的确切位置,可能需要几个月或几年的时间才能弄清楚,正如我们刚刚意识到的那样,”Runfola说。“也就是说,除非你有钱从营利性公司购买数据。”

Runfola是威廉玛丽大学应用科学系的助理教授。他是一个小组的成员,该小组刚刚在《公共科学图书馆·综合》杂志上发表了一篇论文,宣布建立goBoundaries全球管理数据库。它是在线的,免费的,而且地理边界团队说它是开放的——也就是说,每个使用许可都被选择得尽可能宽松。

但是地理边界全球管理数据库并不适合所有人。地理边界数据库不是你在表妹布里吉德(Brigid)的婚礼上打开手机来解决叔叔Seán和你母亲之间关于祖屋是在基尔代尔郡(County Kildare)还是在边境另一边的米斯(Meath)的争论的那种东西。

“这主要是针对分析师和研究人员,”Runfola解释说。“这款产品不是为那些没有受过训练的人设计的,他们想要看地图(尽管你可以在网站上看地图!)我们发布了geojson和shapefiles,它们是描绘地理空间的行业标准。”

该数据库是一个主要由威廉玛丽学院本科生和近期校友组成的团队三年工作的成果。PLOS ONE论文的共同作者在创建地理边界产品中承担了广泛的角色。20岁的Joshua Panganiban, 19岁的Lauren Hobbs和17岁的Leigh Seitz都担任团队领导,为团队成员提供指导和领导。

团队中的学生花了数千个小时画出界定地理边界的线条,并与世界各地的政府接触,以获得使用现有产品的许可。学生撰稿人包括奥斯汀·安德森(21年)、希瑟·拜尔(20年)、马特·克里滕登(21年)、伊丽莎白·道克(20年)、赛斯·古德曼(21年)、格蕾丝·格里姆斯利(19年)、劳伦·Hobbs(19年)、雷切尔·莱科(19年)、格雷厄姆·梅尔维尔(19年)、曼迪·穆德(21年)、雷切尔·奥伯曼(19年)、安德鲁·派克(21年)、汉娜·斯莱文(21年)和丽贝卡·扬格曼(19年)。

合著者西尔维娅·谢伊(Sylvia Shea)和悉尼·福瑞格(Sydney Fuhrig)将在下一学年担任领导角色,继续更新地理边界产品。

geoBoundaries团队是组成geoLab的四个团队之一。geoLab是由Runfola指导的一组学生驱动的数据科学项目。其他团队是geoData、geoarsing和geoDev。

Runfola说,政府机构——从国务院到情报界——以及学术研究人员和非政府组织都对地理边界项目表示了兴趣。

“我们目前正在与一家致力于环境可持续性的大型非政府组织进行讨论,”Runfola说。“他们会问这样的问题:世界各地不同国家的森林砍伐率是多少?为了回答这个问题,你必须知道国家的边界。”

有这类问题的个人和机构越来越多地从地理边界小组创建和维护的数据库中获得答案。Runfola补充说,地理边界数据库尤其重要,因为越来越多的资源分配决策被迫在次国家一级做出。

“让我给你一个真实的例子,”Runfola说。“比方说,你想为学校拨款。你知道有学区,但是没有学区在哪里的信息。除非你知道这些地区在哪里,否则世界上所有关于个别地区做得如何的信息都无关紧要。没有地区数据,你就不知道哪些学校需要帮助。你必须有更细粒度的地区级信息,才能做最有意义的事情。”

他说,对更细粒度数据的需求是全球性的。他补充说,在最需要信息的国家——缺乏收集和维护其内部边界的基础设施的国家,收集这些数据的挑战变得更加严峻。

乔舒亚·潘加尼班(Joshua Panganiban)在地理边界小组工作了三年,他举了一个例子,说明了在世界各地以不同的方式体现准确、精细的边界信息的必要性。他说,一些国家的地方政府结构和传统需要比其他国家更精细的信息。

他说:“例如,在菲律宾,国家政府可能会通过政策并给出预算,但真正在地方层面上做出实时决策的人是村。”

Panganiban解释说,barangays是这个国家最小的政治单位,在邦、省甚至直辖市之下运作。

“政策制定者或非政府组织希望确定哪些村庄可能是最贫穷的。哪一个需要更多的检测工具。哪个国家需要更多的教育资金。”“他们有时不知道这些村庄的确切位置。这是我们能够对所有这些次国家边界做的事情-为那些研究人员和政策制定者提供一个非常小的单位在哪里的理解。”

Runfola解释说,地理边界数据库的好处不在于定义法律边界本身:“边界就是它们,”他说。“我们所做的就是把它们放在一起,这样任何医生都能获得这些信息。”

但是精确是地理边界小组非常关心的问题,Runfola说,次国家边界的编译者必须权衡文件的大小和准确性。

“一些组织已经决定使他们的文件相对较小,以便更多的人可以使用它们。你可以用它们来进行网页渲染或其他各种各样的事情。”“对于我们的数据,我们保持了极高的精确度,但这样做的代价是,除了分析之外,它更难用于其他目的。”

但是,他补充说,为分析人员提供精确、开放的数据一直是geoBoundaries团队的目标。“开放数据带来了广泛的机会——从促进研究复制到确保任何人都能以有意义的方式公开分享信息。”