关闭菜单 参考资料…… William & 玛丽
w m菜单 关闭 William & 玛丽

extremes数学计划瞄准“大数据”

Big-data wranglers
大数据管理员 参与extreme - qed项目的William & 玛丽数学家为(左起)Ferguson数学系教授李志光、数学系助理教授Tanujit Dey、数学系教授石俊平及余葛欣副教授。Shi是nsf资助项目的首席研究员;其他的都是合伙人。图片由真主安拉赫尔曼'15

威廉玛丽的数学家们正在将数据分析推向一个新的极端——他们正在寻找学生加入他们。

数学系从美国国家科学基金会(NSF)获得了88万美元的资助,用于一个名为extremes - qed的新项目。这项为期五年的资助将支持本科生在大型数据集研究中的计算和统计理论和技术研究。

数学教授石俊平是该项目的首席研究员。他的合作伙伴是数学助理教授Tanujit Dey, Ferguson数学教授Li Chi-Kwong和数学副教授Yu Gexin。共有18名教职员工参与了这个项目,他们带来了来自威廉玛丽大学应用科学系、物理系、生物系和弗吉尼亚海洋科学研究所(VIMS)的大数据专业知识。

这个由nsf资助的项目的全称是“极限- qed:大数据集研究中的计算和统计理论与技术”。施说,该项目的跨学科方法将使数学专业的本科生获得跨学科操作数据的经验。在未来五年夏季为期八周的课程中,学生和教师将组成团队,解决一系列“大数据”研究问题。

施解释说,数据密集型和以数据为中心的科学正在下一代美国科学家和工程师的职业生涯中占据主要地位。为本科数学专业的学生提供“大数据”培训,将帮助这些学生为从事科学职业做好准备,并在未来技术发展的过程中成为各自领域的领导者。他补充说,如今收集的数据数量之多,以及处理大数据需要许多不同的研究和商业努力,这使得大数据分析成为雇主们高度追捧的技能。

他说:“在科学、工程、技术和日常生活的几乎每个领域,数字数据的数量都在急剧增加。”“在分析大型数据集的数学和统计工具方面,迫切需要新的创新培训。”

例如,施引用了《哈佛商业评论》的一篇文章,该文章称,互联网每秒传输的数据比20年前整个互联网存储的数据还要多。他解释说,单组数据的计量单位是太字节、拍字节甚至艾字节。他解释说,1拍字节等于100万千兆字节,能够存储2000万个文件柜中的文本。

施教授表示,extreme - qed项目将允许数学专业的本科生扩展和增强他们在计算和数据驱动科学与工程(CDS&E)方面的知识。该项目将把“大数据”引入威廉和玛丽学院的数学课程,如线性代数、统计学、数据分析和概率论,通过在这些课程中引入数据密集型教学模块。

此外,本系还将开设新的课程,包括矩阵与图论、生物信息学和复杂网络等。extremes - qed还将包括一个为期八周的夏季研究会议,将本科生和教师聚集在一起,研究与“大数据”相关的理论和应用科学项目。施说,这个项目的另一个特点是,它还将邀请一两个来自弗吉尼亚州立大学、汉普顿大学或诺福克州立大学的教师和本科生团队参加年度暑期研究项目,他们将与威廉玛丽学院的教师和学生一起研究项目。

数学系特别感兴趣的一个项目是在新生儿重症监护病房的电子数据中寻找预测信号。施解释说,该项目最近获得了大量数据集,包括3000多名婴儿的新生儿重症监护病房监测记录。这些记录被物理学教授约翰·德洛斯(John Delos)领导的一个团队用于“大数据”倡议,以提高新生儿重症监护病房监护仪的性能。Shi解释说,通过这个项目,本科生和教师都将能够为这些独特的数据集创建数学模型,以预测电子信号的各个方面,并挽救早产儿的生命。

施希望该项目能让数学专业的本科生获得计算和数据科学与工程方面的经验,为他们未来在数学和科学领域的研究生学习和职业生涯做好准备。

有兴趣学习大数据的数学学生可以在 本网站