大数据应用在商业市场往往被广泛关注,近几年更是蜂拥而入,毕竟是个“赚钱的生意”,人人都想要的香饽饽。而不赚钱却有价值的大数据领域,也有一群人在默默研究,天文大数据就属于这个范畴。
12月11日,由中关村大数据产业联盟、北京大数据研究院主办的第七届中关村大数据日——“大数据应用与治理”主题高峰会议在中关村国家自主创新示范区会议中心举行。本文内容由雷锋网(公众号:雷锋网)整理自中国科学院国家天文台研究员崔辰州的演讲——《天文大数据研究动态》,天文学不仅仅是你我看到的宇宙星辰,还有这些大数据研究人员背后的情怀与坚持。雷锋网做了不改变原意的编辑整理,将内容分享在这里,希望对你有所启发。
以下是崔辰州主任演讲全文整理:
天文学跟赚钱没有太大关系,跟国际形势也没有太大关系,更多的是一个情怀。我用十分钟的时间让大家放松一下,分享天文学给大家带来的乐趣。
我先用一个大家比较熟悉的一个画面来开场,大家都知道这是什么吧?(下图)
不错,这就是我们国家天文台的南仁东研究员团队,花了20多年时间,铸造的「中国天眼」,就是FAST。2016年落成的时候,习总书记专门发来了贺电。这张照片是我自己拍的。
中国天眼目前还在调试阶段。但在去年我们就发现了第一颗脉冲星,在今年早些时候FAST又发现了第一颗高能毫秒脉冲星,为下一步引力波的探测提供了条件。未来几年我们首先要开展叫做「19波束多科学目标同时巡天项目」,这个项目将发现一千颗左右脉冲星,对数十万星系进行研究 。
「中国天眼」也会带来大数据,每天的数据量就达到近150TB。
除了中国天眼,还有一个大家不太熟悉的项目,叫做「郭守敬望远镜」。
这个望远镜是2008年落成的,是现在全世界光谱寻天效率最高的望远镜,它已经观测了901万条光谱,是世界上最大的天体光谱库。利用郭守敬望远镜的数据,现在已经发表了300多篇高水平论文,在给银河系重新画像等方面产生了一批科学成果。比如以前人类认为银河系只有5万光年大小,而现在通过研究、利用LAMOST的数据把银河系的大小扩大了一倍——银河有10万光年的半径。
同时,国际上的天文学家们也在做很多事。比如说这个「大口径全天巡视望远镜」。
它的镜子不算太大,只有7米,这是一群人围绕望远镜玻璃主镜拍的一张合影。它厉害的地方在于,配备有一个32亿像素的相机,上图右边这位女士拿着的拼接相机,可以说是底片,它有半人多高。通过望远镜在三个晚上就把能看到的天区看一遍,每晚就会产生25TB的数据量。这个望远镜能带来从“宇宙画廊”到“宇宙影院”的转变,把静态的宇宙变成动态的宇宙,让我们能够近乎实时看到宇宙的变化,给天文学带来跨时代的进步。
下一个与大家分享的项目叫做「一平方千米天线阵」。
它由两大部分组成,其中一部分天线在南部非洲8个国家部署,另一端在西澳大利亚及新西兰由100多万天线构成。整个天线可以进行数据采集,在全球区域中心进行深入分析。这个望远镜能带来什么?它的原始数据每天可以达到5千个PB,处理之后会达到50个PB左右,进一步处理则可以变成数据产品供科学家使用。
在国内除了有中国天眼,我们在天上还有「悟空」还有「慧眼」,国家天文台的同事们正随着「雪龙号」船在建设南极天文台,国际同仁除了刚才介绍的两个望远镜项目外也还在做更多的事情。这些天文学背后的英雄们给我们带来的就是数据。大数据正推动着天文学的发展,让人类对宇宙的认识逐渐加深。
为了给天文学家提供良好的基础设施,中国正在打造「中国天文数据中心」,除了把国内数据收集在一起,还把国外的数据汇总起来,共同为天文学研究提供服务。「中国天文数据中心」通过了世界数据系统的权威认证,这在亚洲是第一个。
再给大家开拓下思路,现在天文学研究都在研究哪些事?
这里有一个很好的总结:一黑两暗三起源。
「一黑」就是黑洞,「两暗」是暗物质和暗能量。三起源是什么呢?是宇宙的起源,天体的起源还有生命的起源。这都是我们的终极问题。当然现在一个都没有彻底解决。
天文学的发展受制于技术能力,以前通过光学通过眼来观察,现在我们除了电磁波段还拓展到了引力波、中微子等手段,因此我们进入到了多信使的天文学时代。
我们对地外文明和生命的探索也一直都在进行。
为了充分发挥大数据的作用,20年前,天文学家和很多业界的朋友共同提出了一个叫做「虚拟天文台」的设想。
「虚拟天文台」是通过先进的信息技术将全球范围内的研究资源无缝透明连接在一起形成的数据密集型网络化天文研究与科普教育平台。
简单介绍一下虚拟天文台的工作模式。
除了前面介绍的望远镜产生的天文大数据,天文学家开展科学研究所需要的计算资源、软件环境等都是研究资源。天文学家还有他们的电脑、手机都要消费这些资源。而我们为了让全世界的天文学家能够更方便地利用这些资源,让他们知道有哪些资源存在,同时把资源送到他们的手边,送到他们的程序里去,这就是「虚拟天文台」要做的事情。
从技术层面上有很多工作要做,比如在语义层面、在数据格式层面、在数据传输层面、在注册机制层面等等。这就是「虚拟天文台」要实现的目标。
为了推动「虚拟天文台」在全世界的发展,2002年「国际虚拟天文台联盟」成立了。我们可以看到这一个全世界地图,这个地图就是有「虚拟天文台」研究项目的国家在地理上的分布。在大数据的时代,「虚拟天文台」会作为一个基础设施为全世界的天文学家提供服务。
「中国虚拟天文台」也是在2002年提出的。我们现在已经有了这样一个门户,也有了这样一个体系,我们通过望远镜时间的申请、大数据和云环境的提供,正在向全世界不同国家的用户提供服务,发挥着它的作用。
从2016年开始,国家天文台和阿里云结成了战略合作伙伴,我们利用公有云基础设施把「虚拟天文台」打造成具备全球服务能力的资源型服务平台。
当然,天文大数据除了让天文学家去探索宇宙奥秘,同样可以为我们的孩子、为我们的年轻人、为我们学校的学生提供更多的服务。因为天文大数据不单是天文研究资源,也是科普教育资源。我们在全球率先提出了“数据驱动的天文科普教育”理念。我们中国在这个领域有非常棒的表现。
2015年,虚拟天文台和新疆乌鲁木齐一中的一位高中老师合作,打造了一个搜寻超新星的项目。有一个10岁合肥小朋友利用这个平台发现了超新星,成为全球最年轻的超新星发现者。
天文大数据在科研、科普中要发挥作用离不开产业界朋友的助力。
比如:阿里云给我们提供基础的设施和服务;天文学家和微软的合作已经持续十年以上,我们共同打造了万维望远镜的教育平台;华为跟我们合作SKA(即「一平方公里天线阵」)项目,助力天文学家探索天文大数据;努比亚和国家天文台签订奖学金项目等等。
虚拟天文台的天文信息学社区,也得到了更多的合作伙伴的大力支持。天文学的发展离不开产业界的合作和支持。借此机会,我也欢迎更多产业界的朋友一起来推动我们的天文情怀,有一种征程叫星辰大海,希望有情怀的企业家一起来探讨宇宙的奥秘。(完)
雷锋网版权文章,未经授权禁止转载。详情见。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/92346.html