科学发现背面所躲藏的常识网络

放大字体  缩小字体 2019-12-10 10:43:49  阅读数:896 作者:责任编辑。陈微竹0371

任何科学开展都源自前人很多的研讨,它们构成了一种“隐形的常识网络”。研讨人员着手将这些网络制作成图,使隐形的常识开展进程更为直观,并为后来者点拨持续前行的方向。

严重发现历来不会凭空出现,在任何一项科学效果背面,发现者的才干与前人在该研讨道路上留下的脚印平等重要。

当然,这也不算什么奇闻……新鲜之处在于,长期以来各种科学发现组成的隐形网络现在可以终究靠一些极端准确的示意图表现出来了,由于在信息时代,获取并剖析很多数据已非难事。这些图为咱们展现了一个新大陆:科学发现背面所躲藏的常识网络

就像冰山的水下部分总算显露水面,常识网络的结构、其掩盖规模、内部织就的各种联络、研讨热门及未开垦范畴被逐个提示,而示意图也代表着新探究和新发现的可能性!

研讨人员、统计学家和图示专家通力合作,期望进一步将这种新式图表运用于各个科学范畴内部,由于科学研讨的简直一切层面都有网络结构,无论是某一发现背面的常识网络,仍是分子生物学中的基因与蛋白质的联络……

方针都相同,即以一种一望而知高度归纳的办法,展现出由数千至数十亿不等、存在相互效果的方针所构成的某个系统的结构和机能。

例如,一个对生物体推陈出新至关重要的蛋白质背面,是一张巨大的DNA和RNA片段的网络,这些片段相互效果,才终究组成该蛋白质。研讨人员将依据收集到的很多数据,经过一些算法确定在该蛋白质构成进程中起效果的基因“组合拳”,得出极端杂乱的图表,其间即躲藏着该蛋白质组成网络的要害特征。

终究的使命便是要把这张网络联络图画出来。

怎样画呢?

“节点和连线的表现办法是最常用的,但超出必定的杂乱程度就无法看清了。”法国国家信息与自动化研讨所 (INRIA) 剖析与视觉化实验室 (Aviz) 研讨主任让-丹尼尔·菲柯特 (Jean-Daniel Fékété) 提示道。

一组相相关的数据可以不同示意图出现 ,要害是要找到可以最明晰地展现该网络特性的办法。

那么该以哪些数据为要点,又怎么出现它们之间的联络呢?

这一挑选取决于研讨自身的方针 (按期待发现与某疾病高度相关的基因)、所需进行的统计剖析 (如节点的连通度、连线的疏密程度等)以及数据转化为视觉言语、让研讨人员一望而知的潜力。

咱们咱们都知道,图示法具有一张肯定的主力——前留意感知 (preattentive perception),即人类视觉系统在图画中毫不费力且毫无过失地瞬间捕捉到一些基本特征的才干。运用这一绝妙特性,有效地出现数据间的相关,便可使看图者的眼睛在敏捷剖析方向、密度、色彩的集合和反差之后,当即发现该系统网络的特色,随即对此进行阐释。

下文将介绍一些近几年最具代表性的网络联络图。触及课题包含基因间的相互效果、常识的组构、科学发现的动态改变等。在研讨人员和数据图示专家的通力合作下,这些杂乱系统的出现得以简化,科学深处躲藏的种种筋络展露无余。

基因和蛋白质的相关图

生物学教材告知咱们,遗传信息从DNA转录到RNA上,RNA从而翻译组成蛋白质。但是实际上这样的一个进程更杂乱一些:DNA转录发生RNA片段,这些片段相连构成嵌合RNA (chimeric RNA),由嵌合RNA组成蛋白质。

因而,蛋白质的真实源头躲藏在RNA片段网络之内,而RNA片段自身又源自基因网络。

数据来历及网络构建:西班牙巴塞罗那大学基因组调控中心绘图:Circos网址:http://tinyurl.com/9gvdt8v

上方圆盘状示意图所出现的正是这一基因的网络:圆盘外围符号了人类22号染色体的一切基因,内部连线则意味着其两头基因组成一个嵌合RNA。

连线越是靠近圆盘的直径,组成嵌合RNA的两个基因相距越远。巴塞罗那基因组调控中心的研讨人员经过对492种蛋白质的编码基因做多元化的剖析,发现其间85%的基因需求相互效果才干组成蛋白质。

而基因之间的衔接也非偶尔 (连线散布密度在圆盘外表是不均匀的),这标明嵌合RNA的发生并非随机,应该遵从必定规则……而这一规则则有待人们去发现。

科学概念地图

天体物理学“小岛”与量子物理学之间的联络十分严密,社会科学“群岛”与信息技术之间的互动十分密布,研讨生命的各学科织成了巨大的花体字……这便是这张科学概念“地图”所显现的一些信息。该“地图”将科学各范畴之间的联络都包括在内,其制作作业可谓豪举!

数据来历:汤森路透网络构建:Kevin BoyackDick Klavans绘图:W. Bradford Paley网址:http://tinyurl.com/9gm2bb2

图中,每一学科范畴均显现为不同色彩,每个节点符号一个概念 (比方“量子物理”范畴里的“玻色-爱因斯坦凝集”),衔接各概念的连线长短则标明这些概念间的亲疏程度。汤森路透 (Thomson Reuters) ——原美国科学信息研讨所 (ISI) ——是一个聚集不计其数科学文献的数据库,研讨人员对其间录入的共约80万篇2003年度宣布的论文进行了剖析,甄选出776个“首要范式”制作成这张地图。

所谓“范式”即在首要学科内屡次触及的的一些重要概念,界说范式的规范便是各文献之间穿插引证的数量。根据其他年份威望科学刊物的相同操作证明,2003年的这张地图牢靠度十分高,由于首要范畴及其相互之间的联络或多或少保持着原样。往后,这张地图会跟着新的科研文章的不断宣布而定时更新。

人类常识地图

“维基百科”构建的常识大厦与学院派常识大厦的差异安在?

数据来历:通用十进制图书分类,维基百科网络构建及绘图:荷兰阿姆斯特丹常识空间实验室网址:http://tinyurl.com/8btklzu

经过上面这幅双球图,咱们得以了解大约。该图展现了两个常识库中各首要范畴的常识储量以及它们相互之间的联络,左半图为“维基百科”勾勒出的蓝图,右半图为通用十进制图书分类法 (UDC) 得出的学术地图——该分类法为世界对折大型图书馆所运用,它将人类常识分为9大类目。

为了比较这两大系统,荷兰常识空间实验室 (Knowledge Space Lab) 的研讨人员把“维基百科”的234960个词条划分为43个大板块,并将这些板块归入十进制图书分类法中所对应的类别,总结出61705个节点 (节点标明各词条之间的联络),而十进制图书分类法9大类目共得出68546个节点。

图画标明,这两个常识网络具有适当的不同。十进制图书分类法触及的常识有75%归于科学范畴,而“维基”词条所掩盖的范畴更为多元,如艺术便在其间占有了适当大的比重。

发现效果之影响示意图

研讨人员总是“站在伟人的膀子上”,他们的各项新发现离不开前人的效果。这张示意图可一起展现一项新发现所受过往研讨的影响和这一效果关于这以后科研作业的影响。

数据来历:人机交互及用户界面研讨会(HCI, 1982~2010)网络构建和绘图:Justin Matejka网址:http://tinyurl.com/86fmux7

具体地说,这张图出现的是1982年至2010年“人机互动及用户界面世界研讨会”上所宣布的论文之间的联络。

每一个年份 (纵列) 中的每一篇文章都与其前作为参考资料的论文以及这以后引述该文章的论文相连,因而咱们一眼就能找出那些生发出许多其他研讨的论文 (证明这些论文论述的是真实风趣的观念,见大图),

和那些影响甚微、终究不再遭到重视的研讨 (下图)。

总归,这儿罗列的11699份研讨勾画出该研讨范畴的悉数前史。这张示意图可在网上查阅,并随意扩大,其设计者期望往后能将该办法扩展至其他科研范畴。

撰文 Gayané Adourian

Fran ois Lassagne

编译 朱琳