◇◇新语丝(www.xys.org)(newxys.com)(xys10.dxiong.com)◇◇   驳樊代明医学不是科学的谬论之十三:数据与事实   作者:司履生   人类已经进入了大数据时代,给各行各业带来了机遇的同时,也带来了许多 值得挑战。大数据是新的科学知识,对人类影响到底有多么深远,有人这样形容, 就像牛顿第一定律、阿基米德定律。既然是新的科学知识,一旦被合理利用,就 能改变世界。像人类利用牛顿第二定律,造出火箭进入太空;利用万有引力定律, 生产人造卫星环绕地球;利用麦克斯韦方程组,造出手机开始通讯。简单地说, 数学运算出数字结果,由已知得出未知,大数据分析出行为决策,由已知预测未 知。也许几百年后,大数据和数学一样成为九年义务教育基础课程。目前,大数 据已经成了从新闻媒体到日常生活的非常热的用语。科学、商业、政府、社会以 及人们的日常生活,都已经显现数据泛滥的前兆。在生物医学的研究中,大数据 研究方法已经得到了越来越广泛的应用,从基因组分析到脑科学研究,从大规模 流行病学调查到药物研发,没有大数据技术的支撑已经是不可能的了。就连这次 克隆猴的成功也有大数据的杰出贡献。 樊代明说,“这些浩如烟海、极为复杂 的数据,从不同角度为疾病的研究和诊疗提供了信息支撑和辅助决策,但同时也 给医学工作者,特别是临床医生带来了不尽的困扰和挑战。过去是没有数据不行, 现在是有了数据更不行。谁都知道,科学是注重数据、注重证据,要数据说话, 证据说话,数据就是证据;而医学则不然,因为数据不一定是证据,临床医生每 天碰到的是‘数据复数据,数据何其多,哪个更真实,谁也不好说'。因为数据 不是人体,数据不是疾病,数据不一定是诊断证据,数据也不一定是治疗效果。 多数数据不一定是事实,因为它不是反映生物体的主流,也未反映出事物的本质, 任何数据揭示的生物结果都有例外。”   这一段话的中心意思就是大数据适用于除医学以外的学科,对医学本身,尤 其是临床医学并不适用。事实上,在临床医学的研究工作中,包括医院管理也需 要大数据库平台的支持。   但对于直接每天面对病人的一般医生,每天所接触到的大部分,甚至绝大部 分病人都是简单的一眼就能看穿的病人,这种工作不可能接触到浩如烟海的数据, 与大数据没有多大关系。如果想要有一点点对某个疾病的治疗,或手术范式有点 改进就得有大数据的概念。   大数据中的数据本来就是收集到的事实,或直接证据,只是把这种事实,或 者证据通过人工智能数据化了,然后加以储存。但在收集前,必须有很好的设计, 规划,数据也必须严格的规范化。否则,会漏掉许多数据,会收集到一大堆垃圾 数据。这样,会造成数据严重的偏离真实实际,这些垃圾数据也自然会对以后的 分析应用造成极大的干扰,导致严重的错误。所以在数据收集过程中,特别强调 数据清洗,这是消除噪音,垃圾数据的重要环节。另外,在应用大数据时,还要 对数据进行分析。因为数据不会说话,得有人去解码,分析各项数据之间的关系, 做出合理的解释。否则,也会发生错误,得出错误的结论。因为大数据对我来说, 完全是一个新事物。我只能说,大数据从收集前的设计,开始收集到储存,以至 应用,整个过程中的许多环节都有出错的可能。都得有专家把关。而且大数据时 代刚刚开始不久,还在继续发展。所以说,大数据使用中的错误绝对不是医学所 特有的。对科学的其它领域也是一样,网上有许多文章论及,一篇文章说,在商 业领域里,大数据的预测准确率也只有44%,还不及一半。总之,数据虽然是事 实,是证据,大数据只是一种工具,是不是有用和用的好不好,完全在使用者个 人。不会因为是医学,或其它自然科学而有所不同。   樊代明说,“一个人的细胞数远远超过上万亿,每个细胞又由成千上万的基 因、蛋白或代谢物组成。人体就像一个黑匣子,任何一个小问题、小刺激都会导 致人体作出一系列复杂的反应,这种反应超过平衡的极限就会生病。诊断疾病需 要医学数据分析,但必须是扎实可信的数据,而且需要稳定可靠的分析模型才能 获得可靠可重复的结果。这对于科学来讲可能已足够了,但对医学来说,这还不 行,因为即使这样的结果还需要有经验的临床医生来解读分析和判断。我们只能 用科学的方法来利用数据,尽可能地逼近医学的事实,但决不能直接与医学的事 实画等号。如果用一个公式来表达的话,数据是什么?数据对于人体意味着什么? 数据的用途又在于什么?那就是成千上万个分子×成千上万个细胞×成千上万秒 时间/个体=无穷大的结果。这个无穷大的结果只有通过电脑计算,然后再经过人 脑判断,最后才能成为医学事实,这就是医学上数据与事实间的关系。”这个极 为夸张的说法,大概太过于想象了。事实上,是根本不可能的。怎么能设想,人 体的成千上万个细胞中的每个细胞会在同时发生不同的变化,还同时每个细胞中 的成千上万个分子各自发生不同的变化,否则,就不可能用乘法来表示。再说还 要乘以观察记录的时间。这个数据自然很大很大。但是恐怕永远没有这样的同时 记录每一个细胞中每一个分子变化的仪器和手段。即细胞和分子既没有同时发生 这种变化的可能,也没有记录这种变化的手段。这种海量的数据根本不可能存在。 樊代明总想着能把医学说的其它科学门类无法企及,以显示医学的特殊和伟大。 可惜,医学的现实彻底排除他的这种妄想。 (XYS20190527) ◇◇新语丝(www.xys.org)(newxys.com)(xys10.dxiong.com)◇◇