|
首页 所有 |
数学有什么用?丘成桐:AI和大数据的未来都得靠它! |
出品| 新浪科技《科学大家》 撰文| 丘成桐 国际知名数学家,菲尔兹奖首位华人得主,美国国家科学院院士、美国艺术与科学院院士、中国科学院外籍院士 中国的大部分家庭,每个家庭都很用心于孩子的教育,都很关注孩子的健康成长。基础科学的发展也是同理,我们不断投资在工业上,也将可观的经费投资在基本科学上,因为强大的基本科学对于一个国家的独立自主长治久安是必须的,没有基本科学的发展,研究科学发展不起来。 当年我在普林斯顿高等研究所当教授的时候,这也是杨振宁教授、爱因斯坦工作过的地方。当时的所长曾很自豪地说:“我们在这里研究的是无用之学!这些无用之学在未来将会成为社会的磐石、国家的栋梁。” 高研所第一任所长叫A·Flexner,1939年他在杂志上发表了一篇题为“无为知识的无所不为”(The Usefulness of Useless Knowledge)的文章,文中指出:19世纪法拉第和麦克斯研究电磁学,不过是出于科学的好奇心,接着Hertz发现了电磁波。这些科学家并不重视电磁在人类社会中的应用,但是他们的工作却如此重要,不单单是在理论科学划时代的成就,同时也是近代文明的一大贡献。 基本科学跟数学有哪些应用呢?在当今社会,互联网和计算机的能力极大,无论能源的分配、大数据处理物流系统、道路交通、仿真神经元、蛋白质结构等问题都需要大量地提升计算能力。这种能力有相当大的部分是依靠计算机芯片存储的。 随着电子计算机计算能力的不断成长,30年来,摩尔定律已经到了极限,不可能再增长,计算机硬件的设计将要面临极大的瓶颈问题! 两个方案来解决计算机瓶颈 如何解决呢? 解决的办法有两个,一个是利用基础物理的原理和基本数学来大力改革硬件设备;另一个是大力改善软件,即找到最好的算法,来绕过硬件速度和储存能力来解决计算机瓶颈。 针对第一个方法,三十年前,伟大的物理学家理查德·费曼就提出量子计算这个方案,利用量子力学的基本原理来帮助计算,但当时费曼也不是特别清楚该怎么做,但他知道量子力学的基本原理能解决计算储存能力的问题。 直到二十多年前,MIT有位应用数学家叫Peter Shor,他提出一个算法,利用费曼的提议做大数字的因子分解,在小学我们都学过因子分解,但是大数据做因子分解是一件很困难的事情,基本上大部分的保密系统就仅仅利用大数据分解困难这个问题来设计的。 1978年,科学家提出了一个很出名的方法:RSA加密算法,到现在所有系统都用这一个方法,但是Peter认为假如量子计算成功的话,RSA所有的加密方法都可以破解。 因为量子计算威胁到目前通用的保密方法,因此很多国家的政府官员、银行监管部门等都极为担心,但同时也投入了大量的资源来发展研究量子计算。 这项研究需要大量的数学家、物理学家跟工程师合作:费曼是物理学家,Petter是数学家,美国名校有很多教授在做这方面的工作,MIT、斯坦福,在实验方面投入的资源很大,美国公司投入的规模更大,包括IBM、谷歌、微软等公司在内,IBM投入量子计算研究已经几十年了,现在有1300名工程师在做这方面的研究。 2018年,美国通过了National Quantum Initiatives(NQI)法案,许多智库与政府官员都认为量子计算就像二战前的曼哈顿核弹计划一样,关系着国家安全,需要政府全力支持。 今年IBM研发出53个量子比特的超级量子计算机,可以通过云端使用,最近NASA宣布,谷歌可以通过量子计算在200秒内完成世界第一的Summit超级计算机在10000年才能解决的问题。 中国的学者和公司也在做这方面的工作,但是基本物理和基础数学的水平不如美国,要在量子计算的研发上努力追上他们。这其实也给我们一个很重要的启示:投资不能看五年十年,甚至要看二十年,因为IBM投资在量子计算的时间至少超过了20年。 第二个解决方法就是利用数学发展出来的方法,现在这方面研究有人工智能跟大数据。 人工智能已经从一种刚开始的理念,逐步转化为可应用的技术。30年前大家都不看好人工智能,现在已慢慢转化成认为可应用的技术。人工智能的蓬勃发展基于三个重要因素:一是互联网技术带来的大数据;二是利用深度学习的标准算法来处理数据;三是超级计算机跟云计算的强大计算力。 然而其中的数学理论却没有什么很大突破,这也是该领域存在诸多瓶颈的本源。中国的人口规模是发展人工智能的优势,在应用人工智能技术方面已经有了很多优秀的工作,发表的论文甚至比美国还要多,处于世界前沿水平。 但是在基础理论和算法创新方面跟美国、英国还有一段距离,因此我们要像在人工智能方面领先,基础理论一定要突破。要想突破,一定要将数学跟相关的学科一同发展,才能够真真正正地领先。 人工智能对大数据的处理,本质上是数学中的统计学,然而目前还没有完备的数学理论能支持大数据分析的结果,很多数学方法还相对原始,过度依赖于经验的总结,而非真正来自内在的数学结构。 这也导致了当下人工智能在处理大数据问题时还需要大量的人力和算力,甚至需要超级计算机的协助。由于缺乏数学理论的支持,很多大数据分析的结果只适用于特定环境,缺乏迁移性。 大数据还缺乏有效的算法,经典计算机的算法还不能直接用到大数据中。这是很重要的一个问题,我们要深入了解。 广为流传的深度学习有很多不足的地方,例如大样本依赖,可解释性差,易受欺骗等,但当前没有更好的算法来替代。要解决这些问题,就需要对相关数学理论进行深入研究,了解大数据内在的数学结构和原理。 目前人工智能由于计算器速度限制,只能采取多层状结构解决问题,基于简单数学分析而非真正的Boltzmann machine,无法有效地找出最优解。 在可见得未来,如何提升量子计算机的硬件,发展更有效的数学算法,让量子人工智能与量子深度学习变成实用工具,这有赖于基础科学和数学的深度结合。 几年前,我的学生和我朋友发现我四十年前在几何方面做的研究,可以应用到人工智能的理论研究上,以前其实没有想到的基础科学可以用在这方面。由此可见,基础数学在工程问题上确实是重要的。 机器学习和人工智能等先进的计算方法,已经在零售和娱乐等领域带来了显著的突破。这些方法也可能对医学和卫生保健产生深远的影响,全球的卫生保健系统包括美国和中国,都着手将临床信息数字化。 但是,对如何分析和应用这些信息却还没有很好的策略。未来十年,数据科学和人工智能对医学的贡献可能超过其他所有技术的总和。人工智能和数据科学的医学研究将变成医学和卫生保健的一个新领域。在这个崭新的领域里,数学和计算科学将会更广泛地为医疗决策提供支持。目前很多医疗系统的研究人员还没有意识到这一点,或者低估了这些影响。 我们希望将最先进的计算技术应用到大型的、医学相关的数据库,得到有效的信息,并将之应用到医疗服务、临床诊断及相关的医学研究中。 为了将人工智能和应用数学更好地应用到医学研究和卫生保健上,不同的学科需要共享合作。数学、医学信息学、计算机科学、生物统计学、工程学都将是研究工作不可或缺的。这将是一个很大规模的不同学科联系起来的一种研究,不同的学科共同的努力才能完成,不是一个学科就能够完成的。 以人工智能临床诊断为例,中国拥有全世界最大的临床医疗数据库,我们需要学习如何管理和应用这些数据,而通过计算科学和人工智能,我们可以用全新的方法利用这些数据,推动整个领域的发展。 首先,我们可以利用机器学习模型消化更大、更丰富的数据集,同时通过机器学习的结果重新审视传统的预测模型的准确性,同时我们还可以尝试在自然的状态下改变额外的变量去提高模型的准确性,这种设置还允许进一步分析如何以及为什么新的技术和方法可能更好,以及在数学上有什么改进的可能。 目前人工智能和数据科学的技术已经被广泛地应用于临床诊断、手术指导、风险预测等不同的领域。在某些领域,计算机诊断的准确率甚至比医生还高,这是很大的进步,对临床实践影响深远,正是这样的成就进一步激发了科研人员的干劲。未来医学更大的变革,将会更依赖于数学理论的突破和人工智能技术的进步,这是毫无疑问的。 数学应用多姿多彩 数学应用多姿多彩,每人有不同的志趣,走不同的方向,大致上可以分为如下几类: 数据科学,张量,大数据,人工智能,机器学习; 数值优化,运筹学,以及在大规模机器学习中的应用; 量子计算,量子算法以及在机器学习中的应用; 数值线性代数,矩阵计算以及在数据科学中的应用; 大规模科学计算和高性能计算,如计算材料科学,计算量子化学,计算电磁学等的快速算法和并行算法等; 数值偏微分方程,有限元理论和方法,多重网格算法,(非)线性守恒律等; 多尺度模拟; 计算液体动力学,计算连续力学,如复杂流体,多孔介质渗流,界面问题,地球物理流,生物流体动力学; 数值逼近论; 反问题的数值解法; 计算机图形学,计算共形几何,图像处理,医学影像处理等; 动力系统和混沌,非线性动力学,经典与量子(不)可积系统,耗散系统等;随机分析,随机微分方程,不确定性量化及应用,统计计算,蒙特卡洛方法等及其在机器学习中的应用; 数理经济学,金融数学,精算保险等; 数学生命科学,包括生物统计,生物信息学,理论神经科学等; 博弈论; 控制理论; 数字信号(如地震波)处理,编码学; 信息与通信科学; 密码学。 基础数学应用到不同的地方,各个不同领域是很多的,数据学、数值优化运筹学,大规模机器学习中的应用。量子计算机器学习的应用,数值线性代表、矩阵计算都是很重要的,大规模科学计算跟高性能计算都是很重要的,材料力学、量子化学种种都需要数学的发展。 这些不同的方向,期望国家都能够花点功夫支持,这些方向都是未来整个高科技社会里面最重要的发展方向。未来10年里,要想在北京能够完成这些重要的学科发展,这需要很大规模的配套投资,期望我们能够很快的追上这些学科的发展脚步! 注:该原始稿件已在《数理人文》杂志发表,原标题为“数学和基本科学在应用科学中的重要性”。 |
|||
2019-10-27 8830 | |||
|
咨询电话 13910949198 (李桂松) |
北京市平谷区中关村科技园区平谷园1区-21594(集群注册) |
京ICP备16017448号 |
技术支持 |