海量数据时代,如何押宝人工智能竞赛?

免责声明:本文来自微信公众号硅谷洞察(ID:guigudiyixian),作者:Insights硅谷,业主转载授权发布。

人工智能是一种革命性的技术浪潮,可以帮助每个行业的用户解决大小问题,从探索宇宙奥秘的科学研究到有益于民生的健康和精准医学,再到与生活息息相关的交通。正在驾驶一辆车。

人工智能的应用场景足够大,可以结合大数据和深度学习来分析大型强子对撞机产生的大量原始数据;它足够小,可以将耳朵和头部放到语音助手上,以了解用户的句子并实现简单的对话或交互。

人工智能到目前为止如此接近。

可以说,随着技术的不断成熟和普及,人工智能可以使我们能够应对各种人类挑战。科学家可以利用人工智能提高科学研究的生产率,加速造福全人类的进程;企业也可以使用人工智能。无限的潜力创造了新的收入来源并提高了他们的底线;消费者可以继续看到更多新应用。

今天,Silicon Valley Insights将为您分析AI为各行各业带来的转型效应。

什么是超级计算机?

在宇宙研究方面,它必须是科学研究的超级计算机。小谢第一次听说超级计算机的概念是在小说《三体》中,而刘有这样的描述。

(发表于2008年科幻小说《三体II:黑暗森林》剪辑)

浮点运算的数量表示计算机的计算能力。 11年前的科幻小说早已被现实所超越。在刚刚结束的国际超级计算大会上,由小发猫在田纳西州能源部橡树岭国家实验室(ORNL)制造的超级计算机峰会以148.6 PetaFlops(PTL)HPL记录赢得了世界上最强大的超级计算机。标题。只需计算出Summit计算速度已达到《三体》中超级计算机的近300倍。

科学技术的发展超越了我们的想象,一度遥远的未来已经到来。

事实上,超级计算机是指连接在一起的多个高性能计算机节点,用于统一调度管理,从而实现强大的计算功能。简单地说,服务器售价超过10万元。这些机器主要分布在大学或科研机构的领域。它们是与人类发展有关的重要领域,如全球气候变化,宇宙探索分析,大脑模拟,新材料开发,生物医学,智能城市等问题。

可以看出,这些研究的特征是需要分析和模拟大量数据以获得预测的规律性。如果您需要模拟大量无意义对象之间的相互关系,则需要“高性能计算”。

例如,欧洲核研究中心的大型强子对撞机(LHC)周长为27公里,超过6,000个超导磁体。它是世界上最大的机器和最先进的科学仪器。大型强子对撞机将质子加速到99.%的光速并产生非常高的能量碰撞,在某些情况下比我们的太阳能核心高出100,000倍。

这些实验产生了大量的原始数据。大型强子对撞机每秒有多达10亿次碰撞,通过CERN系统每秒产生高达1 PB(1,024太字节或100万千兆字节)的数据 - 远远超过世界上最重要的研究所能存储的数据机构。您需要使用专有软件和卓越的计算能力来过滤这些数据。

气候预测还需要高性能计算。气候预测可以广泛预测全球气流,洋流等,并且仅限于天气预报。天气预报的基本原则是通过气象卫星捕获地图上每个点的云和气流轨迹,然后通过大量计算得出它们的未来趋势。

高性能计算和人工智能深度集成

超级计算机和人工智能的集成将引领下一代计算机体系结构和系统软件应用的发展。

研究表明,通过在现有的高性能计算(HPC)工作流程中添加深度学习功能,运行大型高性能计算应用程序可以显着提高效率。深度学习神经网络的固有并行性非常适用于高度并行的HPC环境,其中极端的计算性能,大内存池和优化的节点间通信结构可以显着扩展深度学习网络识别结构和模式的能力。

美国能源部科学办公室和加州大学伯克利分校选择与英特尔合作,将深度学习与HPC基础设施相结合,创建一个15-PetafFlop深度学习系统,以解决科学模型分类问题。

这种深度学习系统将单个深度学习模型的培训扩展到Cori超级计算机上多达9,600个基于英特尔至强处理器的节点。该模型在从气候数据集中提取高达15TB数据的天气模式方面更有效。结果表明,在处理大型复杂数据集时,优化和扩展深度学习培训到多核HPC系统具有显着优势。

除了帮助处理极其复杂的数据之外,使用HPC基础设施进行深度学习的第二个主要好处是它极大地改善了深度学习算法训练的响应时间。

德克萨斯高级计算中心(TACC)被命名为世界上第五快的超级计算机,它将使用其英特尔至强铂金8200处理器为其Frontera系统提供动力,支持由美国国家科学基金会资助的多方面高级研究。

Frontera还将整合超过100TB的英特尔Proton数据中心级持久存储器,这是该技术首次应用于如此大规模的应用。这种将持久性存储器放置在高性能计算系统附近的方法将实现极其复杂的仿真,人工智能算法和存储器分析。 Frontera将帮助证明在高性能计算系统上进行大规模并行人工智能推理的可能性。

http://www.sugys.com/bdsv/4oE