臧秀涛,现就职于 InfoQ,任 QCon 大会主编,负责 QCon 大会的策划和组织。2010 年毕业于中国科学院计算技术研究所。曾先后在完美世界等公司从事软件开发工作。2014 年加入 InfoQ。业余喜爱读书和翻译,曾翻译出版过《C++ API 设计》、《Groovy 程序设计》和《Java 性能权威指南》等技术图书。业余也维护了一个微信公众号“开发资讯(dev-news)”,欢迎关注。
对 QCon 大会有任何建议或想法,欢迎通过微博 @臧秀涛 与我联系。
作为深度学习框架的典型代表,TensorFlow 应用越来越广。本专题将关注 TensorFlow 在实践中的应用,TensorFlow 如何与大数据平台的整合等前沿经验。
深度学习中卷积神经网络和循环神经网络对于时间序列的数据有很好的学习能力,而金融数据中大量的数据都是时间序列的格式,包括银行流水、股票日线、交易日志,乃至金融分析报告中的文本信息等。因此应用深度学习到金融数据挖掘中,会有先天的优势,而 TensorFlow 是目前深度学习中最成熟最主流的框架,它有 Google 提供强大的研发能力作保障,对各种最新的深度神经网络结构都有非常好的支持。在 FinTech 中,应用深度学习我们可以用来作很多方面的工作:
TensorFlow 的开源大幅降低了深度学习的门槛并极大推动了深度学习在众多公司的落地。但是,建设深度学习平台更多还需要关注多租户管理、资源隔离、作业管理等。除此之外,在大数据时代训练数据大多存储在以 HDFS 为代表的分布式储存系统中。所以,直接存取 HDFS 也是必不可少的功能。基于以上考虑,我们设计了 TensorFlow on Yarn,实现了深度学习与大数据平台的整合。归纳而言,TensorFlow on Yarn 主要有以下功能和特点:
除了 TensorFlow on Yarn 外,会向大家一并介绍下我们更早设计的 SparkFlow(TenrsorFlow 与 Spark 的结合),以及整合更多计算框架到 Yarn 的思考。