TensorFlow入门：零基础建立第一个神经网络

36大数据 • 8年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

TensorFlow入门：零基础建立第一个神经网络

文 | Tony Bai

首先，我不得不承认这篇文章有些标题党的味道^0^，但文章还是要继续写下去，备忘也好，能帮助到一些人也好。

在2016小结的时候，我说过：2017年要了解一些有关机器学习和人工智能(以下简称AI)方面的技术。如果有童鞋问：Why?我会告诉你：跟风。作为技术人，关注和紧跟业界最前沿的技术总是没错的。

2016年被业界普遍认为是AI这一波高速发展的元年，当然DeepMind的AlphaGo在这方面所起到的作用是功不可没的。不过人工智能并未仅仅停留在实验室，目前可以说人工智能已经深入到我们生活中的方方面面，比如：电商的精准个性化商品推荐、手机上安装的科大讯飞的中文语音识别引擎以及大名鼎鼎的Apple的siri等。只是普通老百姓并没有意识到这一点，或者说当前AI的存在和运行形式与大家传统思想中的“AI”还未到形似的地步，再或者当前AI的智能程度还未让人们感觉到AI时代的到来。

人工智能是当前的技术风口，也是投资风口。不过，人工智能技术与普通的IT技术不同的地方在于其背后需要大量且有一定深度的数学理论知识，有门槛，并且门槛较高，这会让普通程序员望而却步的。还好有国际大公司，比如:Google、Facebook等在努力在降低这一门槛，让人工智能技术更加接地气，让更多从事IT领域的人能接触到AI，并思考如何利用AI解决实际问题。Google的TensorFlow应该就是在这样的背景下诞生的。

这里并不打算介绍TensorFlow是什么，其原理是什么(因为目前我也不知道)，只是利用TensorFlow简简单单地建立起一个神经网络模型，带着大家感性的认知一下什么是AI。本文特别适合那些像我一样，从未接触过AI，但又想感性认识AI的程序员童鞋们。

一、由来

和AI门外的程序员童鞋一样，想窥探AI的世界已久，但苦于没有引路人，一直在门外徘徊。直到看到martin gorner的那篇《TensorFlow and deep learning, without a PhD》。在这篇文章中，martin已经将利用TensorFlow建立并一步步训练优化一个神经网络的门槛降低到了最简化的程度了。不过即便这样，把martin所使用这个环境搭建起来(文中虽然有详细步骤)，可能依旧会遇到一些问题，本文的目的之一就是帮助你迈过这“最后一公里”。

二、搭建环境

我所使用的环境是一台think center x86_64物理机，安装的是ubuntu 16.04.1。相关软件版本：

TensorFlow入门：零基础建立第一个神经网络

按照教程中INSTALL.txt中的步骤，我们需要安装依赖软件：

TensorFlow入门：零基础建立第一个神经网络

我们看到安装的TensorFlow是0.12.1版本，这应该是TensorFlow发布1.0版本前的最后一个Release版了。

下载Martin的教程代码：

TensorFlow入门：零基础建立第一个神经网络

我使用的tutorial的revision是：commit a9eb2bfcd74df4d7f3891d5403468d87547320e8。

三、建立并训练识别手写数字的神经网络

万事俱备，只差执行。

一起来建立我们的第一个神经网络：

TensorFlow入门：零基础建立第一个神经网络

出错了!

这里要注意的是：初次建立时，程序会首先从MNIST dataset下载训练数据文件，这里需要等待一段时间，千万别认为是程序出现什么hang住的异常情况。

之后的AttributeError才是真正的出错了!直觉告诉我是课程程序依赖的某个第三方库版本的问题，但又不知道是哪个库，于是我用临时处理方案fix it：

TensorFlow入门：零基础建立第一个神经网络

我把出错的调用注释掉，用hardcoding的方式直接赋值了两个color。

再次运行这个模型，我们终于看到那个展示训练过程的“高大上”的窗口弹了出来：

TensorFlow入门：零基础建立第一个神经网络

运行一段时间后，当序号递增到2001时，程序hang住了。最初我以为是程序又出了错，最后在Martin的解释下，我才明白原来是训练结束了。在mnist_1.0_softmax.py文件末尾，我们可以看到这样一行注释：

这里告诉我们对神经网络的训练会进行多少次iterations。mnist_1.0_softmax.py需要2000次。tensorflow-mnist-tutorial下的每个训练程序文件末尾都有iteration次数，只不过有的说明简单些，有些复杂些罢了。

在另外一个issue中，Martin也回应了上面的error问题，他的solution是：

我实测后，发现问题的确消失了!

四、小结

识别手写数字较为简单，采用softmax都可以将识别率训练到92%左右。采用其他几个模型，比如：mnist_4.1_batchnorm_five_layers_relu.py，可以将识别准确率提升到98%，甚至更高。

将这个教程运行起来的第一感觉就是AI真的很“高大上”，看着刷屏的日志和不断变化的UI，真有些科幻大片的赶脚，看起来也让你感觉心旷神怡。

不过目前仅仅停留在感性认知，深入理解TensorFlow背后的运行原理以及训练模型背后的理论才算是真正入门，这里仅仅是在AI领域迈出的一小步罢了^0^。

End.

转载请注明来自36大数据（36dsj.com)： 36大数据 » TensorFlow入门：零基础建立第一个神经网络

随意打赏

tensorflow 神经网络 tensorflow神经网络 tensorflow

可编程芯片首次用光训练神经网络

砍柴网 • 3月前

4 月 21 日消息，据最新一期《自然・光子学》杂志报道，美国宾夕法尼亚大学的工程师们开发了首款能够利用光进行非线性神经网络训练的可编程芯片。该芯片可以使用光来训练非线性神经网络 —— 这一突破可以显著加快 AI 训练速度，减少能耗，甚至为全光计算机铺平道路。▲ 芯片内部的图像 —— 白色虚线框是输入，黄色虚线框是输出
新加坡国立大学赖载兴教授专访：用混沌边缘改善神经网络，与上帝掷骰子

雷锋网 • 1年前

2021年，诺贝尓奖委员会决定将物理奖颁发给复杂系统研究领域、以乔治·帕里西（George Parisi）为首三位科学家。当时不仅物理学界，许多计算神经科学家或理论机器学习学者表达了对帕里西的祝贺和感激，认为他的理论成果极大地推动了神经网络理论研究这一跨学科领域的蓬勃发展。在新加坡国立大学，Choy
车路云一体化建设：三旺通信TSN方案构建智能交通神经网络

砍柴网 • 1年前

前言一个多雾的早晨，高速公路上能见度极低，智能感知设备检测到这一情况后，立即通过V2I通信向所有车辆发送警报，车载系统自动调整至智能引导模式，确保安全行驶。同一时间，一辆故障车停在应急车道，通过V2I模块自动向监控中心求助，救援车辆迅速响应，并通过V2V通信向周边车辆发出预警，有效预防次生事故。与此同时，一辆超速车辆触
用扩散模型生成神经网络？NUS 尤洋团队：这不是开玩笑

雷锋网 • 1年前

作者：赖文昕编辑：郭思、陈彩娴说起扩散模型生成的东西，你会立刻想到什么？是OpenAI的经典牛油果椅子？是英伟达Magic3D生成的蓝色箭毒蛙？还是斯坦福大学和微软Folding Diffusion生成的蛋白质结构？这些都是扩散模型的魔法展示，而近期，关于扩散模型的研究又进行了一次全新的升级。由新加坡国立大学尤洋团队、
微美全息研究基于混合循环神经网络架构的人机协作意图识别

砍柴网 • 1年前

在当今科技发展迅速的时代，人机协作已经成为一个重要的研究话题。随着人工智能技术的不断进步，人机协作的应用范围也越来越广泛，其在智能交通、智能家居和智能机器人等领域已经得到了广泛的应用。在实际应用中，人机协作的意图识别是一个关键问题。要实现高效的人机协作，机器需要准确地理解人类用户的意图，以
微美全息创新突破利用群体智能算法优化人工神经网络

砍柴网 • 1年前

人工神经网络（Artificial Neural Network，ANN）已成为机器学习领域的核心算法之一，推动了自然语言处理、计算机视觉、无人驾驶、语音识别、医疗诊断和推荐系统等多个领域的技术进步。近年来，人工神经网络在众多领域得到了广泛应用。在应用人工神经网络之前，需要确定网络结构并对其进行训练。网络结构的选择通常
华为等靠激光雷达推自动驾驶！特斯拉不屑全力抛弃：开始依赖神经网络

砍柴网 • 1年前

11月29日消息，据国内媒体报道称，当其他车企还在依赖激光雷达等类型的传感器为用户推出辅助/自动驾驶功能时，特斯拉已经开始依赖神经网络和人工智能进行所谓的完全自动驾驶。从目前的情况看，特斯拉的完全自动驾驶（FSD）V12版本放弃代码（30多万代码降至2000行），使用神经网络进行车
纽约大学团队开发用于基因组学的神经网络，并解释了它如何实现准确的预测 - IT思维

IT思维 • 1年前

公众号/ ScienceAI（ID：Philosophyai）编辑 | 萝卜皮机器学习方法，特别是在大型数据集上训练的神经网络，正在改变科学家进行科学发现和实验设计的方式。然而，当前最先进的神经网络因其不可解释性而受到限制：尽管他们具有出色的准确性，但他们无法描述他们是如何得出
使用卷积神经网络从相关 Moiré 超晶格的STM数据中学习有效的理论模型 - IT思维

IT思维 • 1年前

公众号/ ScienceAI（ID：Philosophyai）编辑 | 萝卜皮现代扫描探针技术，例如扫描隧道显微镜，可以获取编码量子物质基础物理的大量数据。斯图加特大学（Universität Stuttgart）的研究人员展示了如何使用卷
一种新型神经网络正在帮助物理学家应对数据分析的艰巨挑战 - IT思维

IT思维 • 2年前

公众号/ ScienceAI（ID：Philosophyai）编辑 | 绿萝假设你有一本一千页的书，但每一页只有一行文字。你使用扫描仪提取书中包含的信息，这个特定的扫描仪系统地扫描每一页，一次扫描一平方英寸，要花很长时间才能读完整本书，而且大部分时间会浪费在扫描空白处。这就是许多

评论