A-A+
手写数字识别 论文
问:卷积神经网络结构——LeNet-5(卷积神经网络入门,Keras代码实现)答:要粗滚深入理解卷积神经网络的结构,我们需要追根溯源,只有这样才能更好的理解 CNN 网络。1998年 LeCun 和 Bengio 等人利用 -5 网络在手写体数字识别领域上的识别效果超过了传统方法,从此开启了卷积神经网络的在图像上的应用大差凳哗门。据说,一开始美国银行的手写体数字识别就是用的这个算法。Gradient -Based Learing Applied to Document Recognition论文有点长,46页,估计很难读下虚行来。LeCun 做了一些网页展示,有兴趣可以去浏览。上图是 LeCu
问:卷积神经网络结构——LeNet-5(卷积神经网络入门,Keras代码实现)
1998年 LeCun 和 Bengio 等人利用 -5 网络在手写体数字识别领域上的识别效果超过了传统方法,从此开启了卷积神经网络的在图像上的应用大差凳哗门。据说,一开始美国银行的手写体数字识别就是用的这个算法。
Gradient -Based Learing Applied to Document Recognition
论文有点长,46页,估计很难读下虚行来。
LeCun 做了一些网页展示,有兴趣可以去浏览。
上图是 LeCun 原论文中 -5 的结构图。
问:在第五章手写数字识别的例子中
例如,看到一对父子,一般情况下,通过判断他们的年龄,能够马上分辨出哪位是父亲,哪位是儿子。这是通过年龄属性的特征值来划分的。
上述例子是最简单的根据单个特征维度做的分类,在实际场景中,情况可能更复杂,有多个特征维度。
例如,为一段运动视频分类,判断这段视频是乒乓球比赛还是足球比赛。
为了确定分类,需要定义特征。这里定义两个特征,一个是运动员“挥手”的动作,另一个是运动员“踢脚”的动作。
当然,我们不能一看到“挥手”动作就将视频归类为“乒乓球比赛”,因为我们知道某些足球运动员习惯在运动场上通过挥手来跟歼戚队友进行交流。同样,我们也不能一看到“踢脚”动作就将视频归类为“足球比赛”,因为有些乒乓球运动员会通过“踢脚”动作来表达自己的感情。
我们分别统计在某段特定时间内,视频中“挥手”和“踢脚”动作的次数,发现如下规律:
在乒乓球比赛的视频中,“挥手”的次数远多于“踢脚”的次数。
在足球比赛的视频中,“踢脚”的次数远多于“挥手”的次数。
根据对一组视春铅频的分析,得到如表20-1所示的数据。
为了方便观察,将上述数据绘制为散点图。
乒乓球比赛视频中的数据点聚集在x轴坐标为[3000, 5000], y轴坐标为[1,500]的区域。
足球比赛视频中的数据点聚集在y轴坐标为[3000, 5000], x轴坐标为[1,500]的区域。
问:目前美国手写邮政编码的识别用的谁家的算法
评论已关闭!