深度学习识别图像上汽车的区域，刚刚把网络训练出来

YFM · 发表于 2017-7-11 02:35:09

平台                      tensorflow
数据集                   KITTI街景
卷积网络结构       类GoogLeNet 8层网络使用了GoogLeNet的ICP层
                              RGB image---->5x5x64conv(stride 2)---->Maxpool(3x3 strid 2)---->3x3x80conv(stride 1)----->ICP0(1x1,3x3,5x5,maxpool)---
                              ---->Maxpool(3x3 strid 2) ----->ICP1(1x1,3x3,5x5,maxpool)----->Maxpool(3x3 strid 2)----->ICP2(1x1,3x3,5x5, maxpool)----
                              ---->3x3x2conv(stride 1)------> posibility map

下面是结果图每张图有4个plot 每个plot从上到下依次是：自然图像输入，Car概率，Non-Car概率，100%Car区域。

beeworld · 发表于 2017-7-11 05:59:08

牛掰，看上去很深奥。老司机，求带路，指导一下，怎么上手。

jssd · 发表于 2017-7-11 06:48:46

楼主搞机器学习很牛B哇！这个训练了多久？

jlhgold · 发表于 2017-7-11 07:47:01

多图杀流量啊，哈哈哈

jasonzhu8888 · 发表于 2017-7-11 08:00:20

很早以前研究过一阵子图像识别，得出一个结论：坑太大了，不够自己填的。
现在看到这个，感觉深度学习在一些领域，真的很厉害。上面的这种识别率，在传统算法实现上，估计花1000倍的精力都达不到。

wye11083 · 发表于 2017-7-11 08:08:51

jasonzhu8888 发表于 2017-7-11 08:00
很早以前研究过一阵子图像识别，得出一个结论：坑太大了，不够自己填的。
现在看到这个，感觉深度学习在一 ...

传统算法做不到。想都不要想。深度学习啊，相当于变相的几十次高阶方程，参数几万到几百万个，在几十维下做拟合。这些参数手调直接到手软。

R8C · 发表于 2017-7-11 08:14:24

CPU够快何需调到手软

happywinds · 发表于 2017-7-11 09:08:19

楼主大牛啊！佩服！卷积层采用的是GoogLeNet模型训练数据？车概率显示是用备选区域方式？

gujiamao_love · 发表于 2017-7-11 09:34:30

老司机，带个路！

beeworld · 发表于 2017-7-11 09:42:11

R8C 发表于 2017-7-11 08:14
CPU够快何需调到手软

典型的只要推力足，火砖都可以飞。
英特尔cpu默秒全，你怎么不用英特尔的智能手机。
竞争找最优，才是合适的。

dgtg · 发表于 2017-7-11 09:59:16

牛逼得一踏糊涂！！！！

aammoo · 发表于 2017-7-11 10:01:17

强

还有一个 · 发表于 2017-7-11 10:07:42

很牛，大的、小的，不同角度的都能识别。

brentcao · 发表于 2017-7-11 10:07:53

厉害，我还在学习CNN的，求老司机带个路。

brentcao · 发表于 2017-7-11 10:08:49

目前基本掌握NN 真在学习CNN

XIVN1987 · 发表于 2017-7-11 10:12:27

楼主厉害，，
据说深度学习在图像识别领域非常成功！！

血影神功 · 发表于 2017-7-11 11:15:40

祝贺楼主，深度学习将会在以后的各个领域发挥越来越大的作用

血影神功 · 发表于 2017-7-11 11:19:05

还有一个发表于 2017-7-11 10:07
很牛，大的、小的，不同角度的都能识别。

颜色能识别么？

血影神功 · 发表于 2017-7-11 11:20:05

比如能否根据果的颜色判断出一个苹果是熟的还是不熟的？

brentcao · 发表于 2017-7-11 11:26:54

血影神功发表于 2017-7-11 11:20
比如能否根据果的颜色判断出一个苹果是熟的还是不熟的？

那个需要另外训练了

isakura · 发表于 2017-7-11 11:41:48

很牛的，现在的ADAS可以识别几个车的是用什么方案的？

yuyanlzh · 发表于 2017-7-11 11:47:25

老司机有没有机器学习入门指引，外行好羡慕

百果 · 发表于 2017-7-11 14:30:38

看上去好直观啊，

avrwoo · 发表于 2017-7-11 15:01:09

效果不错啊，tensoflow好像只能在LINUX平台运行吧，期待楼主教程啊。

hkjabcd · 发表于 2017-7-11 15:07:56

好厉害啊！不受光照和颜色影响，车辆和行人都能识别准确，膜拜~~

jasonzhu8888 · 发表于 2017-7-11 17:41:26

wye11083 发表于 2017-7-11 08:08
传统算法做不到。想都不要想。深度学习啊，相当于变相的几十次高阶方程，参数几万到几百万个，在几十维下 ...

太赞同了。
有个说法，深度学习这块，学了一般又用不上。但搞IT的好像不得不学，否则就落伍了。
个人感觉是，要学这块，就得找个还没被关注的领域，用心花精力研究，搞个模型，收集学习数据。有一定效果之后，再杀出去。

brentcao · 发表于 2017-7-11 17:53:26

jasonzhu8888 发表于 2017-7-11 17:41
太赞同了。
有个说法，深度学习这块，学了一般又用不上。但搞IT的好像不得不学，否则就落伍了。
个人感觉 ...

方便说具体点吗？谢谢

bitvi · 发表于 2017-7-11 18:01:43

这个把抽象的AI一下拉到现实中

huangqi412 · 发表于 2017-7-11 21:01:26

不明觉厉把高大上变形象了

enthier · 发表于 2017-7-11 22:03:50

我同事也在做，用的caffe框架，用GPU算，能够在一个视频流中用框框框出车，他说是外国人训练的模型。

YFM · 发表于 2017-7-12 05:49:22

jssd 发表于 2017-7-11 06:48
楼主搞机器学习很牛B哇！这个训练了多久？

从一切混沌到这个用了4个小时

YFM · 发表于 2017-7-12 05:52:11

happywinds 发表于 2017-7-11 09:08
楼主大牛啊！佩服！卷积层采用的是GoogLeNet模型训练数据？车概率显示是用备选区域方式？ ...

只用了3层icp，加上3层卷积层，网络是直接随机初始化开始训练的用的KITTI dataset。

YFM · 发表于 2017-7-12 05:53:11

buck 发表于 2017-7-11 09:48
做的不错，楼主暑假回国没

还没毕业回不去啊

YFM · 发表于 2017-7-12 06:09:06

jasonzhu8888 发表于 2017-7-11 17:41
太赞同了。
有个说法，深度学习这块，学了一般又用不上。但搞IT的好像不得不学，否则就落伍了。
个人感觉 ...

这个属于核心算法类的了就像控制原理只学会了什么用也没有，但是放在一个具体的应用上面，就是一个画龙点睛之笔。基础的模数硬件电路做好，操作系统移植好，机械执行机构做好加上控制算法就变成KUKA这类工业机器人了。
这个也一样，很多做这个的人都只局限于用GPU训练一个网络然后就供起来了。但是其实和基础的互联网结合起来就解决了很多问题。再比如如果有PCB设计基础，单片机嵌入式设计基础，会FPGA，在FPGA上部署神经网络那就不一样了。比如深圳2016年中旬的一个创业公司 DeepHi。再者用fpga部署卷积网络要牵扯模型压缩，以及需要了解fpga从而为fpga而制定模型压缩算法。现在有的压缩算法是Deep compress 和 Xornet。

YFM · 发表于 2017-7-12 06:19:45

请戳西安子午大道.avi
https://www.youtube.com/watch?v=YwUMbfnqaFA

jasonzhu8888 · 发表于 2017-7-12 08:42:59

YFM 发表于 2017-7-12 06:09
这个属于核心算法类的了就像控制原理只学会了什么用也没有，但是放在一个具体的应用上面，就是一个画龙点 ...

看来以后会出很多定向功能的芯片啊。一旦人家出了芯片，相关部分就基本没自己的事了。

YFM · 发表于 2017-7-19 07:37:31

buck 发表于 2017-7-13 11:12
JI.chen在做大数据，你俩可以交流。

你最近怎么样?四年多没见了。

deadline2012 · 发表于 2017-12-4 15:05:45

楼主能提供点教程就好了

chun2495 · 发表于 2017-12-4 15:17:12

无限膜拜中有没有关于fpga在这方面的入门资料？

YFM · 发表于 2017-12-4 19:56:17

chun2495 发表于 2017-12-4 15:17
无限膜拜中有没有关于fpga在这方面的入门资料？

没有什么资料吧，基本的数字信号处理，和数字电路设计就够了吧。一般根据需求设计就好了，然后就是不断优化。

了无 · 发表于 2017-12-6 17:06:21

YFM 发表于 2017-12-4 19:56
没有什么资料吧，基本的数字信号处理，和数字电路设计就够了吧。一般根据需求设计就好了，然后就是不断优 ...

楼主给指一条路啊，门外汉怎么入门呢？现在搞得是VCU开发，机器学习说不定以后能用到里面

ele-madman · 发表于 2017-12-7 15:32:32

楼主的效果，opencv特征识别那套完全可以，识别率和训练集大小相关

YFM · 发表于 2018-1-10 00:13:07

ele-madman 发表于 2017-12-7 15:32
楼主的效果，opencv特征识别那套完全可以，识别率和训练集大小相关

opencv 的haar cascade 吗？：）
我楼主位放的效果图已经不是我的state of art了

taoxy_wx · 发表于 2018-1-10 08:11:24

老司机，带个路！
能否提供点教程啊，供新手入门

clesun · 发表于 2018-1-10 10:29:20

楼主，问一下我想识别图像中有几个东西，东西可以人为贴身颜色图标，只要能识别就行，怎么能简单实现

star_tale · 发表于 2018-1-10 13:29:24

开了眼界了，无人驾驶，如何上手呢

深度学习识别图像上汽车的区域，刚刚把网络训练出来

本帖子中包含更多资源

阿莫论坛20周年了！感谢大家的支持与爱护！！

本帖子中包含更多资源