搜索
bottom↓
回复: 48

深度学习识别图像上汽车的区域,刚刚把网络训练出来

  [复制链接]

出0入0汤圆

发表于 2017-7-11 02:35:09 | 显示全部楼层 |阅读模式
平台                        tensorflow
数据集                    KITTI街景
卷积网络结构        类GoogLeNet 8层网络使用了GoogLeNet的ICP层
                                RGB image---->5x5x64conv(stride 2)---->Maxpool(3x3 strid 2)---->3x3x80conv(stride 1)----->ICP0(1x1,3x3,5x5,maxpool)---
                                ---->Maxpool(3x3 strid 2) ----->ICP1(1x1,3x3,5x5,maxpool)----->Maxpool(3x3 strid 2)----->ICP2(1x1,3x3,5x5, maxpool)----
                                ---->3x3x2conv(stride 1)------> posibility map

下面是结果图每张图有4个plot 每个plot从上到下依次是:自然图像输入,Car概率,Non-Car概率,100%Car区域。




















本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

出0入0汤圆

发表于 2017-7-11 05:59:08 来自手机 | 显示全部楼层
牛掰,看上去很深奥。老司机,求带路,指导一下,怎么上手。

出0入55汤圆

发表于 2017-7-11 06:48:46 | 显示全部楼层
楼主搞机器学习很牛B哇!这个训练了多久?

出0入0汤圆

发表于 2017-7-11 07:47:01 | 显示全部楼层
多图杀流量啊,哈哈哈

出0入46汤圆

发表于 2017-7-11 08:00:20 | 显示全部楼层
很早以前研究过一阵子图像识别,得出一个结论:坑太大了,不够自己填的。
现在看到这个,感觉深度学习在一些领域,真的很厉害。上面的这种识别率,在传统算法实现上,估计花1000倍的精力都达不到。

出0入442汤圆

发表于 2017-7-11 08:08:51 来自手机 | 显示全部楼层
jasonzhu8888 发表于 2017-7-11 08:00
很早以前研究过一阵子图像识别,得出一个结论:坑太大了,不够自己填的。
现在看到这个,感觉深度学习在一 ...

传统算法做不到。想都不要想。深度学习啊,相当于变相的几十次高阶方程,参数几万到几百万个,在几十维下做拟合。这些参数手调直接到手软。

出0入0汤圆

发表于 2017-7-11 08:14:24 来自手机 | 显示全部楼层
CPU够快何需调到手软

出0入0汤圆

发表于 2017-7-11 09:08:19 来自手机 | 显示全部楼层
楼主大牛啊!佩服!卷积层采用的是GoogLeNet模型训练数据?车概率显示是用备选区域方式?

出0入0汤圆

发表于 2017-7-11 09:34:30 | 显示全部楼层
老司机,带个路!

出0入0汤圆

发表于 2017-7-11 09:42:11 来自手机 | 显示全部楼层
R8C 发表于 2017-7-11 08:14
CPU够快何需调到手软

典型的只要推力足,火砖都可以飞。
英特尔cpu默秒全,你怎么不用英特尔的智能手机。
竞争找最优,才是合适的。

出10入0汤圆

发表于 2017-7-11 09:59:16 | 显示全部楼层
牛逼得一踏糊涂!!!!

出0入90汤圆

发表于 2017-7-11 10:01:17 | 显示全部楼层
强         

出0入0汤圆

发表于 2017-7-11 10:07:42 | 显示全部楼层
很牛,大的、小的,不同角度的都能识别。

出0入0汤圆

发表于 2017-7-11 10:07:53 来自手机 | 显示全部楼层
厉害,我还在学习CNN的,求老司机带个路。

出0入0汤圆

发表于 2017-7-11 10:08:49 来自手机 | 显示全部楼层
目前基本掌握NN 真在学习CNN

出0入25汤圆

发表于 2017-7-11 10:12:27 | 显示全部楼层

楼主厉害,,
据说深度学习在图像识别领域非常成功!!

出0入0汤圆

发表于 2017-7-11 11:15:40 | 显示全部楼层
祝贺楼主,深度学习将会在以后的各个领域发挥越来越大的作用

出0入0汤圆

发表于 2017-7-11 11:19:05 | 显示全部楼层
还有一个 发表于 2017-7-11 10:07
很牛,大的、小的,不同角度的都能识别。

颜色能识别么?

出0入0汤圆

发表于 2017-7-11 11:20:05 | 显示全部楼层
比如能否根据果的颜色 判断出一个苹果是熟的还是不熟的?

出0入0汤圆

发表于 2017-7-11 11:26:54 来自手机 | 显示全部楼层
血影神功 发表于 2017-7-11 11:20
比如能否根据果的颜色 判断出一个苹果是熟的还是不熟的?

那个需要另外训练了

出0入14汤圆

发表于 2017-7-11 11:41:48 | 显示全部楼层
很牛的,现在的ADAS可以识别几个车的是用什么方案的?

出5入190汤圆

发表于 2017-7-11 11:47:25 来自手机 | 显示全部楼层
老司机有没有机器学习入门指引,外行好羡慕

出0入0汤圆

发表于 2017-7-11 14:30:38 | 显示全部楼层
看上去好直观啊,

出0入0汤圆

发表于 2017-7-11 15:01:09 | 显示全部楼层
效果不错啊,tensoflow好像只能在LINUX平台运行吧,期待楼主教程啊。

出0入0汤圆

发表于 2017-7-11 15:07:56 | 显示全部楼层
好厉害啊!不受光照和颜色影响,车辆和行人都能识别准确,膜拜~~

出0入46汤圆

发表于 2017-7-11 17:41:26 | 显示全部楼层
wye11083 发表于 2017-7-11 08:08
传统算法做不到。想都不要想。深度学习啊,相当于变相的几十次高阶方程,参数几万到几百万个,在几十维下 ...

太赞同了。
有个说法,深度学习这块,学了一般又用不上。但搞IT的好像不得不学,否则就落伍了。
个人感觉是,要学这块,就得找个还没被关注的领域,用心花精力研究,搞个模型,收集学习数据。有一定效果之后,再杀出去。

出0入0汤圆

发表于 2017-7-11 17:53:26 来自手机 | 显示全部楼层
jasonzhu8888 发表于 2017-7-11 17:41
太赞同了。
有个说法,深度学习这块,学了一般又用不上。但搞IT的好像不得不学,否则就落伍了。
个人感觉 ...

方便说具体点吗?谢谢

出0入0汤圆

发表于 2017-7-11 18:01:43 | 显示全部楼层
这个把抽象的AI一下拉到现实中

出0入0汤圆

发表于 2017-7-11 21:01:26 来自手机 | 显示全部楼层
不明觉厉 把高大上变形象了

出0入0汤圆

发表于 2017-7-11 22:03:50 | 显示全部楼层
我同事也在做,用的caffe框架,用GPU算,能够在一个视频流中用框框框出车,他说是外国人训练的模型。

出0入0汤圆

 楼主| 发表于 2017-7-12 05:49:22 | 显示全部楼层
jssd 发表于 2017-7-11 06:48
楼主搞机器学习很牛B哇!这个训练了多久?

从一切混沌到这个用了4个小时

出0入0汤圆

 楼主| 发表于 2017-7-12 05:52:11 | 显示全部楼层
happywinds 发表于 2017-7-11 09:08
楼主大牛啊!佩服!卷积层采用的是GoogLeNet模型训练数据?车概率显示是用备选区域方式? ...

只用了3层icp,加上3层卷积层, 网络是直接随机初始化开始训练的用的KITTI dataset。

出0入0汤圆

 楼主| 发表于 2017-7-12 05:53:11 | 显示全部楼层
buck 发表于 2017-7-11 09:48
做的不错,楼主暑假回国没

还没毕业回不去啊

出0入0汤圆

 楼主| 发表于 2017-7-12 06:09:06 | 显示全部楼层
jasonzhu8888 发表于 2017-7-11 17:41
太赞同了。
有个说法,深度学习这块,学了一般又用不上。但搞IT的好像不得不学,否则就落伍了。
个人感觉 ...

这个属于核心算法类的了就像控制原理只学会了什么用也没有,但是放在一个具体的应用上面,就是一个画龙点睛之笔。基础的模数硬件电路做好,操作系统移植好,机械执行机构做好加上控制算法就变成KUKA这类工业机器人了。
这个也一样,很多做这个的人都只局限于用GPU训练一个网络然后就供起来了。但是其实和基础的互联网结合起来就解决了很多问题。再比如如果有PCB设计基础,单片机嵌入式设计基础,会FPGA,在FPGA上部署神经网络那就不一样了。 比如深圳2016年中旬的一个创业公司 DeepHi。  再者用fpga部署卷积网络要牵扯模型压缩,以及需要了解fpga从而为fpga而制定模型压缩算法。 现在有的压缩算法是Deep compress 和 Xornet。

出0入0汤圆

 楼主| 发表于 2017-7-12 06:19:45 | 显示全部楼层


请戳 西安子午大道.avi
https://www.youtube.com/watch?v=YwUMbfnqaFA

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

出0入46汤圆

发表于 2017-7-12 08:42:59 | 显示全部楼层
YFM 发表于 2017-7-12 06:09
这个属于核心算法类的了就像控制原理只学会了什么用也没有,但是放在一个具体的应用上面,就是一个画龙点 ...

看来以后会出很多定向功能的芯片啊。一旦人家出了芯片,相关部分就基本没自己的事了。

出0入0汤圆

 楼主| 发表于 2017-7-19 07:37:31 来自手机 | 显示全部楼层
buck 发表于 2017-7-13 11:12
JI.chen在做大数据,你俩可以交流。

你最近怎么样?四年多没见了。

出0入0汤圆

发表于 2017-12-4 15:05:45 | 显示全部楼层
楼主能提供点教程就好了

出25入84汤圆

发表于 2017-12-4 15:17:12 | 显示全部楼层
无限膜拜中 有没有关于fpga在这方面的入门资料?

出0入0汤圆

 楼主| 发表于 2017-12-4 19:56:17 来自手机 | 显示全部楼层
chun2495 发表于 2017-12-4 15:17
无限膜拜中 有没有关于fpga在这方面的入门资料?

没有什么资料吧,基本的数字信号处理,和数字电路设计就够了吧。一般根据需求设计就好了,然后就是不断优化。

出0入8汤圆

发表于 2017-12-6 17:06:21 | 显示全部楼层
YFM 发表于 2017-12-4 19:56
没有什么资料吧,基本的数字信号处理,和数字电路设计就够了吧。一般根据需求设计就好了,然后就是不断优 ...

楼主给指一条路啊,门外汉怎么入门呢?现在搞得是VCU开发,机器学习说不定以后能用到里面

出0入0汤圆

发表于 2017-12-7 15:32:32 来自手机 | 显示全部楼层
楼主的效果,opencv特征识别那套完全可以,识别率和训练集大小相关

出0入0汤圆

 楼主| 发表于 2018-1-10 00:13:07 来自手机 | 显示全部楼层
ele-madman 发表于 2017-12-7 15:32
楼主的效果,opencv特征识别那套完全可以,识别率和训练集大小相关

opencv 的haar cascade 吗?:)
我楼主位放的效果图已经不是我的state of art了

出0入0汤圆

发表于 2018-1-10 08:11:24 | 显示全部楼层
老司机,带个路!
能否提供点教程啊,供新手入门

出0入4汤圆

发表于 2018-1-10 10:29:20 | 显示全部楼层
楼主,问一下我想识别图像中有几个东西,东西可以人为贴身颜色图标,只要能识别就行,怎么能简单实现

出0入0汤圆

发表于 2018-1-10 13:29:24 | 显示全部楼层
开了眼界了,无人驾驶,如何上手呢
回帖提示: 反政府言论将被立即封锁ID 在按“提交”前,请自问一下:我这样表达会给举报吗,会给自己惹麻烦吗? 另外:尽量不要使用Mark、顶等没有意义的回复。不得大量使用大字体和彩色字。【本论坛不允许直接上传手机拍摄图片,浪费大家下载带宽和论坛服务器空间,请压缩后(图片小于1兆)才上传。压缩方法可以在微信里面发给自己(不要勾选“原图),然后下载,就能得到压缩后的图片】。另外,手机版只能上传图片,要上传附件需要切换到电脑版(不需要使用电脑,手机上切换到电脑版就行,页面底部)。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|amobbs.com 阿莫电子技术论坛 ( 粤ICP备2022115958号, 版权所有:东莞阿莫电子贸易商行 创办于2004年 (公安交互式论坛备案:44190002001997 ) )

GMT+8, 2024-4-20 19:04

© Since 2004 www.amobbs.com, 原www.ourdev.cn, 原www.ouravr.com

快速回复 返回顶部 返回列表