2018 IEEE ICIP见闻

非常幸运的参加了今年的IEEE ICIP,因此我来分享一下在这个国际会议上的所见所闻 🔥🔥🔥

前言

2018 IEEE International Conference on Image Processing(简称ICIP 2018),是图像处理国际会议,10月7号——10号在希腊雅典举办。
在会议水平和规模上,自然不如CVPRICCV。更不巧的是今年的ECCV正好在ICIP的前一个月,因此能来的大佬就少了。当然,这并不妨碍我这种弱鸡去学习一下,看看图像处理领域不同的论文和发展近况。

举办地

今年举办地在希腊的雅典。因为在欧洲,所以会议上有很多的都是来自欧洲学校的研究者。当然,这也并不妨碍中国学者们不远万里前来参会,因为雅典和圣托里尼岛也是不错的旅游目的地。
希腊在2010年爆发了经济危机,8年过去了,希腊渐渐走出了经济衰败的阴影。走在雅典街头,或多或少还能看到一些混乱颓败的踪迹。在会议上,有国内来的老师和我们说有好几个人在雅典被偷了钱,让我们与会的一些同学非常不安。雅典也算是一个旅游城市,在地铁上广场上餐厅中,都能见到各国的游客,当看见这些游客,会有些许的安心。
来到希腊,雅典卫城是一个必去的地方。公元前文明的残骸,在这里得以体现。特别是经过了欧洲动荡的中世纪,只有些许断垣得以残存,令人唏嘘。会让人不由的联想到英法联军火烧圆明园,文明的瑰宝被毁于一旦。
虽说举办地与学术本身并无关联,但能够在科研之余领略不同国家的风土人情,也是国际会议的重要一部分。

会议议程

会议虽说是4天,但第一天基本可以忽略不记。7号这天是Tutorial的环节,就是会议请了一些教授来进行长时间的授课,有不同的主题,应该是关于某一具体领域。当然,这些都是额外付费的很穷的我并没有注册这些。在Tutorial完了之后下午5点是报道注册领取会议材料,以及一个欢迎晚宴。因为担心自己的人身安全,很多人7点中吃的差不多就离开了会场。
之后的三天就比较类似了。上午9点开始有一个一小时的专题talk,之后外面进行Poster环节,上下午分别两场,不同的会议厅里举行不同专题Oral的报告。中间有茶歇,提供饼干等糕点,以及饮料。
其实整个会议的信息量还是挺大的,41个Lecture Session86个Poster Session。外面有大概三四十张不同的Poster,按类别分好区域,因此你可以挑选自己喜欢的主题去看。
会议厅里我就去的相对少一些,虽然Oral的论文质量可能会相对更高一点,但是因为讲整个PPT的时间也会很长,所以我还是选择在外面围观海报,会更有意思一些。
会议的论文已经在IEEE Xplore上有了,可以去检索相应的论文了。下面就挑选一些,我在整个会议里面看到的一些还算有意思的展示吧。

ICIP内容节选

首先是ICIP 2018的统计数据,1753的提交,839的通过,最后的接收率将近50%。

我们来看一下不同领域接收率的情况,可以看到IVIU的通过率最高28%
这是第一天上午的Talk,来自南加州大学的一个韩国人讲CNN。其实讲的是自己的研究内容。不用反向传播,只用正向(类似滤波器设计)去设计卷积网络,当然只能设计一些很简单的了,他说好处是可以抵御对抗样本的攻击。反正我觉得有点扯。
之后就碰到了一个学校的了。遥感院的学长,做的还是图像拼接。这一块我不是很熟,但和学长聊了一下这一届的会议。后来中午一起去吃了东西。
非常热闹的第一天的Poster Session
下面是一个屏幕内容的评价。考虑到了Edge,也就是边缘信息。并且魔改了一下SSIM,把Edge信息加入,提升了一下屏幕内容质量评价的效果。
一个日本团队做的,很有意思的一个项目。简而言之,优化图片来提升商品的用户点击率。挺有商业前景的。像在淘宝上,一般我就是看图片好不好看决定点进去看商品详情与否。
下面这个是提取视频中文档边界。用的是数学形态学的方法。可能效率上会更好一些。当然,现在文档边界检测的应用很常见了,如微软的Office Lens,扫描全能王等。
在7号上午认识的一个剑桥的博士,恰巧也是做质量评价方向的。
做图像增强的。让我想起了数字图像处理课让我们探究的均衡化的方法。

一个印度小哥的作品,讲真挺水的。我觉得和我数字图像处理课程设计有的一拼。其实就是根据文本去做图像选择与风格转换,可能之前没什么人做这个问题吧。
做一个课题的韩国小哥,英语表达能力太差,基本听不懂他讲的。好在前一天晚上看了一下论文。答题就是用Pairwise的方法去做这个任务,把分类问题变成比较问题。用了一个类似Focal Loss的损失函数。可以同时做Ranking以及Classification的任务。最后的指标也还可以。其实类似的点子之前我也有想到过,但是因为我太菜了,没实现出来 Orz
因特尔做的一个工作,用进化算法来自动调节ISP的参数。这个挺有意思的,让我想到了,很多时候不同品牌手机用的感光元件可能是同一个型号,但是拍出来照片的质量会有差别,原因就在于ISP的调教。
又看到了校徽。右边是做SR的。看标题是考虑到了区域的影响。
这个任务做的是水底视频中海洋生物的探测。这个Paper关注了数据增强的方法,用GAN来生成类似的图片。其实应该有类似的工作把GAN用到Data Augmentation。其实我一直对把GAN生成的图片作为Ground Truth训练图片这个表示一些疑虑。
下面这个纯粹只是在中间的图中看到了熟悉的U-Net、SPP、DeepLab,后两者在物体识别领域用到,前者是在Conditional Generative Adversarial Network里面用到了。U-Net的Shortpath可能让其在图像生成上会有更好的表现。
隔壁华科的。做目标追踪的。
在景区门口认识的一个清华电子系小哥帮站的。就是考虑到旋转等变形,先把它变回去。
一个好看的法国小姐姐。Poster也挺好看。用了U-Net和Patch-GAN,提出了一个深度估计的Loss,和一堆其它Loss比较。
上海交通大学,图像鉴黄。数据集是Self-collected的,哈哈。随后被媒体报道:《ICIP2018 | 图像鉴黄做得好,健康上网少烦恼》,很有意思了。
这个做的是车辆类型识别,而且据说已经在法国很多地方部署了。方法不难,就是用了CNN,比较有借鉴意义的就是裁剪网络来解决过拟合的问题。
下面这个是用小波变换做识别的。他被问的最多的就是:“为什么不用CNN?”,传统方法在2018年的会议上可以说是一股清流了。
这个课题很有意思,用照片做PM2.5的估计。虽然听起来有点扯淡,不过给不用专业仪器来快速估计PM2.5提供了一个新思路。
雨滴检测问题。用了滑动窗口去代替传统的Region Proposal(因为雨滴形状色泽等多变),裁剪了CNN。英国小哥的英式发音很有辨识度。
这个做的是对抗样本攻击。原理很简单,简而言之就是给图片打补丁来让CNN产生错误的分类结果。而这些干扰信息量很小。
一个年长的日本教授,激动的给我展示了视频去噪的效果。虽然Poster上全是公式,但他讲解的还是挺通俗的。用了3D-DFT,因此算法会非常慢,主要是求解逆傅里叶很慢,不过效果还是很OK的。
来自挪威大学小哥,是个中国人。之前在VQA的相关Session经常看到他,一开始以为是日本人来着。最后我们的Poster在同一场。也算是缘分了。
这个意大利小哥,做的是有人脸图片的美学评估。方法和我的基本类似。更巧的是我们最后一天同一班飞机去了罗马。

我的展示

其实轮到我的时候已经是最后一天下午了,人并没有第一天的那么多。
Poster做的略微小了一些,比例其实也不应该按CVPR的2:1来做的。被问到最多的一个问题就是我的Local View是怎么来的。反正在现场被各种人问了之后对自己的工作会有更深刻的理解。也会有很多人来提出潜在的改进的方法。
碰到几个教授问我是博士后还是博士,包括国内来的,他们都挺惊讶我是本科的。还有一个Session Chair说他的学生在做这个课题,但一直没有取得什么进展。忘记在Poster上留邮箱了。
印象最深的是一个ARM来的小姐姐,和我说应该趁机会看看他们胸牌上面的名字,然后去LinkedIn或者直接去Social一下,说不定对以后读Grad有帮助。其实会议本身就是一个Social的平台,我也有机会认识了很多人。

感想

通过参加这个会议,可以看到各种不同图像处理领域最新的进展和成果。你也可以比较容易的去理解一些新点子和方法,它们其实都是一些非常简单的一些小创意。我们可以尝试去借鉴这些点子,然后把它运用到自己今后的研究工作中去。
在这个“人工智能”一词盛行的今天,在CNN占领了半壁江山的图像处理会议,还是要向那些坚持使用传统图像处理/数学方法、忠于理论研究的研究工作者表示致敬。
会议很大部分人都是来社交的,同一个研究领域,不同国家的教授互相认识,汲取新的一些点子。作为学生也能够认识其它学校做同一个领域的同学并互相交流。这些就是会议最大的意义。
非常怀念会议茶歇的希腊酸奶+果酱+蜂蜜。实在是好吃 😋

Comments