2018 IEEE ICIP见闻

非常幸运的参加了今年的IEEE ICIP，因此我来分享一下在这个国际会议上的所见所闻 🔥🔥🔥

前言

2018 IEEE International Conference on Image Processing（简称ICIP 2018），是图像处理国际会议，10月7号——10号在希腊雅典举办。
在会议水平和规模上，自然不如CVPR和ICCV。更不巧的是今年的ECCV正好在ICIP的前一个月，因此能来的大佬就少了。当然，这并不妨碍我这种弱鸡去学习一下，看看图像处理领域不同的论文和发展近况。

举办地

今年举办地在希腊的雅典。因为在欧洲，所以会议上有很多的都是来自欧洲学校的研究者。当然，这也并不妨碍中国学者们不远万里前来参会，因为雅典和圣托里尼岛也是不错的旅游目的地。
希腊在2010年爆发了经济危机，8年过去了，希腊渐渐走出了经济衰败的阴影。走在雅典街头，或多或少还能看到一些混乱颓败的踪迹。在会议上，有国内来的老师和我们说有好几个人在雅典被偷了钱，让我们与会的一些同学非常不安。雅典也算是一个旅游城市，在地铁上广场上餐厅中，都能见到各国的游客，当看见这些游客，会有些许的安心。
来到希腊，雅典卫城是一个必去的地方。公元前文明的残骸，在这里得以体现。特别是经过了欧洲动荡的中世纪，只有些许断垣得以残存，令人唏嘘。会让人不由的联想到英法联军火烧圆明园，文明的瑰宝被毁于一旦。
虽说举办地与学术本身并无关联，但能够在科研之余领略不同国家的风土人情，也是国际会议的重要一部分。

会议议程

会议虽说是4天，但第一天基本可以忽略不记。7号这天是Tutorial的环节，就是会议请了一些教授来进行长时间的授课，有不同的主题，应该是关于某一具体领域。当然，这些都是额外付费的，很穷的我并没有注册这些。在Tutorial完了之后下午5点是报道注册领取会议材料，以及一个欢迎晚宴。因为担心自己的人身安全，很多人7点中吃的差不多就离开了会场。
之后的三天就比较类似了。上午9点开始有一个一小时的专题talk，之后外面进行Poster环节，上下午分别两场，不同的会议厅里举行不同专题Oral的报告。中间有茶歇，提供饼干等糕点，以及饮料。
其实整个会议的信息量还是挺大的，41个Lecture Session，86个Poster Session。外面有大概三四十张不同的Poster，按类别分好区域，因此你可以挑选自己喜欢的主题去看。
会议厅里我就去的相对少一些，虽然Oral的论文质量可能会相对更高一点，但是因为讲整个PPT的时间也会很长，所以我还是选择在外面围观海报，会更有意思一些。
会议的论文已经在IEEE Xplore上有了，可以去检索相应的论文了。下面就挑选一些，我在整个会议里面看到的一些还算有意思的展示吧。

ICIP内容节选

首先是ICIP 2018的统计数据，1753的提交，839的通过，最后的接收率将近50%。

我们来看一下不同领域接收率的情况，可以看到IVIU的通过率最高28%

这是第一天上午的Talk，来自南加州大学的一个韩国人讲CNN。其实讲的是自己的研究内容。不用反向传播，只用正向（类似滤波器设计）去设计卷积网络，当然只能设计一些很简单的了，他说好处是可以抵御对抗样本的攻击。反正我觉得有点扯。

之后就碰到了一个学校的了。遥感院的学长，做的还是图像拼接。这一块我不是很熟，但和学长聊了一下这一届的会议。后来中午一起去吃了东西。

非常热闹的第一天的Poster Session

下面是一个屏幕内容的评价。考虑到了Edge，也就是边缘信息。并且魔改了一下SSIM，把Edge信息加入，提升了一下屏幕内容质量评价的效果。

一个日本团队做的，很有意思的一个项目。简而言之，优化图片来提升商品的用户点击率。挺有商业前景的。像在淘宝上，一般我就是看图片好不好看决定点进去看商品详情与否。

下面这个是提取视频中文档边界。用的是数学形态学的方法。可能效率上会更好一些。当然，现在文档边界检测的应用很常见了，如微软的Office Lens，扫描全能王等。

在7号上午认识的一个剑桥的博士，恰巧也是做质量评价方向的。

做图像增强的。让我想起了数字图像处理课让我们探究的均衡化的方法。

一个印度小哥的作品，讲真挺水的。我觉得和我数字图像处理课程设计有的一拼。其实就是根据文本去做图像选择与风格转换，可能之前没什么人做这个问题吧。

做一个课题的韩国小哥，英语表达能力太差，基本听不懂他讲的。好在前一天晚上看了一下论文。答题就是用Pairwise的方法去做这个任务，把分类问题变成比较问题。用了一个类似Focal Loss的损失函数。可以同时做Ranking以及Classification的任务。最后的指标也还可以。其实类似的点子之前我也有想到过，但是因为我太菜了，没实现出来 Orz

因特尔做的一个工作，用进化算法来自动调节ISP的参数。这个挺有意思的，让我想到了，很多时候不同品牌手机用的感光元件可能是同一个型号，但是拍出来照片的质量会有差别，原因就在于ISP的调教。

又看到了校徽。右边是做SR的。看标题是考虑到了区域的影响。

这个任务做的是水底视频中海洋生物的探测。这个Paper关注了数据增强的方法，用GAN来生成类似的图片。其实应该有类似的工作把GAN用到Data Augmentation。其实我一直对把GAN生成的图片作为Ground Truth训练图片这个表示一些疑虑。

下面这个纯粹只是在中间的图中看到了熟悉的U-Net、SPP、DeepLab，后两者在物体识别领域用到，前者是在Conditional Generative Adversarial Network里面用到了。U-Net的Shortpath可能让其在图像生成上会有更好的表现。

隔壁华科的。做目标追踪的。

在景区门口认识的一个清华电子系小哥帮站的。就是考虑到旋转等变形，先把它变回去。

一个好看的法国小姐姐。Poster也挺好看。用了U-Net和Patch-GAN，提出了一个深度估计的Loss，和一堆其它Loss比较。

上海交通大学，图像鉴黄。数据集是Self-collected的，哈哈。随后被媒体报道：《ICIP2018 | 图像鉴黄做得好，健康上网少烦恼》，很有意思了。

这个做的是车辆类型识别，而且据说已经在法国很多地方部署了。方法不难，就是用了CNN，比较有借鉴意义的就是裁剪网络来解决过拟合的问题。

下面这个是用小波变换做识别的。他被问的最多的就是：“为什么不用CNN？”，传统方法在2018年的会议上可以说是一股清流了。

这个课题很有意思，用照片做PM2.5的估计。虽然听起来有点扯淡，不过给不用专业仪器来快速估计PM2.5提供了一个新思路。

雨滴检测问题。用了滑动窗口去代替传统的Region Proposal（因为雨滴形状色泽等多变），裁剪了CNN。英国小哥的英式发音很有辨识度。

这个做的是对抗样本攻击。原理很简单，简而言之就是给图片打补丁来让CNN产生错误的分类结果。而这些干扰信息量很小。

一个年长的日本教授，激动的给我展示了视频去噪的效果。虽然Poster上全是公式，但他讲解的还是挺通俗的。用了3D-DFT，因此算法会非常慢，主要是求解逆傅里叶很慢，不过效果还是很OK的。

来自挪威大学小哥，是个中国人。之前在VQA的相关Session经常看到他，一开始以为是日本人来着。最后我们的Poster在同一场。也算是缘分了。

这个意大利小哥，做的是有人脸图片的美学评估。方法和我的基本类似。更巧的是我们最后一天同一班飞机去了罗马。

我的展示

其实轮到我的时候已经是最后一天下午了，人并没有第一天的那么多。
Poster做的略微小了一些，比例其实也不应该按CVPR的2:1来做的。被问到最多的一个问题就是我的Local View是怎么来的。反正在现场被各种人问了之后对自己的工作会有更深刻的理解。也会有很多人来提出潜在的改进的方法。
碰到几个教授问我是博士后还是博士，包括国内来的，他们都挺惊讶我是本科的。还有一个Session Chair说他的学生在做这个课题，但一直没有取得什么进展。忘记在Poster上留邮箱了。
印象最深的是一个ARM来的小姐姐，和我说应该趁机会看看他们胸牌上面的名字，然后去LinkedIn或者直接去Social一下，说不定对以后读Grad有帮助。其实会议本身就是一个Social的平台，我也有机会认识了很多人。

感想

通过参加这个会议，可以看到各种不同图像处理领域最新的进展和成果。你也可以比较容易的去理解一些新点子和方法，它们其实都是一些非常简单的一些小创意。我们可以尝试去借鉴这些点子，然后把它运用到自己今后的研究工作中去。
在这个“人工智能”一词盛行的今天，在CNN占领了半壁江山的图像处理会议，还是要向那些坚持使用传统图像处理/数学方法、忠于理论研究的研究工作者表示致敬。
会议很大部分人都是来社交的，同一个研究领域，不同国家的教授互相认识，汲取新的一些点子。作为学生也能够认识其它学校做同一个领域的同学并互相交流。这些就是会议最大的意义。
非常怀念会议茶歇的希腊酸奶+果酱+蜂蜜。实在是好吃 😋

Search

Fing's Blog

2018 IEEE ICIP见闻

前言

举办地

会议议程

ICIP内容节选

我的展示

感想

Comments

Post a Comment