豊田工大Release
知能情報メディア研究室 近藤佑樹さんと浮田教授が国際会議(MVA2021)で最優秀実用論文賞を受賞
2021.09.02
7月25~28日に開催された国際会議17th International Conference on Machine Vision Applications (MVA2021) でBest Practical Paper Award(最優秀実用論文賞)を受賞.
- 論文名
Crack Segmentation for Low-Resolution Images using Joint Learning with Super-Resolution
- 受賞者
豊田工業大学 知能情報メディア研究室
工学部 先端工学基礎学科 学部4年:近藤佑樹さん
浮田宗伯 教授
MVA2021の詳細
International Conference on Machine Vision Applications (MVA) は1988年に第1回が開催されて以降,2年に一度開催され続けており,今年のMVA2021で第17回となる国際会議です.国際会議MVAを主宰するMVA組織委員会(http://www.mva-org.jp/)は,主に日本の学界や産業界のマシンビジョンとアプリケーションの研究者で構成される専門家団体です.
MVA2021では,全127件の投稿論文からプログラム委員会(エリアチェア19人,プログラム委員174人)による査読プロセスを通じて,マシンビジョンコミュニティで共有する価値の高い口頭発表用の24論文とポスター発表用の41論文が採択されました.MVA2021では,Best Paper Award,Best Practical Paper Award,Best Poster Presentation Award,Most Influential Paper over the Decade Awardの4つの賞が表彰されました.今回受賞したBest Practical Paper Awardは,論文で発表された技術が製品・商品レベルに近いという観点で,最も実応用上で優れた論文の著者に与えられています.
論文概要
図1. 提案手法の概要図.統合学習によって,セグメンテーションネットワークにはセグメンテーションに最適化された超解像画像が入力される.
図2. 欠陥セグメンテーション結果.画像補間Bicubicによって拡大された画像上でのセグメンテーション結果(Bicubic→Network SS)よりも,提案手法は精密なセグメンテーションを実現している.また,出力された超解像結果は,セグメンテーション結果を人が解釈する際に利用可能である.
近藤さん,浮田教授は「Crack Segmentation for Low-Resolution Images using Joint Learning with Super-Resolution」というタイトルで口頭発表をしました.本論文では,低解像画像を対象として高解像な欠陥セグメンテーション*1を実現する手法を提案しました.この技術は,欠陥が発生しうる領域を遠方から撮影せざるを得ない環境下(ドローンによる撮影時,強風によって壁面に近づけない煙突等の高高度環境など)で,欠陥領域 の画像解像度が低下してしまった場合でも,その欠陥の自動検出を実現します.提案手法は,以下の2つのアプローチによって,構成されています.
ⅰ.深層学習ベースの超解像モデル*2の応用とEnd-to-endな統合学習の適用を組み込んだCSSR(Crack Segmentation with Super Resolution)を提案.低解像度画像から後段のセグメンテーションに最適化された高解像度画像を生成し,高解像なセグメンテーションを実現.
ⅱ.欠陥セグメンテーションを行う深層学習モデル最適化のための,欠陥境界を基準とした損失関数 Boundary Combo loss を提案.欠陥の大域的構造と局所的構造を同時に最適化することで,薄く検出の難しい欠陥の検出や複雑な欠陥境界の検出を同時に実現.
実験の結果,提案手法は従来手法よりも優れた手法であることが示され,定量的*3・定性的にも高解像画像利用時相当の精密なセグメンテーションであることが確認されました.
- 論文 http://www.mva-org.jp/Proceedings/2021/papers/O1-1-2.pdf
- コード https://github.com/Yuki-11/CSSR
- MVA2021公式サイト http://www.mva-org.jp/mva2021/
- 受賞記事 http://www.mva-org.jp/archives.BestPracticalPaperAward.php
*1; 欠陥セグメンテーション;欠陥のある領域をピクセル単位で推定する技術です.
*2; 超解像は低解像画像を高解像画像に復元する技術であり,近年医療,工業,エンターテインメントなど様々な分野で応用が期待されています.知能情報メディア研究室では,超解像に関する研究に力を入れており,数多くの実績(参考;[1]-[5])を挙げています.
*3;セグメンテーションの評価指標IoUにおいて,提案手法のIoUは高解像画像入力時のIoUの97.3%の性能を達成しました.
[1] Muhammad Haris, Greg Shakhnarovich, and Norimichi Ukita, Space-Time-Aware Multi-Resolution Video Enhancement, Proc. of IEEE Conference on Computer Vision and Pattern Recognition, USA, June, 2020.
[2] Muhammad Haris, Greg Shakhnarovich, and Norimichi Ukita, Recurrent Back-projection Network for Video Super-resolution, Proc. of IEEE Conference on Computer Vision and Pattern Recognition, USA, June, 2019.
[3] Muhammad Haris, Greg Shakhnarovich, and Norimichi Ukita, Deep Back-Projection Networks For Super-Resolution, Proc. of IEEE Conference on Computer Vision and Pattern Recognition, USA, June, 2018.
[4] Winner Award (1st place) in NTIRE 2018 challenge on image super-resolution (CVPR Workshop).
[5] 1st place in PIRM 2018 perceptual SR challenge (ECCV Workshop)
受賞者のコメント
この度は"Best Practical Paper Award"という大変光栄な賞を頂くことができ,大変うれしく思います.本論文は人生初投稿の論文でもありましたが,この投稿の実現は昨年11月からリモートを通じて,浮田先生を初めとした研究室の皆様の熱心なご指導と温かいご支援の賜物であり,心より感謝申し上げます.今後もコンピュータビジョンの発展に貢献できる研究を目指し,邁進してまいります.(近藤佑樹さん)
MVA2021で発表した知能情報メディア研究室メンバー一同 | MVA2021 Best Practical Paper Awardの賞状および副賞 |
*写真撮影は感染症予防対策を講じた上で実施