画像ベースマルウェア分類器に対するセクション情報が与える影響

竹内廉,Vo Ngoc Khoi Nguyen,西垣正勝,大木哲史
コンピュータセキュリティ研究会2022(CSEC2022),CSEC2022-05,pp.1-8,2022年5月
[ Paper ]

Abstract

マルウェアは日々多様化し続けており,その数は指数関数的に増加し続けている.大量のマルウェアを効率的に解析するためにはマルウェアファミリーを特定することが重要であり,近年ではマルウェアを汎用的に分類可能な深層学習ベースの手法が多く提案されている.バイナリを画像で表現したマルウェア画像は,深層学習ベースの手法における入力として多く用いられてきた.しかし,これまでの検討では,マルウェアに生じる変動とマルウェア画像との関係については詳細に検証されてこなかった.そこで,本研究では,まず,ソースコードに対する難読化がコンパイル後のバイナリに与える影響について BinDiff を利用した調査を行う.次に,その調査結果を踏まえて,マルウェアバイナリの各セクションが分類精度にどの程度貢献しているかについて焦点を当てた検証を行う.具体的には,BIG2015 データセットを変換したマルウェア画像に対して,セクションを考慮した追加処理を施し,様々な条件下における実験を行い,分類精度に貢献している,もしくは悪影響を及ぼしているセクションを明らかにする.最後に,本研究での検証結果を元にマルウェア画像のより効果的な変換方法や学習方法の可能性を検討する.

Updated: