On deceiving malware classification with section injection: attack and defense using deep neural networks

Silva, Adeilson Antonio da

Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/36683

Tipo:	Dissertação
Título:	On deceiving malware classification with section injection: attack and defense using deep neural networks
Título(s) alternativo(s):	Sobre enganar a classificação de malware com injeção de seção: ataque e defesa usando redes neurais profundas
Autor(es):	Silva, Adeilson Antonio da
Primeiro Orientador:	Pamplona Segundo, Mauricio
metadata.dc.contributor.referee1:	Pamplona Segundo, Mauricio
metadata.dc.contributor.referee2:	Agüero, Karl Philips Apaza
metadata.dc.contributor.referee3:	Wyzykowski, André Brasil Vieira
Resumo:	Neste trabalho investigamos como modificar arquivos executáveis de software com o intuito de enganar sistemas automatizados de classificação de malwares. A principal contribuição deste trabalho consiste em uma metodologia para injetar bytes em um arquivo aleatoriamente e utilizar isso como ataque para reduzir a acurácia da classificação, mas também como um método de defesa, aumentando a quantidade de dados disponı́veis durante o treino desses sistemas. A injeção mencionada respeita o formato de arquivos do sistema operacional, de forma a garantir que o malware ainda será executável depois das modificações e não terá seu comportamento modificado. Nós reproduzimos cinco abordagens diferentes do estado da arte para classificação de malwares e avaliamos nosso esquema de injeção de dados: um baseado em GIST+KNN, três variações de CNN e uma Gated CNN. Nossos experimentos foram feitos utilizando um dataset disponı́vel publicamente com 9339 exemplares de malware de 25 famı́lias diferentes. Nossos resultados mostram que um simples aumento de 7% no tamanho do malware pode causar uma diminuição entre 25% e 40% na classificação de famı́lias. Eles mostram também que um sistema automatizado de classificação pode não ser tão confiável quanto inicialmente reportado na literatura. Nós avaliamos também a utilização de malwares modificados em conjunto aos originais para aumentar a robustez da rede contra os ataques mencionados. Os resultados apontam que uma combinação da reordenação das seções dos malwares com a injeção de dados pode resultar em uma melhora no desempenho da classificação. Os códigos utilizados estão disponı́veis em ⟨https://github.com/adeilsonsilva/malware-injection⟩.
Abstract:	We investigate how to modify executable files to deceive malware classification systems. This work’s main contribution is a methodology to inject bytes across a malware file randomly and use it both as an attack to decrease classification accuracy but also as a defensive method, augmenting the data available for training. It respects the operating system file format to make sure the malware will still execute after our injection and will not change its behavior. We reproduced five state-of-the-art malware classification approaches to evaluate our injection scheme: one based on GIST+KNN, three CNN variations and one Gated CNN. We performed our experiments on a public dataset with 9,339 malware samples from 25 different families. Our results show that a mere increase of 7% in the malware size causes an accuracy drop between 25% and 40% for malware family classification. They show that an automatic malware classification system may not be as trustworthy as initially reported in the literature. We also evaluate using modified malwares alongside the original ones to increase networks robustness against mentioned attacks. Results show that a combination of reordering malware sections and injecting random data can improve overall performance of the classification. Code available at ⟨https://github.com/adeilsonsilva/malware-injection⟩.
Palavras-chave:	Redes Neurais Análise de Malware Aprendizado de Máquina Malware (Software)
CNPq:	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Idioma:	eng
País:	Brasil
Editora / Evento / Instituição:	Universidade Federal da Bahia
Sigla da Instituição:	UFBA
metadata.dc.publisher.department:	Instituto de Computação - IC
metadata.dc.publisher.program:	Programa de Pós-Graduação em Ciência da Computação (PGCOMP)
Citação:	SILVA, Adeilson Antonio da. On deceiving malware classification with section injection: attack and defense using deep neural networks. 2022. 47 f. Dissertação (Mestrado em Ciência da Computação) Instituto de Computação, Universidade Federal da Bahia, Salvador, BA, 2022.
Tipo de Acesso:	Attribution-NonCommercial-ShareAlike 3.0 Brazil
metadata.dc.rights.uri:	http://creativecommons.org/licenses/by-nc-sa/3.0/br/
URI:	https://repositorio.ufba.br/handle/ri/36683
Data do documento:	22-Nov-2022
Aparece nas coleções:	Dissertação (PGCOMP)

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
PGCOMP-2022-Dissertação_Mestrado-Adeilson_Silva.pdf	Dissertação de Mestrado de Adeilson Antonio da Silva	5,46 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons