Malware Classifier: ML-Powered PE File Detection | Quantic MSSE Intro to machine learning Project

Автор: WisdomWord GH

Загружено: 2026-02-28

Просмотров: 8

Описание: Malware Classifier using Machine Learning
Quantic School of Business and Technology - MSSE Program

This video demonstrates a production-ready malware classification system that analyzes PE (Portable Executable) files using machine learning. The project was completed in partial fulfillment of the Introduction to Machine Learning course at Quantic School of Business and Technology.

Live Application:
https://tetteh-apotey-malware-classif...

GitHub Repository:
https://github.com/life2allsofts/malw...
(Private - quantic-grader added as collaborator)

PROJECT OVERVIEW

The application uses an XGBoost model with 17 PE header features to classify executable files as malware or benign software. Key features include:

98.03% accuracy on test set

99.59% AUC-ROC for excellent discrimination

17 PE header features (no data leakage)

Bias correction with 0.6 threshold

Fully automated CI/CD pipeline (51 successful runs)

APPLICATION FEATURES

File Upload Analysis

Upload .exe, .dll, .sys, .ocx, .scr, .cpl files

Extracts SHA-256 hash and entropy

Real-time prediction with confidence scores

Manual Input

Enter all 17 PE features manually
Sample templates for testing
Understand how features influence predictions

Batch Processing
CSV upload for multiple files
Download predictions.csv with results
Ideal for bulk analysis

Model Information
Feature importance visualization
Confusion matrix and performance metrics
Complete transparency

CI/CD PIPELINE

The project includes a fully automated GitHub Actions pipeline that:
Runs tests on every push (16 tests in 46 seconds)
Checks for prior bias and model sanity
Auto-deploys to Hugging Face Spaces on success
Performs smoke tests to verify deployment
Total workflow runs: 51 | Latest status: Passing

MODEL PERFORMANCE
Metric Value
Accuracy 98.03%
Precision 98.24%
Recall 98.37%
F1-Score 98.30%
AUC-ROC 99.59%

Confusion Matrix (Test Set):

Predicted
BENIGN MALWARE
Actual BENIGN 1648 42
Actual MALWARE 38 2287
False Positives: 42
False Negatives: 38
Total Errors: 80 (1.99% error rate)

TECHNOLOGIES USED
Machine Learning: XGBoost, scikit-learn, pandas, numpy
Web Framework: Flask, Jinja2 templates
Deployment: Hugging Face Spaces, Docker

CI/CD: GitHub Actions

AI Tools: DeepSeek AI (97%), ChatGPT (2%), GitHub Copilot (1%)

DOCUMENTATION
All project documentation is available in the GitHub repository:
Evaluation and Design:
https://github.com/life2allsofts/malw...

AI Tooling Strategy:
https://github.com/life2allsofts/malw...

Deployment Information:
https://github.com/life2allsofts/malw...

Results and Metrics:
https://github.com/life2allsofts/malw...

ABOUT THE DEVELOPER
Isaac Tetteh-Apotey
MSSE Candidate, Quantic School of Business and Technology
Geomatics Engineer & Software Engineering Researcher
GitHub: https://github.com/life2allsofts
Portfolio: https://tetteh-apotey.vercel.app/
LinkedIn: / isaac-tetteh-apotey-67408b89

PROJECT TIMELINE
Started: February 17, 2026
Completed: February 28, 2026
Development Time: 11 days
CI/CD Runs: 51 successful workflows

DISCLAIMER
This application is intended for educational and research purposes only. The model should not be used as the sole determinant for malware classification in production environments without additional validation.

For questions about this project, please reach out via GitHub or LinkedIn.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Malware Classifier: ML-Powered PE File Detection | Quantic MSSE Intro to machine learning Project

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

У этого AI-агента уже 235 000 звёзд на GitHub. Показываю, как запустить за 10 минут

У этого AI-агента уже 235 000 звёзд на GitHub. Показываю, как запустить за 10 минут

Как заставить ИИ писать нормальный код. Оркестрация мультиагентной системы.

Как заставить ИИ писать нормальный код. Оркестрация мультиагентной системы.

State of JavaScript: что ждёт разработчиков в 2026?

State of JavaScript: что ждёт разработчиков в 2026?

Больше — значит лучше? Сравнение всех локальных ИИ Qwen 3.5: 397B против 122B против 35B против 2...

Больше — значит лучше? Сравнение всех локальных ИИ Qwen 3.5: 397B против 122B против 35B против 2...

066. Как AI меняет роль архитектора

066. Как AI меняет роль архитектора

Промты уже прошлое. 4 шага как обучиться работе с нейросетями за 7 дней

Промты уже прошлое. 4 шага как обучиться работе с нейросетями за 7 дней

Что будет, если доверить документы ИИ? Тестируем в реальном времени | Автоматизация | Нейросети 2026

Что будет, если доверить документы ИИ? Тестируем в реальном времени | Автоматизация | Нейросети 2026

Как ответить на вопросы про Kafka на интервью? Полный разбор

Как ответить на вопросы про Kafka на интервью? Полный разбор

Дороничев: ИИ — пузырь, который скоро ЛОПНЕТ. Какие перемены ждут мир?

Дороничев: ИИ — пузырь, который скоро ЛОПНЕТ. Какие перемены ждут мир?

Когда микроконтроллер становится узким местом? Разбираем реальные ограничения STM32

Когда микроконтроллер становится узким местом? Разбираем реальные ограничения STM32

Как я автоматизировал NotebookLM с помощью Claude Code и Telegram

Как я автоматизировал NotebookLM с помощью Claude Code и Telegram

Cursor AI: полный гайд по вайб-кодингу (настройки, фишки, rules, MCP)

Cursor AI: полный гайд по вайб-кодингу (настройки, фишки, rules, MCP)

Альфред Кох – Путин 1990-х, бандиты, НТВ, Навальный / вДудь

Альфред Кох – Путин 1990-х, бандиты, НТВ, Навальный / вДудь

Лучшие инструменты автоматизации дропшиппинга на Amazon, которые действительно стоит использовать!

Лучшие инструменты автоматизации дропшиппинга на Amazon, которые действительно стоит использовать!

«Трамп слишком обидчив?» Разгромная статья Бесс Калб на Капитолийском холме стала вирусной | 4K

«Трамп слишком обидчив?» Разгромная статья Бесс Калб на Капитолийском холме стала вирусной | 4K

ЦЕНА ОШИБКИ: 13 Инженерных Катастроф, Которые Потрясли Мир!

ЦЕНА ОШИБКИ: 13 Инженерных Катастроф, Которые Потрясли Мир!

🤯ОРЕШКИН: Слушайте, КАКУЮ СХЕМУ Путина и Кабаевой РАСКРЫЛИ! СКАНДАЛ на миллиарды@i_gryanul_grem

🤯ОРЕШКИН: Слушайте, КАКУЮ СХЕМУ Путина и Кабаевой РАСКРЫЛИ! СКАНДАЛ на миллиарды@i_gryanul_grem

StaticFiles в FastAPI - подключаем статику к приложению

StaticFiles в FastAPI - подключаем статику к приложению

SIKORSKI O FRAJERACH, A TUSK ODPYCHA USA? Atak na Iran z perspektywy Polski | Salonik Ziemkiewicza

SIKORSKI O FRAJERACH, A TUSK ODPYCHA USA? Atak na Iran z perspektywy Polski | Salonik Ziemkiewicza

Как бухгалтеру использовать ИИ? 8 задач, которые искусственный интеллект решит за вас

Как бухгалтеру использовать ИИ? 8 задач, которые искусственный интеллект решит за вас