ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Mastering Outlier Detection with LOF (Local Outlier Factor) in Python

Автор: Ryan & Matt Data Science

Загружено: 2024-10-24

Просмотров: 1631

Описание: 🧠 Don’t miss out! Get FREE access to my Skool community — packed with resources, tools, and support to help you with Data, Machine Learning, and AI Automations! 📈 https://www.skool.com/data-and-ai-aut...

Looking for a smarter way to detect outliers in your data? In this tutorial, you’ll learn how to use Local Outlier Factor (LOF) from Scikit-Learn to find anomalies based on local density—perfect for fraud detection, network intrusion, and any dataset where context matters!

Code: https://colab.research.google.com/dri...

🚀 Hire me for Data Work: https://ryanandmattdatascience.com/da...
👨‍💻 Mentorships: https://ryanandmattdatascience.com/me...
📧 Email: [email protected]
🌐 Website & Blog: https://ryanandmattdatascience.com/
🖥️ Discord:   / discord  
📚 *Practice SQL & Python Interview Questions: https://stratascratch.com/?via=ryan
📖 *SQL and Python Courses: https://datacamp.pxf.io/XYD7Qg

🍿 WATCH NEXT
Scikit-Learn and Machine Learning Playlist:    • Scikit-Learn Tutorials - Master Machine Le...  
Isolation Forest:    • Mastering Isolation Forest in Python: Anom...  
Extra Trees Classifier:    • Extra Trees Classifier in Scikit-Learn: An...  
Support Vector Machine:    • Mastering Support Vector Machines with Pyt...  


In this video, I break down the Local Outlier Factor (LOF) algorithm and show you how to use it for anomaly detection in real-world data. LOF is an unsupervised machine learning algorithm that identifies outliers by measuring the local density deviation of data points compared to their neighbors, making it incredibly effective for detecting anomalies in clustered datasets.

We walk through the core concepts behind LOF, including how it calculates K-distances, local reachability density, and anomaly scores for each data point. I explain why LOF excels at handling datasets with varying cluster densities and compare its performance against other popular anomaly detection algorithms like Isolation Forest and One-Class SVM.

Using a practical example with search query data, I demonstrate how to implement LOF in Python with scikit-learn, including how to choose the right number of neighbors and contamination parameters. We analyze query length and noun count metrics to identify unusual user behavior patterns, and I show you how to visualize the results to understand which data points are flagged as anomalies. By the end of this tutorial, you'll know exactly when to use LOF and how to apply it to your own anomaly detection projects.

TIMESTAMPS
00:00 Introduction & Discord Community
00:50 What is Local Outlier Factor (LOF)?
02:07 How LOF Works - Local Density Deviation
03:05 K-Distance Calculation Explained
04:25 Local Reachability Distance (LRD)
05:13 Determining Inliers vs Outliers
05:55 Visual Example of LOF
07:30 Understanding Cluster Effects on Outlier Scores
09:40 Comparing LOF to Other Algorithms
12:20 Code Implementation - Loading Data
14:00 Adding Noun Count Feature with Spacy
15:40 Choosing Number of Neighbors Parameter
19:20 Contamination Parameter Explained
20:40 Fitting the Model & Predictions
22:00 Visualizing Results
24:30 Analyzing Output & Limitations

OTHER SOCIALS:
Ryan’s LinkedIn:   / ryan-p-nolan  
Matt’s LinkedIn:   / matt-payne-ceo  
Twitter/X: https://x.com/RyanMattDS

Who is Ryan
Ryan is a Data Scientist at a fintech company, where he focuses on fraud prevention in underwriting and risk. Before that, he worked as a Data Analyst at a tax software company. He holds a degree in Electrical Engineering from UCF.

Who is Matt
Matt is the founder of Width.ai, an AI and Machine Learning agency. Before starting his own company, he was a Machine Learning Engineer at Capital One.

*This is an affiliate program. We receive a small portion of the final sale at no extra cost to you.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Mastering Outlier Detection with LOF (Local Outlier Factor) in Python

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Performing Python Welch's T Test (Independent Two Sample) in Python

Performing Python Welch's T Test (Independent Two Sample) in Python

Master Python Variables in Just 15 Minutes: Quick & Easy Guide

Master Python Variables in Just 15 Minutes: Quick & Easy Guide

Метод анализа главных компонентов (PCA) объяснен простыми словами.

Метод анализа главных компонентов (PCA) объяснен простыми словами.

Мощнейший удар по флоту и авиации РФ / Улицы столицы перекрыты

Мощнейший удар по флоту и авиации РФ / Улицы столицы перекрыты

Как Быстро ВЫУЧИТЬ Python в 2026 году

Как Быстро ВЫУЧИТЬ Python в 2026 году

Традиционное машинное обучение мертво — суровая правда 😔

Традиционное машинное обучение мертво — суровая правда 😔

Python Tutorials For Data Analysts and Scientists

Python Tutorials For Data Analysts and Scientists

Statistics for Data Science

Statistics for Data Science

Как быстро освоить n8n (Сделайте это или продолжайте бороться)

Как быстро освоить n8n (Сделайте это или продолжайте бороться)

Является ли профессия аналитика данных перспективной в 2026 году?

Является ли профессия аналитика данных перспективной в 2026 году?

Лучший документальный фильм про создание ИИ

Лучший документальный фильм про создание ИИ

Как на практике использовать ИИ + PYTHON для анализа данных (пример в реальном времени)

Как на практике использовать ИИ + PYTHON для анализа данных (пример в реальном времени)

Как быстро освоить Python для инженеров данных (пошаговое руководство 2026 года)

Как быстро освоить Python для инженеров данных (пошаговое руководство 2026 года)

DATA SCIENCE РОАДМАП 2026 — С НУЛЯ ДО MIDDLE

DATA SCIENCE РОАДМАП 2026 — С НУЛЯ ДО MIDDLE

Data Science Open Source Portfolio Project (Streamlit & Python)

Data Science Open Source Portfolio Project (Streamlit & Python)

Суровая реальность обучения в 2026 году

Суровая реальность обучения в 2026 году

NotebookLM в Изучении Иностранных Языков: Обзор Функций

NotebookLM в Изучении Иностранных Языков: Обзор Функций

Исследовательский анализ данных с помощью Pandas Python

Исследовательский анализ данных с помощью Pandas Python

Основы машинного обучения: Кросс-валидация.

Основы машинного обучения: Кросс-валидация.

Что такое Power BI? Полное объяснение с помощью визуальных средств | #КурсPowerBI 1

Что такое Power BI? Полное объяснение с помощью визуальных средств | #КурсPowerBI 1

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]