ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Meet the Experts: Preprocessing text data with TextPrep (KODAQS Toolbox)

Автор: GESIS - Leibniz-Institut für Sozialwissenschaften

Загружено: 2026-02-13

Просмотров: 18

Описание: The KODAQS Data Quality Toolbox, developed by the Competence Center for Data Quality (KODAQS), equips researchers with practical tools and tutorials for assessing and improving data quality across survey, digital behavioral, and linked data. In this talk, we highlight TextPrep, a tool designed to assess how preprocessing methods, such as automated translation, minor text operations, and stopword removal, can significantly improve the quality of social media data depended on use case, data types, and methods. By systematically evaluating and comparing different approaches (e.g. different stopword lists), it is highlighted how they can alter textual content and impact data interpretation and quality. Text similarity measures, such as word count or cosine similarity, are used to document differences between the various preprocessing strategies and packages. Also Structural Topic Modeling is applied to compare different preprocessing stages using semantic coherence and exclusivity. With TextPrep, all of this can be assessed and implemented in an automated process through commented R code, which can be adapted and transfered to different use cases.

Presenter: Yannik Peters

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Meet the Experts: Preprocessing text data with TextPrep (KODAQS Toolbox)

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Meet the Experts: KODAQS Toolbox AreaMatch

Meet the Experts: KODAQS Toolbox AreaMatch

Meet the Experts: Resquin for Assessing Response Quality in Multi-Item Scales

Meet the Experts: Resquin for Assessing Response Quality in Multi-Item Scales

Meet the Experts: ValiText for Validating Computational Text-Based Measures of Social Constructs

Meet the Experts: ValiText for Validating Computational Text-Based Measures of Social Constructs

Экспресс-курс RAG для начинающих

Экспресс-курс RAG для начинающих

Как балет меняет вашу походку (новые исследования в области биомеханики)

Как балет меняет вашу походку (новые исследования в области биомеханики)

КОЛМАНОВСКИЙ:

КОЛМАНОВСКИЙ: "Это просто чудо". Где "проваливается" ИИ, что не так с ядом из кожи лягушки, азарт

⛈️ ТУЧИ НАД БАНКОВОЙ: Залужный все рассказал! Молдаване шли по душу Гордона. Такси ТЦК  - Золотарёв

⛈️ ТУЧИ НАД БАНКОВОЙ: Залужный все рассказал! Молдаване шли по душу Гордона. Такси ТЦК - Золотарёв

Meet the Editors: Working with New Data Source - Methodological Choices, Challenges and Solutions

Meet the Editors: Working with New Data Source - Methodological Choices, Challenges and Solutions

Новые функции NotebookLM просто невероятны.

Новые функции NotebookLM просто невероятны.

Проблема нержавеющей стали

Проблема нержавеющей стали

❌НЕ используйте Kaggle! Единственное видео, которое вам понадобится для генерации синтетических д...

❌НЕ используйте Kaggle! Единственное видео, которое вам понадобится для генерации синтетических д...

Атака на кортеж правительства / Заговор против президента

Атака на кортеж правительства / Заговор против президента

NotebookLM + Gemini Gem: Создаем бота эксперта.

NotebookLM + Gemini Gem: Создаем бота эксперта.

Искусственный интеллект может проектировать детали… но он не может сделать ЭТО.

Искусственный интеллект может проектировать детали… но он не может сделать ЭТО.

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Работа с файлами в Python — наглядное объяснение.

Работа с файлами в Python — наглядное объяснение.

Сонет 4.6 Клода — безумие, но вот правда, о которой вам никто не говорит.

Сонет 4.6 Клода — безумие, но вот правда, о которой вам никто не говорит.

NotebookLM: 5 КЕЙСОВ, которые заменят вам целую команду (БЕСПЛАТНО)

NotebookLM: 5 КЕЙСОВ, которые заменят вам целую команду (БЕСПЛАТНО)

Этот ИИ анализирует 500 научных работ, чтобы вам не пришлось этого делать (Elicit AI).

Этот ИИ анализирует 500 научных работ, чтобы вам не пришлось этого делать (Elicit AI).

Обзор Fabric IQ

Обзор Fabric IQ

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]