Оглавление

1. Особенности медицинских исследований

  • 1.1. Основные понятия доказательной медицины
    • 1.1.1. Постановка клинически значимого вопроса
    • 1.1.2. Поиск наилучших доказательств
    • 1.1.3. Критическая оценка доказательств
    • 1.1.4. Применение доказательств
    • 1.1.5. Оценка эффективности предложенных подходов на основе принципов ДМ
  • 1.2. Планирование биомедицинских исследований
    • 1.2.1. Дизайн исследования
    • 1.2.2. Описательные исследования
    • 1.2.3. Аналитические исследования
    • 1.2.4. Контроль
    • 1.2.5. Рандомизация
    • 1.2.6. Ослепление
    • 1.2.7. Типичные схемы дизайна биомедицинских исследований
  • 1.3. Клинические исследования
    • 1.3.1. Фазы КИ
    • 1.3.2. Клинический вопрос и уровни доказательности
    • 1.3.3. Регламентирующие документы КИ
    • 1.3.4. Роли участников КИ
    • 1.3.5. Конечные точки КИ
    • 1.3.6. Критерии включения и исключения
    • 1.3.7. Систематические ошибки в КИ
    • 1.3.8. Принципы проведения КИ
  • 1.4. Систематический обзор и метаанализ
    • 1.4.1. Систематический обзор
    • 1.4.2. Метаанализ
    • 1.4.3. Публикационное смещение

2. Основы программирования

  • 2.1. Язык программирования R
    • 2.1.1. RStudio
    • 2.1.2. Типы данных
    • 2.1.3. Переменные
    • 2.1.4. Математические операторы
    • 2.1.5. Операторы сравнения и логические операторы
    • 2.1.6. Операторы проверки на значения
  • 2.2. Структуры данных, функции, циклы
    • 2.2.1. Функции
    • 2.2.2. Пакеты
    • 2.2.3. Структуры данных
    • 2.2.4. Встроенные наборы данных
    • 2.2.5. Ветвления и условные переходы
    • 2.2.6. Циклы
  • 2.3. Особенности подготовки табличных данных
    • 2.3.1. Рекомендации по подготовке таблиц для чтения в R
    • 2.3.2. Манипуляции с данными
    • 2.3.3. Работа с датами
    • 2.3.4. Работа с числовыми данными
    • 2.3.5. Работа со строками
    • 2.3.6. Грамматика манипуляций с данными с использованием dplyr
    • 2.3.7. Конвейер обработки (пайплайн)
    • 2.3.8. Работа с данными с использованием data.table
    • 2.3.9. Особенности работы с data.table, data.frame и tibble
    • 2.3.10. Сравнение dplyr и data.table
    • 2.3.11. Объединение таблиц
    • 2.3.12. Соединение таблиц
    • 2.3.13. Разворот таблиц
    • 2.3.14. Сохранение данных
  • 2.4. Валидация и очистка данных
    • 2.4.1. Концепция “опрятных” данных
    • 2.4.2. Валидация данных
  • 2.5. Получение данных из внешних источников
    • 2.5.1. Загрузка таблиц из баз данных
    • 2.5.2. Загрузка данных из Интернета
    • 2.5.3. Отправка HTTP-запросов и работа с API
    • 2.5.4. Работа с HTTP-запросами в R с использованием httr2
    • 2.5.5. Работа с JSON
    • 2.5.6. Формат XML и HTML
    • 2.5.7. Парсинг страниц в Интернете
    • 2.5.8. Веб-скрэпинг c RSelenium
  • 2.6. Сохранение результатов работы
    • 2.6.1. Подготовка данных
    • 2.6.2. Сохранение таблиц
    • 2.6.3. Сохранение изображений

3. Системы управления базами данных

  • 3.1. Понятие о СУБД
    • 3.1.1. Типы СУБД
    • 3.1.2. Реляционные СУБД. Основные понятия
    • 3.1.3. Нормализация и денормализация данных
  • 3.2. PostgreSQL
    • 3.2.1. Основные объекты и типы данных в PostgreSQL
    • 3.2.2. Операции с различными типами данных
  • 3.3. Команды SQL DDL
    • 3.3.1. CREATE
    • 3.3.2. ALTER и RENAME
    • 3.3.3. DROP и TRUNCATE
  • 3.4. Команды SQL DML
    • 3.4.1. INSERT, UPDATE и DELETE
    • 3.4.2. SELECT
    • 3.4.3. Вспомогательные операторы команд DML
    • 3.4.4. Вспомогательные функции команд DML
    • 3.4.5. Подзапросы
  • 3.5. Продвинутые выборки
    • 3.5.1. Материализованные представления
    • 3.5.2. Наборы группирования
    • 3.5.3. Запросы WITH
    • 3.5.4. Оконные функции
    • 3.5.5. Приемы для оптимизации запросов

4. Визуализация биомедицинских данных

  • 4.1. Введение в ggplot2
    • 4.1.1. Грамматика графических элементов
    • 4.1.2. Основные компоненты ggplot2
    • 4.1.3. Сохранение графика
  • 4.2. Основные подходы к визуализации данных
    • 4.2.1. Одномерные диаграммы для количественных переменных
    • 4.2.2. Одномерные диаграммы для качественных переменных
    • 4.2.3. Диаграммы для сравнения двух количественных переменных
    • 4.2.4. Диаграммы для сравнения двух качественных переменных
    • 4.2.5. Диаграммы для сравнения качественных и количественных переменных
  • 4.3. Продвинутые способы визуализации
    • 4.3.1. Лепестковые диаграммы
    • 4.3.2. Диаграмма Санкей
    • 4.3.3. Тепловая карта
    • 4.3.4. Матрица корреляции
  • 4.4. Пакеты серии grammar of graphics

5. Общие вопросы статистического анализа

  • 5.1. Выборка, переменные и их описание
    • 5.1.1. Выборка и генеральная совокупность
    • 5.1.2. Переменные и шкалы
    • 5.1.3. Описание переменных
    • 5.1.4. Понятие о доверительном интервале
  • 5.2. Разница эффектов и статистические гипотезы
    • 5.2.1. Понятие о разнице эффектов
    • 5.2.2. Понятие о статистических гипотезах
    • 5.2.3. Понятие о значении p, критическом значении и статистической значимости
    • 5.2.4. “Параметрические”, “непараметрические” и перестановочные тесты

6. Частные вопросы статистического анализа

  • 6.1. Статистические тесты для качественных данных
    • 6.1.1. Тесты семейства χ2 и критерий согласия Пирсона
    • 6.1.2. Точный критерий Фишера
    • 6.1.3. Критерий МакНемара для зависимых групп
    • 6.1.4. Алгоритм выбора теста для качественных данных
  • 6.2. Статистические тесты для количественных данных
    • 6.2.1. Нормальное распределение
    • 6.2.2. Распределение, отличное от нормального
    • 6.2.3. Количественные сравнения нескольких групп
    • 6.2.4. Алгоритм выбора теста для количественных данных
  • 6.3. Множественные сравнения
    • 6.3.1. Поправка по методу Бонферрони
    • 6.3.2. Поправка по методу Холма
    • 6.3.3. Практическое применение поправок по методу Бонферрони и Холма
    • 6.3.4. Множественные сравнения и классические статистические тесты
    • 6.3.5. Примеры использования критериев для нескольких групп
  • 6.4. Коэффициенты корреляции
    • 6.4.1. Коэффициент корреляции Пирсона
    • 6.4.2. Коэффициент корреляции Спирмена
  • 6.5. Анализ времени до наступления события
  • 6.6. Диагностические тесты и порог принятия решения
    • 6.6.1. Основные меры точности диагностических тестов
    • 6.6.2. Использование отношения правдоподобия для расчета вероятности
    • 6.6.3. ROC-кривые
  • 6.7. Планирование исследования с использованием статистических методов и разведочный анализ данных
    • 6.7.1. Расчет размера выборки
    • 6.7.2. Автоматизация процедуры рандомизации
    • 6.7.3. Разведочный анализ данных и концепция воспроизводимых исследований

7. Большие данные и машинное обучение в медицине

  • 7.1. Общее понятие о больших данных
    • 7.1.1. Признаки и характеристики больших данных
    • 7.1.2. Подходы для работы с большими данными
    • 7.1.3. Большие данные в здравоохранении
  • 7.2. Общие понятия и основы машинного обучения
    • 7.2.1. Закодированные правила
    • 7.2.2. Машинные алгоритмы
    • 7.2.3. Обучение
    • 7.2.4. Переобучение
    • 7.2.5. Алгоритмы обучения
    • 7.2.6. Искусственный интеллект
  • 7.3. Математика для машинного обучения
    • 7.3.1. Введение
    • 7.3.2. Умножение вектора на скаляр
    • 7.3.3. Скалярное произведение векторов
    • 7.3.4. Сложение и вычитание векторов
    • 7.3.5. Расстояние между векторами
    • 7.3.6. Матрица
    • 7.3.7. Сложение и вычитание матриц
    • 7.3.8. Транспонирование матриц
    • 7.3.9. Умножение матриц
    • 7.3.10. Определитель матрицы
    • 7.3.11. Ранг матрицы
    • 7.3.12. Обратная матрица
    • 7.3.13. Нормализация
    • 7.3.14. Производная
    • 7.3.15. Градиентный спуск и функция потерь
  • 7.4. Линейная регрессия
    • 7.4.1. Условия применимости модели линейной регрессии
    • 7.4.2. Обучение модели линейной регрессии
    • 7.4.3. Модель линейной регрессии на языке R
  • 7.5. Логистическая регрессия
    • 7.5.1. Сигмоидная функция
    • 7.5.2. Построение логистической регрессии
    • 7.5.3. Многоклассовая классификация
    • 7.5.4. Построение модели в R
  • 7.6. Деревья принятия решений. Случайный лес
    • 7.6.1. Деревья принятия решений
    • 7.6.2. Случайный лес (random forest)
  • 7.7. Бустинг
    • 7.7.1. Общие принципы бустинга
    • 7.7.2. Градиентный бустинг
  • 7.8. Нейронные сети
    • 7.8.1. Общие понятия
    • 7.8.2. Задачи регрессии и классификации
    • 7.8.3. Прямой проход нейронной сети
    • 7.8.4. Обратное распространение ошибки
    • 7.8.5. Сверточные нейронные сети
  • 7.9. Обучение без учителя
    • 7.9.1. Алгоритмы кластеризации
    • 7.9.2. Реализация алгоритмов кластеризации на языке R
    • 7.9.3. Методы понижения размерности
  • 7.10. Автоматизация подходов к построению моделей машинного обучения

Приложения

8. Вспомогательные инструменты для организации исследовательских проектов

  • 8.1. Системы контроля версий
    • 8.1.1. Что такое Git
    • 8.1.2. Начало работы с Git
    • 8.1.3. Подход Github-first
    • 8.1.4. Подход RStudio-first
    • 8.1.5. Работа с Git в RStudio
    • 8.1.6. Дополнительные возможности GitHub
  • 8.2. Различные подходы к созданию динамических отчетов
    • 8.2.1. Рекомендации по оформлению таблиц
    • 8.2.2. Оформление таблиц с пакетом flextable
    • 8.2.3. Оформление таблиц с пакетом gt
    • 8.2.4. Создание отчетов в формате Word
    • 8.2.5. Создание отчетов в формате PowerPoint
    • 8.2.6. Создание отчетов в формате Excel
    • 8.2.7. Создание отчетов в формате Rmarkdown
    • 8.2.8. Фабрика отчетов
  • 8.3. Создание дашбордов с Quarto
    • 8.3.1. Начало работы с Quarto
    • 8.3.2. Создание дашборда
    • 8.3.3. Формирование сетки компоновки элементов
    • 8.3.4. Элементы дашборда
    • 8.3.5. Публикация дашборда
    • 8.3.6. Публикация с помощью Github Actions
  • 8.4. Создание интерактивных приложений с Shiny
    • 8.4.1. Основные понятия
    • 8.4.2. Использование Shiny с Quarto
    • 8.4.3. Создание Shiny приложения
    • 8.4.4. Публикация приложения Shiny
    • 8.4.5. Запуск Shiny приложения с помощью технологий контейнеризации
    • 8.4.6. Публикация Shiny приложения на Github Pages с помощью shinylive
  • 8.5. Организация сбора данных
    • 8.5.1. Создание опросов с SurveyDown
    • 8.5.2. Система электронной ИРК LibreClinica

9. Биомедицинские наборы данных для машинного обучения

  • 9.1. Источники биомедицинских наборов данных
  • 9.2. Наборы данных для скачивания

Изменено 26 марта 2025