Оглавление
1. Особенности медицинских исследований
- 1.1. Основные понятия доказательной медицины
- 1.1.1. Постановка клинически значимого вопроса
- 1.1.2. Поиск наилучших доказательств
- 1.1.3. Критическая оценка доказательств
- 1.1.4. Применение доказательств
- 1.1.5. Оценка эффективности предложенных подходов на основе принципов ДМ
- 1.2. Планирование биомедицинских исследований
- 1.2.1. Дизайн исследования
- 1.2.2. Описательные исследования
- 1.2.3. Аналитические исследования
- 1.2.4. Контроль
- 1.2.5. Рандомизация
- 1.2.6. Ослепление
- 1.2.7. Типичные схемы дизайна биомедицинских исследований
- 1.3. Клинические исследования
- 1.3.1. Фазы КИ
- 1.3.2. Клинический вопрос и уровни доказательности
- 1.3.3. Регламентирующие документы КИ
- 1.3.4. Роли участников КИ
- 1.3.5. Конечные точки КИ
- 1.3.6. Критерии включения и исключения
- 1.3.7. Систематические ошибки в КИ
- 1.3.8. Принципы проведения КИ
- 1.4. Систематический обзор и метаанализ
- 1.4.1. Систематический обзор
- 1.4.2. Метаанализ
- 1.4.3. Публикационное смещение
2. Основы программирования
- 2.1. Язык программирования R
- 2.1.1. RStudio
- 2.1.2. Типы данных
- 2.1.3. Переменные
- 2.1.4. Математические операторы
- 2.1.5. Операторы сравнения и логические операторы
- 2.1.6. Операторы проверки на значения
- 2.2. Структуры данных, функции, циклы
- 2.2.1. Функции
- 2.2.2. Пакеты
- 2.2.3. Структуры данных
- 2.2.4. Встроенные наборы данных
- 2.2.5. Ветвления и условные переходы
- 2.2.6. Циклы
- 2.3. Особенности подготовки табличных данных
- 2.3.1. Рекомендации по подготовке таблиц для чтения в R
- 2.3.2. Манипуляции с данными
- 2.3.3. Работа с датами
- 2.3.4. Работа с числовыми данными
- 2.3.5. Работа со строками
- 2.3.6. Грамматика манипуляций с данными с использованием dplyr
- 2.3.7. Конвейер обработки (пайплайн)
- 2.3.8. Работа с данными с использованием data.table
- 2.3.9. Особенности работы с data.table, data.frame и tibble
- 2.3.10. Сравнение dplyr и data.table
- 2.3.11. Объединение таблиц
- 2.3.12. Соединение таблиц
- 2.3.13. Разворот таблиц
- 2.3.14. Сохранение данных
- 2.4. Валидация и очистка данных
- 2.4.1. Концепция “опрятных” данных
- 2.4.2. Валидация данных
- 2.5. Получение данных из внешних источников
- 2.5.1. Загрузка таблиц из баз данных
- 2.5.2. Загрузка данных из Интернета
- 2.5.3. Отправка HTTP-запросов и работа с API
- 2.5.4. Работа с HTTP-запросами в R с использованием httr2
- 2.5.5. Работа с JSON
- 2.5.6. Формат XML и HTML
- 2.5.7. Парсинг страниц в Интернете
- 2.5.8. Веб-скрэпинг c RSelenium
- 2.6. Сохранение результатов работы
- 2.6.1. Подготовка данных
- 2.6.2. Сохранение таблиц
- 2.6.3. Сохранение изображений
3. Системы управления базами данных
- 3.1. Понятие о СУБД
- 3.1.1. Типы СУБД
- 3.1.2. Реляционные СУБД. Основные понятия
- 3.1.3. Нормализация и денормализация данных
- 3.2. PostgreSQL
- 3.2.1. Основные объекты и типы данных в PostgreSQL
- 3.2.2. Операции с различными типами данных
- 3.3. Команды SQL DDL
- 3.3.1. CREATE
- 3.3.2. ALTER и RENAME
- 3.3.3. DROP и TRUNCATE
- 3.4. Команды SQL DML
- 3.4.1. INSERT, UPDATE и DELETE
- 3.4.2. SELECT
- 3.4.3. Вспомогательные операторы команд DML
- 3.4.4. Вспомогательные функции команд DML
- 3.4.5. Подзапросы
- 3.5. Продвинутые выборки
- 3.5.1. Материализованные представления
- 3.5.2. Наборы группирования
- 3.5.3. Запросы WITH
- 3.5.4. Оконные функции
- 3.5.5. Приемы для оптимизации запросов
4. Визуализация биомедицинских данных
- 4.1. Введение в ggplot2
- 4.1.1. Грамматика графических элементов
- 4.1.2. Основные компоненты ggplot2
- 4.1.3. Сохранение графика
- 4.2. Основные подходы к визуализации данных
- 4.2.1. Одномерные диаграммы для количественных переменных
- 4.2.2. Одномерные диаграммы для качественных переменных
- 4.2.3. Диаграммы для сравнения двух количественных переменных
- 4.2.4. Диаграммы для сравнения двух качественных переменных
- 4.2.5. Диаграммы для сравнения качественных и количественных переменных
- 4.3. Продвинутые способы визуализации
- 4.3.1. Лепестковые диаграммы
- 4.3.2. Диаграмма Санкей
- 4.3.3. Тепловая карта
- 4.3.4. Матрица корреляции
- 4.4. Пакеты серии grammar of graphics
5. Общие вопросы статистического анализа
- 5.1. Выборка, переменные и их описание
- 5.1.1. Выборка и генеральная совокупность
- 5.1.2. Переменные и шкалы
- 5.1.3. Описание переменных
- 5.1.4. Понятие о доверительном интервале
- 5.2. Разница эффектов и статистические гипотезы
- 5.2.1. Понятие о разнице эффектов
- 5.2.2. Понятие о статистических гипотезах
- 5.2.3. Понятие о значении p, критическом значении и статистической значимости
- 5.2.4. “Параметрические”, “непараметрические” и перестановочные тесты
6. Частные вопросы статистического анализа
- 6.1. Статистические тесты для качественных данных
- 6.1.1. Тесты семейства χ2 и критерий согласия Пирсона
- 6.1.2. Точный критерий Фишера
- 6.1.3. Критерий МакНемара для зависимых групп
- 6.1.4. Алгоритм выбора теста для качественных данных
- 6.2. Статистические тесты для количественных данных
- 6.2.1. Нормальное распределение
- 6.2.2. Распределение, отличное от нормального
- 6.2.3. Количественные сравнения нескольких групп
- 6.2.4. Алгоритм выбора теста для количественных данных
- 6.3. Множественные сравнения
- 6.3.1. Поправка по методу Бонферрони
- 6.3.2. Поправка по методу Холма
- 6.3.3. Практическое применение поправок по методу Бонферрони и Холма
- 6.3.4. Множественные сравнения и классические статистические тесты
- 6.3.5. Примеры использования критериев для нескольких групп
- 6.4. Коэффициенты корреляции
- 6.4.1. Коэффициент корреляции Пирсона
- 6.4.2. Коэффициент корреляции Спирмена
- 6.5. Анализ времени до наступления события
- 6.6. Диагностические тесты и порог принятия решения
- 6.6.1. Основные меры точности диагностических тестов
- 6.6.2. Использование отношения правдоподобия для расчета вероятности
- 6.6.3. ROC-кривые
- 6.7. Планирование исследования с использованием статистических методов и разведочный анализ данных
- 6.7.1. Расчет размера выборки
- 6.7.2. Автоматизация процедуры рандомизации
- 6.7.3. Разведочный анализ данных и концепция воспроизводимых исследований
7. Большие данные и машинное обучение в медицине
- 7.1. Общее понятие о больших данных
- 7.1.1. Признаки и характеристики больших данных
- 7.1.2. Подходы для работы с большими данными
- 7.1.3. Большие данные в здравоохранении
- 7.2. Общие понятия и основы машинного обучения
- 7.2.1. Закодированные правила
- 7.2.2. Машинные алгоритмы
- 7.2.3. Обучение
- 7.2.4. Переобучение
- 7.2.5. Алгоритмы обучения
- 7.2.6. Искусственный интеллект
- 7.3. Математика для машинного обучения
- 7.3.1. Введение
- 7.3.2. Умножение вектора на скаляр
- 7.3.3. Скалярное произведение векторов
- 7.3.4. Сложение и вычитание векторов
- 7.3.5. Расстояние между векторами
- 7.3.6. Матрица
- 7.3.7. Сложение и вычитание матриц
- 7.3.8. Транспонирование матриц
- 7.3.9. Умножение матриц
- 7.3.10. Определитель матрицы
- 7.3.11. Ранг матрицы
- 7.3.12. Обратная матрица
- 7.3.13. Нормализация
- 7.3.14. Производная
- 7.3.15. Градиентный спуск и функция потерь
- 7.4. Линейная регрессия
- 7.4.1. Условия применимости модели линейной регрессии
- 7.4.2. Обучение модели линейной регрессии
- 7.4.3. Модель линейной регрессии на языке R
- 7.5. Логистическая регрессия
- 7.5.1. Сигмоидная функция
- 7.5.2. Построение логистической регрессии
- 7.5.3. Многоклассовая классификация
- 7.5.4. Построение модели в R
- 7.6. Деревья принятия решений. Случайный лес
- 7.6.1. Деревья принятия решений
- 7.6.2. Случайный лес (random forest)
- 7.7. Бустинг
- 7.7.1. Общие принципы бустинга
- 7.7.2. Градиентный бустинг
- 7.8. Нейронные сети
- 7.8.1. Общие понятия
- 7.8.2. Задачи регрессии и классификации
- 7.8.3. Прямой проход нейронной сети
- 7.8.4. Обратное распространение ошибки
- 7.8.5. Сверточные нейронные сети
- 7.9. Обучение без учителя
- 7.9.1. Алгоритмы кластеризации
- 7.9.2. Реализация алгоритмов кластеризации на языке R
- 7.9.3. Методы понижения размерности
- 7.10. Автоматизация подходов к построению моделей машинного обучения
Приложения
8. Вспомогательные инструменты для организации исследовательских проектов
- 8.1. Системы контроля версий
- 8.1.1. Что такое Git
- 8.1.2. Начало работы с Git
- 8.1.3. Подход Github-first
- 8.1.4. Подход RStudio-first
- 8.1.5. Работа с Git в RStudio
- 8.1.6. Дополнительные возможности GitHub
- 8.2. Различные подходы к созданию динамических отчетов
- 8.2.1. Рекомендации по оформлению таблиц
- 8.2.2. Оформление таблиц с пакетом flextable
- 8.2.3. Оформление таблиц с пакетом gt
- 8.2.4. Создание отчетов в формате Word
- 8.2.5. Создание отчетов в формате PowerPoint
- 8.2.6. Создание отчетов в формате Excel
- 8.2.7. Создание отчетов в формате Rmarkdown
- 8.2.8. Фабрика отчетов
- 8.3. Создание дашбордов с Quarto
- 8.3.1. Начало работы с Quarto
- 8.3.2. Создание дашборда
- 8.3.3. Формирование сетки компоновки элементов
- 8.3.4. Элементы дашборда
- 8.3.5. Публикация дашборда
- 8.3.6. Публикация с помощью Github Actions
- 8.4. Создание интерактивных приложений с Shiny
- 8.4.1. Основные понятия
- 8.4.2. Использование Shiny с Quarto
- 8.4.3. Создание Shiny приложения
- 8.4.4. Публикация приложения Shiny
- 8.4.5. Запуск Shiny приложения с помощью технологий контейнеризации
- 8.4.6. Публикация Shiny приложения на Github Pages с помощью shinylive
- 8.5. Организация сбора данных
- 8.5.1. Создание опросов с SurveyDown
- 8.5.2. Система электронной ИРК LibreClinica
9. Биомедицинские наборы данных для машинного обучения
- 9.1. Источники биомедицинских наборов данных
- 9.2. Наборы данных для скачивания
Изменено 26 марта 2025