df <- read.table(«staff.csv», header = TRUE, sep = «;», na.strings = c(«»,NA), stringsAsFactors=FALSE)
str(df)
head(df)
Мы видим, что у нас есть 303 наблюдения. Также мы видим формат данных всех наших переменных.
В датасете у нас есть следующие данные:
df$fired = 1
df$fired[is.na(df$Дата.увольнения)] = 0
table(df$fired)
quantile(survfit(w1))
> table(df$Учился)
0 1
135 168
w1 = coxph(Surv(stag, event) ~ as.factor(Учился) , data = df)
summary(w1)
e = survfit(w1, newdata=data.frame(Учился = c(1, 0)))
ggsurvplot(e, legend.labs=c(«Учился»,»Не учился»),
ggtheme = theme_bw(), palette = c(«#E7B800», «#2E9FDF»),
title = «График дожития (анализ увольнений)»,
xlab = «Кол-во месяцев до увольнения»)
Работая с данным инструментом (survival analysis) я понял, что: