Bonjour à tous,
j'utilise un cut de cette maniere :
data <- cut(data,breaks=c(min(data),4.39,4.65,5.50,max(data)),include.lowest=TRUE)
Cependant étant donnée que je fait de la prédiction sur un nouvel échantillon ensuite (regression logistique), j'ai alors une erreur du type :
'breaks' ne sont pas des valeurs uniques
Du coup je me suis dit que ça venait peut être de mes min et max qui sont pas les même entre modélisation et prédiction du coup j'ai fait ça:
data <- cut(data,breaks=c(-1000,4.39,4.65,5.50,1000),include.lowest=TRUE)
N'y aurait t'il pas un moyen plus propre pour mettre genre -inf et +inf?
Merci à vous
Partager