我有如下数据

df.head()

name    location    duration month  status
aim          bgy                12  active
terra        pm                 3   inactive
jerry        bgy                23  inactive
finn         dm                  8  active
pearl        bgy                21  active
doe          pm                  9  inactive
pearl        pm                 11  inactive


我拥有大约2000个数据点,并有大约6个唯一的位置名称。我需要在给定任何名称,位置,当前持续时间详细信息的情况下构建/训练一个预测模型,该模型应以概率%预测状态(有效/无效)
所以如果这个模型的输入是

name    location    duration month
jim          bgy                6
tim          pm                 9
sara         bgy                12


我应该得到像

name    location    duration month  status  active_probability
jim          bgy                6   active   0.9
tim          pm                 9   inactive 0.0
sara         bgy                12  active   0.8

最佳答案

您可以尝试使用LightGBM。它非常易于使用,并且运行速度非常快。

09-20 00:40