我正在努力形成一棵像数据框的树,在父母的正下方有孩子排。我想做的是在合并object_id x parent_id和沿轴0串联之间的某些操作。
所以我要寻找的是下面代码段中隔行功能的实现。

In[1]: parents = pd.DataFrame({'object_id':[1,2],
                               'parent_id':[0,0],
                               'position': [1,2]})

In[2]: parents

Out[2]    object_id     parent_id   position
       0  1             0           1
       1  2             0           2

In[3]: children = pd.DataFrame({'object_id':[3,4,5],
                                'parent_id':[1,1,2],
                                'position': [1,2,1]})

In[4]: children

Out[4]:   object_id     parent_id   position
       0  3             1           1
       1  4             1           2
       2  5             2           1

In[5]: interlace(parent, children, on=('object_id', 'parent_id'))

Out[5]:  object_id  parent_id   position
      0  1          0           1
      1  3          1           1
      2  4          1           2
      3  2          0           1
      4  5          2           1


在大熊猫中,有没有一种有效的方法?
我认为一个人可以做类似的事情

parents_with_children = []
for i, parentrow in parents.iteritems():
    childrenrows = children[children.parent_id == parentrow.object_id]
    parents_with_children.append(pd.concat([parentrow, childrenrows])
result = pd.concat(parents_with_children)


但是我觉得应该有一种更容易,更有效的方法来做到这一点。

编辑:具有相同级别和相同父级的行需要保持按其位置排序。

最佳答案

可能的解决方案:

children['sort_id']=children.parent_id
parents['sort_id']=parents.object_id
pd.concat([parents,children]).sort_values(['sort_id', 'parent_id']).drop('sort_id', 1)

关于python - 如何在父子关系上合并两个数据框(在concat和merge之间),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/40727148/

10-17 00:07