Tengo un dataframe
como este
index col1 col2 col3 col4
0 11/20 11/26 abc 35
1 11/21 11/24 xxx 30
2 11/22 11/27 abc 20
Aquí col3
tiene un mismo valor duplicado (basado en el valor).
Yo sum()
col4
desde filas basadas en la col3
valor.
Así que en este caso tengo que hacer
df = df.groupby(['col3'])[['col4']].sum()
Pero con este enfoque puedo conseguir
index col3 col4
0 abc 55
1 xxx 30
Me gustaría ser capaz de preservar la primera aparición de la duplicación del valor col1
(11/20) y la última aparición de col2
(11/27), por lo que el producto final se parece a la
index col1 col2 col3 col4
0 11/20 11/27 abc 55
1 11/21 11/24 xxx 30