Tengo un dataframe que se parece a esto:
df:
Index AMOUNT_INVOICED INVOICED_DATE CLOSED_DATE
0 1443.62 2019-08-01 2019-09-04
1 3585.78 2019-08-03 2019-09-04
2 68276.25 2019-08-05 2019-09-04
3 19673.84 2019-09-10 2019-11-06
4 9119.40 2019-09-11 2019-10-07
...
700 9976.25 2021-09-01 2021-10-04
701 7273.84 2021-09-01 2021-11-14
702 3129.40 2021-10-04 2021-11-23
Cada fila representa una factura que ya ha sido pagada, el DF incluye datos con facturado fechas que abarca desde 2019-01 a día de hoy.
Estoy tratando de hacer algunos informes sobre una base mensual para identificar cuánto $ era pendientes al final de cada mes.
He configurado una salida de df que muestra cada mes, desde la primera fecha de la factura, y un lugar para almacenar la suma de los pendientes de AR para el mes, que actualmente se ve como esto:
Total Outstanding AR
Month
2019-08 0
2019-09 0
2019-10 0
...
2021-09 0
2021-10 0
En última instancia, me gustaría que la salida se verá algo como esto:
Total Outstanding AR
Month
2019-08 73,305.65
2019-09 28,793.24
2019-10 19673.84
...
2021-09 17,250.09
2021-10 10,403.24
Total Pendiente de AR vendría de sumar el importe de la factura de cada mes en la factura no se ha cerrado.
Por ejemplo, en 2019-08 le suma la cantidad facturada por el puño de tres facturas, 1443.62 + 3585.78 + 68276.25 = 73,305.65, ya que estos tres facturas que quedaron pendientes de pago al final del mes de agosto. Esta lógica se mantendría hasta que la factura se paga, pero la factura no contribuye a la excelente AR para el mes que se paga.
Alguien me puede ayudar a averiguar la mejor manera de ir sobre la creación de mi salida deseada?
GRACIAS!
pandas
secuencias, probablemente, hay una manera de hacer esas sumas en uno o dos llamadas a la función sin un bucle. Estoy seguro de que alguien va a tubería de hasta.