Supongamos que tengo un marco de datos de la siguiente manera:
df = pd.DataFrame({
'Column A': [12,12,12, 13, 15, 16, 141, 141, 141, 141],
'Column B':['Apple' ,'Apple' ,'Orange' ,'Apple' , np.nan, 'Orange', 'Apple', np.nan, 'Apple', 'Apple']})
Basado en estas condiciones:
Si los valores en la columna a se repiten, a continuación, el recuento de la palabra "Naranja" en la Columna B y pegarlo en la nueva Columna C(Por ejemplo, hay 3 filas de 12, el conde de 'Orange' es 1, y este 1 debe estar en la nueva columna C). Para la no-repetición de filas, basta con pegar los valores correspondientes.
Si los valores en la columna a se repiten, a continuación, el recuento de la palabra "Manzana" en la Columna B y pegarlo en la nueva Columna D(Por ejemplo, hay 3 filas de 12, el conde de la 'Manzana' es de 2, y 2 deben estar en la nueva columna D). Para la no-repetición de filas, basta con pegar los valores correspondientes.
Para repetir y no filas repetidas debido a la Columna, Si la palabra "Naranja" está presente en la Columna B, escribe 'sí' else 'No' en la Columna E.
Me gustaría tener una salida siguiente. Yo estaba tratando en python jupyter notebook, puede alguien por favor me ayude a conseguir una salida como esta:
| Column A | Column B |Column C |Column D |Column E
----- | -------- | ---------|---------|---------|---------
0 | 12 | Apple |1 |2 |Yes
1 | 13 | Apple |0 |1 |No
2 | 15 | NaN |NaN |NaN |NaN
3 | 16 | Orange |1 |0 |Yes
4 | 141 | Apple |0 |3 |No
Gracias de antemano:)