Estoy tratando de obtener la distribución en el tiempo de un determinado evento por día de la semana. Todos mis datos se almacenan en una .archivo csv. Un registro parecido a este:
Como se puede ver, el tiempo que tiene el formato timestamp de unix, así que tengo que convertirlo a un formato más legible y, a continuación, para cada día obtener el número total de ocurrencias del evento llamado.
Aquí está el código que escribí:
import pandas as pd
strikes_df = pd.read_csv('my_csv_file.csv')
(pd.to_datetime(strikes_df['time']).dt.weekday).value_counts()
El resultado es:
3 313113
Name: time, dtype: int64
Lo que significa que todas las apariciones de que el evento haya sido registrado en el mismo día de la semana ? Que no es lo que el archivo me muestra. He tratado de convertir algunos de los unix marcas de tiempo con un convertidor en línea y los resultados son diferentes.
¿Qué estoy haciendo mal aquí ?