Tengo dos pandas dataframes así:
df1
sitio | enlace |
---|---|
retailer_site1 | https://www.retailer_site1.com |
... | ... |
retailer_siteX | https://www.retailer_siteX.com |
df2
sitio | enlace |
---|---|
retailer_site1 | https://www.retailer_site1.com |
... | ... |
retailer_siteY | https://www.retailer_siteY.com |
Así que me quiero ir a través de df2 y buscar instancias de enlaces desde df2 en df1. Aquí está mi código:
for row in df2['link'].astype(str):
boolean_findings = df1['link'].str.contains(row)
Cuando imprimo boolean_findings, me estoy poniendo todas falsas, que sé que no puede ser verdad porque estoy viendo los partidos de local en mis archivos de excel:
boolean_findings |
---|
Falso |
Falso |
... |
Falso |
Lo que quiero saber es por qué el hipervínculo de texto de la cadena es de no ser correspondidos con su equivalente en el primer df, y ¿qué puedo hacer para que coincida con los sitios.
TypeError: replace() takes no keyword arguments
. Cuando me quite laregex=True
, no el error, pero no sustituirlo. Creo que voy a mirar en elre
módulo para solucionar esto, pero gracias por ponerme en el camino correcto!