Volver a entrenar un Modelo de BERT

0

Pregunta

Me he formado una BERT modelo de uso de la pytorch por cerca de un millón de datos de texto para una tarea de clasificación. Después de las pruebas de este modelo con los nuevos datos puedo obtener falsos Positivos y Falsos Negativos. Ahora quiero volver a capacitar a los existentes sólo en el modelo con FN y FP. No quiero anexar el FN y FP para el conjunto de datos existente y, a continuación, capacitar a todo el modelo de nuevo. ¿Cómo puedo entrenar de nuevo este bert sólo para el modelo con estos FN y Fp en el previosuly modelo de aprendizaje.

1

Mejor respuesta

0

Sin saber el código para el tren de bucle, la idea debería ser algo como esto después del entrenamiento:

results = model(data)
wrong_datapoints = []
for i, result in enumerate(results)

    if result != labels[i]:
        wrong_datapoints.append((data[i],labels[i]))


(data_new, labels_new) = list(zip(*wrong_datapoints))

model.train(data_new, labels_new)

Si quieres algo más específico, vas a tener que proporcionar el código de su actual tren de bucle.

2021-11-23 12:46:43

muchas gracias por los comentarios. Pero quiero seguir un modelo, la versión, ya que entrenar cada semana, el modelo de versión. Y también la iteración de un millón de registros va a tomar un montón de tiempo. Yo estaba pensando en la carga de la versión anterior del archivo bin(v1.0) y, a continuación, reeducar esto con sólo los nuevos puntos de datos para crear otra versión v2.0
Patricia

Usted podría querer aclarar su pregunta a estado. Sin embargo, haciendo el control de versiones no elimina la necesidad de realizar un seguimiento de los resultados de los puntos de datos después de la formación, que requieren de un único bucle sobre el tren de datos después de la formación se realiza. Usted necesita para determinar cuáles son los "nuevos puntos de datos" son, después de todo.
Kroshtan

En otros idiomas

Esta página está en otros idiomas

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Slovenský
..................................................................................................................