Arquitectura del modelo Transformer
0 Informe
Esta plantilla es ideal para dibujar diagramas de estructura de redes neuronales de modelos Transformer, centrándose en los componentes principales del codificador y el decodificador, así como en sus relaciones de flujo de datos. Presenta claramente módulos como la incrustación de entrada, la codificación posicional, la autoatención multi-cabeza, la red de alimentación directa, la normalización de capas y las conexiones residuales. Es adecuada para su uso como ilustración en artículos, presentaciones técnicas, tutoriales de explicación de modelos o documentos de reproducción de algoritmos, ayudando a los lectores a comprender intuitivamente el flujo de trabajo del Transformer y las rutas de transmisión de información.
Recomendaciones relacionadas
Otras obras del autor
Esquema/Contenido
Ver más
Add & Norm
PositionalEncoding
Sección de entrada
Nx
Linear
FeedForward
Codificador
Sección de salida
OutputProbabilities
MaskedMulti-HeadAttention
Multi-HeadAttention
OutputEmbedding
Outputs(shifted right)
InputEmbedding
Softmax
Inputs
Descifrador
Recolectar
Recolectar
Recolectar
0 Comentarios
Página siguiente