Arquitetura do Modelo de Transformador
0 Relatório
Este modelo é adequado para desenhar diagramas da estrutura de redes neurais de modelos Transformer, com foco nos componentes principais do codificador e decodificador e suas relações de fluxo de dados. Ele apresenta claramente módulos como incorporação de entrada, codificação posicional, autoatenção multi-cabeças, rede feedforward, normalização de camadas e conexões residuais. É adequado para uso como ilustração em artigos, slides de apresentações técnicas, explicações de modelos ou arquivos de reprodução de algoritmos, ajudando os leitores a compreender intuitivamente o fluxo de trabalho e os caminhos de transmissão de informações do Transformer.
Recomendações relacionadas
Outras obras do autor
Esboço/Conteúdo
Ver mais
Add & Norm
PositionalEncoding
Seção de Entrada
Nx
Linear
FeedForward
Codificador
Seção de Saída
OutputProbabilities
MaskedMulti-HeadAttention
Multi-HeadAttention
OutputEmbedding
Outputs(shifted right)
InputEmbedding
Softmax
Inputs
Decodificador
Coletar
Coletar
0 Comentários
Próxima página