Transformer模型架構
0 檢舉
本範本適用於繪製Transformer模型的神經網路結構圖,重點在於編碼器(Encoder)與解碼器(Decoder)的核心元件及其資料流關係。可清楚呈現輸入嵌入(Input Embedding)、位置編碼(Positional Encoding)、多頭自註意力機制(Multi-Head Self-Attention)、前饋神經網路(Feed-Forward Network)、層歸一化(Layer Norm)及殘差連接(Residual Connection)等模組。適合用於論文插圖、技術分享PPT、模型講解教學或演算法複現文件等場景,幫助讀者直觀理解Transformer的工作流程與資訊傳遞路徑。
相關推薦
作者其他創作
大綱/內容
看更多
Add & Norm
PositionalEncoding
輸入部分
Nx
Linear
FeedForward
編碼器
輸出部分
OutputProbabilities
MaskedMulti-HeadAttention
Multi-HeadAttention
OutputEmbedding
Outputs(shifted right)
InputEmbedding
Softmax
Inputs
解碼器
0 則評論
下一頁