【训练营】Add FlashAttention operator into infiniTrain Framework by Aoshine999 · Pull Request #124 · InfiniTensor/InfiniTrain

Aoshine999 · 2026-03-16T10:18:50Z

Add Flash Attention forward/backward implementation and wire it into the autograd/dispatcher system.
Key changes:

infini_train/include/autograd/ScaledDotProductAttention.h
infini_train/src/autograd/ScaledDotProductAttention.cc
infini_train/include/kernels/cuda/flash_attention.h
infini_train/src/kernels/cuda/flash_attention.cu
run gpt2/llama3 : add --flash flag to switch attention path
Constraints: dtype=float32, bfloat16 Flashattention forward and backward kernel only support BlockDim(32,32)

kilinchange · 2026-03-17T06:21:08Z

请解决当前 pr 与 master 的冲突。

Aoshine999 added 2 commits March 16, 2026 18:02

add FlashAttention operator

e50f25a

change code format

cf8b18e

kilinchange changed the title ~~Add FlashAttention operator into infiniTrain Framework~~ 【训练营】Add FlashAttention operator into infiniTrain Framework Mar 17, 2026

kilinchange self-requested a review March 17, 2026 06:21

kilinchange self-assigned this Mar 17, 2026

Merge branch 'master' into flashattention

f943fba

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

【训练营】Add FlashAttention operator into infiniTrain Framework#124

【训练营】Add FlashAttention operator into infiniTrain Framework#124
Aoshine999 wants to merge 3 commits intoInfiniTensor:masterfrom
Aoshine999:flashattention

Aoshine999 commented Mar 16, 2026

Uh oh!

kilinchange commented Mar 17, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Conversation

Aoshine999 commented Mar 16, 2026

Uh oh!

kilinchange commented Mar 17, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants