[2506.06644] Spark Transformer: Reactivating Sparsity in FFN and Attention

Spark Transformer: Reactivating Sparsity in FFN and Attention

Chong You, Kan Wu, Zhipeng Jia, Lin Chen, Srinadh Bhojanapalli, Jiaxian Guo, Utku Evci, Jan Wassenberg, Praneeth Netrapalli, Jeremiah J. Willcock, Suvinay Subramanian, Felix Chern, Alek Andreev, Shreya Pathak, Felix Yu, Prateek Jain, David E. Culler, Henry M. Levy, Sanjiv Kumar

June 07, 2025

Spark Transformer: Reactivating Sparsity in FFN and Attention

Subjects

Updated on Academus