Publications

Wentao Guo, Mayank Mishra, Xinle Cheng, Ion Stoica, Tri Dao (2026). SonicMoE: Accelerating MoE with IO and Tile-aware Optimizations. ICLR'26.

Yide Ran, Wentao Guo, Jingwei Sun, Yanzhou Pan, Xiaodong Yu, Hao Wang, Jianwen Xie, Yiran Chen, Denghui Zhang, Zhaozhuo Xu (2026). Mitigating Non-IID Drift in Zeroth-Order Federated LLM Fine-Tuning with Transferable Sparsity. ICLR'26.

Wentao Guo, Jikai Long, Yimeng Zeng, Zirui Liu, Xinyu Yang, Yide Ran, Jacob R. Gardner, Osbert Bastani, Christopher De Sa, Xiaodong Yu, Beidi Chen, Zhaozhuo Xu (2025). Zeroth-Order Fine-Tuning of LLMs with Transferable Static Sparsity. ICLR'25.

Wentao Guo, Andrew Wang, Bradon Thymes, Thorsten Joachims (2024). Ranking with Slot Constraints. KDD'24.

PDF Cite Code Poster DOI

A. Feder Cooper, Wentao Guo, Khiem Pham, Tiancheng Yuan, Charlie F. Ruan, Yucheng Lu, Christopher De Sa (2023). Coordinating Distributed Example Orders for Provably Accelerated Training. NeurIPS'23.

PDF Cite Code Poster

Yucheng Lu, Wentao Guo, Christopher De Sa (2022). GraB: Finding Provably Better Data Permutations than Random Reshuffling. NeurIPS'22.

PDF Cite Poster

Tao Yu, Wentao Guo, Jianan Canal Li, Tiancheng Yuan, Christopher De Sa (2022). MCTensor: A High-Precision Deep Learning Library with Multi-Component Floating-Point. HAET workshop at ICML'22.

PDF Cite Code Poster Video

Yann Hicke, Abhishek Masand, Wentao Guo, Tushaar Gangavarapu (2021). Assessing the efficacy of large language models in generating accurate teacher responses. BEA workshop at ACL'23.