UrbanComp Lab | 学习资料库

中国地质大学（武汉）位置智能与城市感知实验室

搜索资料库团队官网

返回论文库

blog

Hugging Face Blog

AI

LLM

Ulysses Sequence Parallelism: Training with Million-Token Contexts

Kashif Rasul, Stas Bekman

发布时间

2026/3/9 08:00:00

来源类型

blog

语言

en

摘要

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

资源链接

Careersapply.workable.com/huggingface Accelerate ALST Examplegithub.com...n/examples/alst_ulysses_sequence_parallelism Update on GitHubgithub.com/huggingface/blog/blob/main/ulysses-sp.md TRL Accelerate Configsgithub.com...ce/trl/tree/main/examples/accelerate_configs Liger-Kernelgithub.com/linkedin/Liger-Kernel Qwen3-4Bhuggingface.co/Qwen/Qwen3-4B Accelerate ND-Parallel: A Guide to Efficient Multi-GPU Traininghuggingface.co/blog/accelerate-nd-parallel Enabling Long-Context Training with Sequence Parallelism in Axolotlhuggingface.co...context-with-sequence-parallelism-in-axolotl Understanding Ulysses and Ring Attentionhuggingface.co...g/exploding-gradients/ulysses-ring-attention Gutenberg Englishhuggingface.co/datasets/sedthh/gutenberg_english Accelerate: Context Parallelism Guidehuggingface.co...ccelerate/concept_guides/context_parallelism ParallelismConfighuggingface.co...celerate/concept_guides/sequence_parallelism Trainerhuggingface.co/docs/transformers/main_classes/trainer TrainingArguments.parallelism_confighuggingface.co/docs/transformers/main_classes/trainer TRL: Distributing Traininghuggingface.co/docs/trl/distributing_training SFTTrainerhuggingface.co/docs/trl/sft_trainer FlashAttentionhuggingface.co/papers/2205.14135 DeepSpeed Ulysses paperhuggingface.co/papers/2309.14509 Arctic Long Sequence Training (ALST) protocolhuggingface.co/papers/2506.13996 DeepSpeed Sequence Parallelismwww.deepspeed.ai/tutorials/ulysses-alst-sequence-parallelism TiledMLPwww.deepspeed.ai/tutorials/ulysses-alst-sequence-parallelism Snowflake Engineering Blogwww.snowflake.com...ering-blog/ulysses-low-latency-llm-inference 原始来源页面huggingface.co/blog/ulysses-sp

元数据

来源Hugging Face Blog

类型blog

抽取状态raw

关键词

AI

LLM