Merge pull request #805 from hpcaitech/hotfix/typo

fix typo err
2026-04-10 21:01:26 +02:00 · 2025-03-11 11:51:49 +08:00 · 2025-03-11 11:51:49 +08:00 · 0028a6c9eb
commit 0028a6c9eb
parent 2ca632a2d1 e0d55d9d91
11 changed files with 20 additions and 26 deletions
--- a/configs/opensora-v1-3/inference/t2v.py
+++ b/configs/opensora-v1-3/inference/t2v.py
@ -12,7 +12,7 @@ dtype = "bf16"

 model = dict(
    type="STDiT3-XL/2",
-    from_pretrained="/home/guoxinying/open_source_video_ocean_V1/OpenSora-STDiT-v4",
+    from_pretrained="hpcaitech/OpenSora-STDiT-v4",
    qk_norm=True,
    enable_flash_attn=True,
    enable_layernorm_kernel=True,
@ -22,7 +22,7 @@ model = dict(
 )
 vae = dict(
    type="OpenSoraVAE_V1_3",
-    from_pretrained="/home/guoxinying/open_source_video_ocean_V1/OpenSora-VAE-v1.3",
+    from_pretrained="hpcaitech/OpenSora-VAE-v1.3",
    z_channels=16,
    micro_batch_size=1,
    micro_batch_size_2d=4,
@ -35,7 +35,7 @@ vae = dict(
 )
 text_encoder = dict(
    type="t5",
-    from_pretrained="/mnt/jfs-hdd/sora/checkpoints/pretrained_models/t5-v1_1-xxl",
+    from_pretrained="DeepFloyd/t5-v1_1-xxl",
    model_max_length=300,
 )
 scheduler = dict(
--- a/configs/opensora-v1-3/inference/v2v.py
+++ b/configs/opensora-v1-3/inference/v2v.py
@ -18,7 +18,7 @@ use_oscillation_guidance_for_image = True

 model = dict(
    type="STDiT3-XL/2",
-    from_pretrained="/home/guoxinying/open_source_video_ocean_V1/OpenSora-STDiT-v4",
+    from_pretrained="hpcaitech/OpenSora-STDiT-v4",
    qk_norm=True,
    enable_flash_attn=True,
    enable_layernorm_kernel=True,
@ -29,7 +29,7 @@ model = dict(
 )
 vae = dict(
    type="OpenSoraVAE_V1_3",
-    from_pretrained="/home/guoxinying/open_source_video_ocean_V1/OpenSora-VAE-v1.3",
+    from_pretrained="hpcaitech/OpenSora-VAE-v1.3",
    z_channels=16,
    micro_batch_size=1,
    micro_batch_size_2d=4,
@ -42,7 +42,7 @@ vae = dict(
 )
 text_encoder = dict(
    type="t5",
-    from_pretrained="/mnt/jfs-hdd/sora/checkpoints/pretrained_models/t5-v1_1-xxl",
+    from_pretrained="DeepFloyd/t5-v1_1-xxl",
    model_max_length=300,
 )
 scheduler = dict(
--- a/configs/opensora-v1-3/misc/eval_loss.py
+++ b/configs/opensora-v1-3/misc/eval_loss.py
@ -25,7 +25,7 @@ model = dict(
 )
 vae = dict(
    type="OpenSoraVAE_V1_3",
-    from_pretrained="/home/guoxinying/open_source_video_ocean_V1/OpenSora-VAE-v1.3",
+    from_pretrained="hpcaitech/OpenSora-VAE-v1.3",
    z_channels=16,
    micro_batch_size=1,
    micro_batch_size_2d=4,
--- a/configs/opensora-v1-3/train/adapt.py
+++ b/configs/opensora-v1-3/train/adapt.py
@ -26,22 +26,16 @@ plugin = "zero2"
 # Model settings
 model = dict(
    type="STDiT3-XL/2",
-    from_pretrained="outputs/0373-STDiT3-XL-2/epoch3-global_step36000/ema.pt",
+    from_pretrained=None,
    qk_norm=True,
    enable_flash_attn=True,
    enable_layernorm_kernel=True,
    adapt_16ch=True,
    skip_temporal=True,
 )
-# vae = dict(
-#     type="VideoAutoencoderKL",
-#     from_pretrained="PixArt-alpha/pixart_sigma_sdxlvae_T5_diffusers",
-#     subfolder="vae",
-#     scaling_factor=0.13025,
-# )
 vae = dict(
    type="OpenSoraVAE_V1_3",
-    from_pretrained="/home/guoxinying/open_source_video_ocean_V1/OpenSora-VAE-v1.3",
+    from_pretrained="hpcaitech/OpenSora-VAE-v1.3",
    z_channels=16,
    micro_batch_size=1,
    micro_batch_size_2d=4,
--- a/configs/opensora-v1-3/train/adapt_i2v.py
+++ b/configs/opensora-v1-3/train/adapt_i2v.py
@ -63,7 +63,7 @@ model = dict(
 )
 vae = dict(
    type="OpenSoraVAE_V1_3",
-    from_pretrained="/home/guoxinying/open_source_video_ocean_V1/OpenSora-VAE-v1.3",
+    from_pretrained="hpcaitech/OpenSora-VAE-v1.3",
    z_channels=16,
    micro_batch_size=1,
    micro_batch_size_2d=4,
@ -76,7 +76,7 @@ vae = dict(
 )
 text_encoder = dict(
    type="t5",
-    from_pretrained="pretrained_models/t5-v1_1-xxl",
+    from_pretrained="DeepFloyd/t5-v1_1-xxl",
    model_max_length=300,
    shardformer=True,
 )
--- a/configs/opensora-v1-3/train/stage1.py
+++ b/configs/opensora-v1-3/train/stage1.py
@ -33,7 +33,7 @@ model = dict(
 )
 vae = dict(
    type="OpenSoraVAE_V1_3",
-    from_pretrained="/home/guoxinying/open_source_video_ocean_V1/OpenSora-VAE-v1.3",
+    from_pretrained="hpcaitech/OpenSora-VAE-v1.3",
    z_channels=16,
    micro_batch_size=1,
    micro_batch_size_2d=4,
--- a/configs/opensora-v1-3/train/stage1_hq.py
+++ b/configs/opensora-v1-3/train/stage1_hq.py
@ -53,7 +53,7 @@ model = dict(
 )
 vae = dict(
    type="OpenSoraVAE_V1_3",
-    from_pretrained="/home/guoxinying/open_source_video_ocean_V1/OpenSora-VAE-v1.3",
+    from_pretrained="hpcaitech/OpenSora-VAE-v1.3",
    z_channels=16,
    micro_batch_size=1,
    micro_batch_size_2d=4,
--- a/configs/opensora-v1-3/train/stage1_nk.py
+++ b/configs/opensora-v1-3/train/stage1_nk.py
@ -24,14 +24,14 @@ plugin = "zero2"
 # Model settings
 model = dict(
    type="STDiT3-XL/2",
-    from_pretrained="outputs/0461-STDiT3-XL-2/epoch3-global_step40000/ema.pt",
+    from_pretrained=None,
    qk_norm=True,
    enable_flash_attn=True,
    enable_layernorm_kernel=True,
 )
 vae = dict(
    type="OpenSoraVAE_V1_3",
-    from_pretrained="/home/guoxinying/open_source_video_ocean_V1/OpenSora-VAE-v1.3",
+    from_pretrained="hpcaitech/OpenSora-VAE-v1.3",
    z_channels=16,
    micro_batch_size=1,
    micro_batch_size_2d=4,
--- a/configs/opensora-v1-3/train/stage1_noise.py
+++ b/configs/opensora-v1-3/train/stage1_noise.py
@ -33,7 +33,7 @@ model = dict(
 )
 vae = dict(
    type="OpenSoraVAE_V1_3",
-    from_pretrained="/home/guoxinying/open_source_video_ocean_V1/OpenSora-VAE-v1.3",
+    from_pretrained="hpcaitech/OpenSora-VAE-v1.3",
    z_channels=16,
    micro_batch_size=1,
    micro_batch_size_2d=4,
--- a/configs/opensora-v1-3/train/stage2.py
+++ b/configs/opensora-v1-3/train/stage2.py
@ -33,7 +33,7 @@ model = dict(
 )
 vae = dict(
    type="OpenSoraVAE_V1_3",
-    from_pretrained="/home/guoxinying/open_source_video_ocean_V1/OpenSora-VAE-v1.3",
+    from_pretrained="hpcaitech/OpenSora-VAE-v1.3",
    z_channels=16,
    micro_batch_size=1,
    micro_batch_size_2d=4,
--- a/gradio/app.py
+++ b/gradio/app.py
@ -27,10 +27,10 @@ CONFIG_MAP = {
 }
 HF_STDIT_MAP = {
    "t2v": {
-        "360p": "/home/guoxinying/open_source_video_ocean_V1/OpenSora-STDiT-v4-360p",
-        "720p": "/home/guoxinying/open_source_video_ocean_V1/OpenSora-STDiT-v4",
+        "360p": "hpcaitech/OpenSora-STDiT-v4-360p",
+        "720p": "hpcaitech/OpenSora-STDiT-v4",
    },
-    "i2v": "/home/guoxinying/open_source_video_ocean_V1/OpenSora-STDiT-v4-i2v",
+    "i2v": "hpcaitech/OpenSora-STDiT-v4-i2v",
 }