[AutoParallel] Fix ViT embed #1

Xing-lil · 2025-03-06T08:58:13Z

Fix ViT embed

jeff41404 · 2025-03-07T03:08:16Z

paddlemix/examples/qwen2_vl/qwen2vl_finetune_auto.py

@@ -622,7 +623,8 @@ def __init__(self, *args, **kwargs):
        # self.is_pretraining = True

    def _wrap_for_dist_loader(self, train_dataloader):
-        dist_loader = super()._wrap_for_dist_loader(train_dataloader)
+        dtensor_idx = [2, 3]


dense_tensor_idx 是否好一些，dtensor_idx 容易有歧义

是的，我修改下并加上用法描述

jeff41404 · 2025-03-07T03:11:13Z

paddlemix/models/qwen2_vl/modeling_qwen2_vl_network.py

+            num_attention_heads=config.num_attention_heads,
+        )
+
+        def get_tensor_parallel_split_mappings(num_layers):


这个函数是给动手用的，其中的内容可以去掉，换成pass。因为整个去掉此函数可能导致 from_pretrain 报错

好的，感谢！

jeff41404 · 2025-03-07T03:44:24Z

paddlemix/models/qwen2_vl/modeling_qwen2_vl_network.py

+        super().__init__(config)
+        self.visual = Qwen2VisionTransformerPretrainedModel._from_config(config.vision_config)
+        # mesh = fleet.auto.get_mesh()
+        mesh = dist.ProcessMesh([[0], [1], [2], [3], [4], [5], [6], [7]], dim_names=["dp", "mp"])


是否这样会通用一些

mesh = dist.get_mesh() if "pp" in mesh.dim_names: mesh = mesh.get_mesh_with_dim("pp")[0]

是的，我修改下，感谢！

jeff41404 · 2025-03-07T03:53:38Z

是否也要修改 paddlemix/examples/qwen2_vl/qwen2vl_finetune_auto.py 的39行
from paddlemix.models.qwen2_vl.modeling_qwen2_vl import Qwen2VLForConditionalGeneration 改为 from paddlemix.models.qwen2_vl.modeling_qwen2_vl_network import Qwen2VLForConditionalGeneration

Xing-lil · 2025-03-07T03:58:03Z

是否也要修改 paddlemix/examples/qwen2_vl/qwen2vl_finetune_auto.py 的39行 from paddlemix.models.qwen2_vl.modeling_qwen2_vl import Qwen2VLForConditionalGeneration 改为 from paddlemix.models.qwen2_vl.modeling_qwen2_vl_network import Qwen2VLForConditionalGeneration

是的，这里需要修改，忽略了

jeff41404 · 2025-03-07T09:26:57Z

paddlemix/models/qwen2_vl/modeling_qwen2_vl_network.py

+        ColumnParallelLinear = linear_utils.ColumnParallelLinear
+        RowParallelLinear = linear_utils.RowParallelLinear
+
+        if config.tensor_parallel_degree > 1:


类似判断 config.tensor_parallel_degree > 1 的分支都可以去掉，这些分支只有动手需要

fix vit embed

e56625b

jeff41404 reviewed Mar 7, 2025

View reviewed changes

Xing-lil added 2 commits March 7, 2025 14:52

changes code as per the feedback

5c34581

fix 2D dense_tensor_idx

8d63838

jeff41404 reviewed Mar 7, 2025

View reviewed changes

Switch to no dist network

acec889

jeff41404 merged commit 5f32352 into jeff41404:verify_auto_parallel_intermediate_api_in_paddlemix Mar 7, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[AutoParallel] Fix ViT embed #1

[AutoParallel] Fix ViT embed #1

Xing-lil commented Mar 6, 2025

jeff41404 Mar 7, 2025

Xing-lil Mar 7, 2025

jeff41404 Mar 7, 2025

Xing-lil Mar 7, 2025

jeff41404 Mar 7, 2025 •

edited

Loading

Xing-lil Mar 7, 2025

jeff41404 commented Mar 7, 2025

Xing-lil commented Mar 7, 2025

jeff41404 Mar 7, 2025

Xing-lil Mar 7, 2025

[AutoParallel] Fix ViT embed #1

[AutoParallel] Fix ViT embed #1

Conversation

Xing-lil commented Mar 6, 2025

jeff41404 Mar 7, 2025

Choose a reason for hiding this comment

Xing-lil Mar 7, 2025

Choose a reason for hiding this comment

jeff41404 Mar 7, 2025

Choose a reason for hiding this comment

Xing-lil Mar 7, 2025

Choose a reason for hiding this comment

jeff41404 Mar 7, 2025 • edited Loading

Choose a reason for hiding this comment

Xing-lil Mar 7, 2025

Choose a reason for hiding this comment

jeff41404 commented Mar 7, 2025

Xing-lil commented Mar 7, 2025

jeff41404 Mar 7, 2025

Choose a reason for hiding this comment

Xing-lil Mar 7, 2025

Choose a reason for hiding this comment

jeff41404 Mar 7, 2025 •

edited

Loading