[Dy2St] cuda_pinned_tensors_move_to_excepted_place move to C++ #69763

wanghuancoder · 2024-11-27T07:32:14Z

PR Category

Execute Infrastructure

PR Types

Performance

Description

Python端的cuda_pinned_tensors_move_to_excepted_place耗时严重，将其下沉到C++。
#69722 尝试同时将blocking改为false，但是PR-CI-Windows-Inference的test_bert、test_mobile_net会出随机的精度问题。暂时没有调整blocking。理论上，动转静的这个函数运行在动态图，而动态图是单线程、单Stream的，H2D拷贝发生在计算流上。是可以将blocking设为false的。

使用helixfold APB子图做性能分析，cuda_pinned_tensors_move_to_excepted_place的耗时占比为5.84%：

下沉到C++后耗时占比为：0.23%

Pcard-67164

paddle-bot · 2024-11-27T07:32:19Z

你的PR提交成功，感谢你对开源项目的贡献!
请关注后续CI自动化测试结果，详情请参考Paddle-CI手册。
Your PR has been submitted. Thanks for your contribution!
Please wait for the result of CI firstly. See Paddle CI Manual for details.

… speed_up_sot_feed2

wanghuancoder added 3 commits November 26, 2024 11:10

refine

ca1740b

refine

f632aae

refine

b2ae5a1

wanghuancoder requested review from SigureMo, zrr1999 and gouzil as code owners November 27, 2024 07:32

Merge branch 'develop' of https://github.com/PaddlePaddle/Paddle into…

27063bf

… speed_up_sot_feed2

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Dy2St] cuda_pinned_tensors_move_to_excepted_place move to C++ #69763

[Dy2St] cuda_pinned_tensors_move_to_excepted_place move to C++ #69763

wanghuancoder commented Nov 27, 2024 •

edited

Loading

paddle-bot bot commented Nov 27, 2024

[Dy2St] cuda_pinned_tensors_move_to_excepted_place move to C++ #69763

Are you sure you want to change the base?

[Dy2St] cuda_pinned_tensors_move_to_excepted_place move to C++ #69763

Conversation

wanghuancoder commented Nov 27, 2024 • edited Loading

PR Category

PR Types

Description

paddle-bot bot commented Nov 27, 2024

wanghuancoder commented Nov 27, 2024 •

edited

Loading