首页  专利技术  电子电路装置的制造及其应用技术

一种面向大模型应用的任务分发方法及系统

2025-04-29 16:00:01 350次浏览

技术特征:

1.一种面向大模型应用的任务分发方法,其特征在于,包括:

2.根据权利要求1所述的面向大模型应用的任务分发方法,其特征在于,使用消息队列分发不同类型的任务到请求分发器,包括:

3.根据权利要求1所述的面向大模型应用的任务分发方法,其特征在于,使用用户配置的分组策略对同一类型的任务分组,得到不同的任务组,包括:

4.根据权利要求3所述的面向大模型应用的任务分发方法,其特征在于,在使用用户配置的分组策略对同一类型的任务分组,得到不同的任务组之后,还包括:

5.根据权利要求1所述的面向大模型应用的任务分发方法,其特征在于,所述请求分发器管理若干个任务执行组件;每个任务执行组件内封装一个大模型程序执行任务;基于管理员为每个大模型程序分配的gpu显存确定批处理行数;请求分发器还用于根据调度组行数和不同任务执行组件的批处理行数,使用最优匹配算法为调度组选择任务执行组件。

6.根据权利要求5所述的面向大模型应用的任务分发方法,其特征在于,使用最优匹配算法为调度组选择任务执行组件,包括:

7.一种面向大模型应用的任务分发系统,其特征在于,应用于权利要求1至6中任一项所述的面向大模型应用的任务分发方法,所述面向大模型应用的任务分发系统包括:

8.根据权利要求7所述的面向大模型应用的任务分发系统,其特征在于,所述任务调度器包括:

9.根据权利要求8所述的面向大模型应用的任务分发系统,其特征在于,所述http网关包括:

10.根据权利要求8所述的面向大模型应用的任务分发系统,其特征在于,所述请求分发器包括:


技术总结
本发明提供了一种面向大模型应用的任务分发方法及系统,涉及资源调度技术领域,方法包括:使用消息队列分发不同类型的任务到请求分发器;使用用户配置的分组策略对同一类型的任务分组,得到不同的任务组;基于最优匹配算法将不同的任务组调度到执行组件进行执行。本发明进行多个大模型任务的调度,能够充分利用到大模型推理优化手段中最重要的批处理方法,能够有效管理部署在多个节点的大模型,能够根据不同的请求类型对大模型任务进行分发,能够高效地调度大模型执行具体任务,还支持拓展或减少大模型任务类型。

技术研发人员:徐鹏,刘年超,温自强,于秀丽,杨王颖
受保护的技术使用者:北京邮电大学
技术研发日:
技术公布日:2024/11/14
文档序号 : 【 39999493 】

技术研发人员:徐鹏,刘年超,温自强,于秀丽,杨王颖
技术所有人:北京邮电大学

备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
徐鹏刘年超温自强于秀丽杨王颖北京邮电大学
企业能源站能耗数据采集装置与分类统计方法与流程 一种构建基于默克尔字典树的世界状态的方法和计算机设备与流程
相关内容