職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
工作職責:
1、參與大模型推理系統(tǒng)設計和研究,包括但不限于模型量化、推理加速,進行服務層、推理層和算法層的優(yōu)化探索,實現(xiàn)整體效率提升;
2、進行推理性能分析和優(yōu)化,實現(xiàn)對gpu,npu等異構硬件,邊緣、云端等各種場景的高效推理技術;
3、研究實現(xiàn)各種模態(tài)混合的高效大模型推理技術;
4、熟練使用Python、C 、Rust和CUDA編寫代碼;
5、研究和應用Transformer架構以及相關領域的最新研究成果,探索應用各種能提升大模型推理效率和精度的高效架構;
6、研究從推理層面提升模型邏輯能力的各種方法。
任職資格:
1、計算機科學、工程或相關領域的本科或研究生學位,計算機基礎扎實;
2、掌握Python和C 編程語言,具備CUDA編程經(jīng)驗,理解GPU并行計算原理;
3、理解Transformer架構相關知識;
4、對深度學習模型的優(yōu)化和高性能計算有濃厚興趣;
5、具備良好的問題解決能力和團隊合作精神;
6、接受優(yōu)秀在讀碩士或博士實習生。
福利:餐補20元/天
1、參與大模型推理系統(tǒng)設計和研究,包括但不限于模型量化、推理加速,進行服務層、推理層和算法層的優(yōu)化探索,實現(xiàn)整體效率提升;
2、進行推理性能分析和優(yōu)化,實現(xiàn)對gpu,npu等異構硬件,邊緣、云端等各種場景的高效推理技術;
3、研究實現(xiàn)各種模態(tài)混合的高效大模型推理技術;
4、熟練使用Python、C 、Rust和CUDA編寫代碼;
5、研究和應用Transformer架構以及相關領域的最新研究成果,探索應用各種能提升大模型推理效率和精度的高效架構;
6、研究從推理層面提升模型邏輯能力的各種方法。
任職資格:
1、計算機科學、工程或相關領域的本科或研究生學位,計算機基礎扎實;
2、掌握Python和C 編程語言,具備CUDA編程經(jīng)驗,理解GPU并行計算原理;
3、理解Transformer架構相關知識;
4、對深度學習模型的優(yōu)化和高性能計算有濃厚興趣;
5、具備良好的問題解決能力和團隊合作精神;
6、接受優(yōu)秀在讀碩士或博士實習生。
福利:餐補20元/天
工作地點
地址:包頭東河區(qū)新安街道海納百川大廈
查看地


職位發(fā)布者
HR
深圳市億道控股有限公司

-
電子技術·半導體·集成電路
-
500-999人
-
公司性質未知
-
深圳市寶安區(qū)28區(qū)大寶路49-1號金富來大廈