operator
-
清华开源混合精度推理系统MixQ,实现大模型近无损量化并提升推理吞吐
一键部署llm混合精度推理,端到端吞吐比awq最大提升6倍! 清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。 MixQ支持8比特和4比特混合精度推理,可实现近无损的量化部署并提升推理的吞吐。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSe…
-
北大字节VAR获最佳论文、厦大清华获亚军,NeurIPS 2024最佳论文出炉
neurips 2024最佳论文揭晓!两篇论文荣获最佳论文奖,两篇荣获最佳论文亚军。本届大会共收到15671篇有效论文投稿,接收率仅为25.8%。 最佳论文奖: 视觉自回归建模:通过Next-Scale预测实现可扩展图像生成 (Visual Autoregressive Modeling: Scal…
-
HorNet: 高效的空间交互模块
本文提出递归门控卷积(gnConv),它通过门控卷积核递归设计执行高效、可扩展和平移等变的高阶空间交互,即插即用来改进各种视觉Transformer和基于CNN的模型,并提出新的视觉骨干网络家族:HorNet ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R…
-
基于飞桨实现乒乓球时序动作定位大赛 :B榜第12名方案
该方案基于飞桨实现乒乓球时序动作定位,获B榜第12名。采用宽4s滑窗分割视频为100帧数据,改进BMN模型,将TEM改为双分支融合输出,用DIOU-soft-NMS替代Soft-NMS避免漏检。经数据处理、模型训练与推理,A榜得分44.45754,B榜45.22373,还提出了后续改进方向。 ☞☞☞…
-
刚刚,OpenAI正式放出智能体Operator!能推理、联网自主执行任务
openai发布operator:能联网自动执行任务的ai智能体,引发ai社区热议! 北京时间昨天傍晚,继“星际之门项目”后,OpenAI再次成为AI领域的焦点。ChatGPT Pro用户发现界面新增“Operator”选项,引发猜测:OpenAI的计算机使用智能体来了吗? ☞☞☞AI 智能聊天, …
-
OpenAI推出智能体Deep Research,将“非常耗费计算资源”
openai发布全新ai研究工具“deep research”,助力用户高效完成在线研究任务!这款工具通过chatgpt付费版提供,能够根据用户指令搜索并分析网络文本、图片、pdf文件及用户上传文件,最终生成一份全面报告。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 Dee…
-
如何在MXNet中训练AI大模型?高效构建深度学习的详细步骤
答案是优化数据管道、采用分布式训练、应用内存优化技术、精细调参。具体包括:使用RecordIO格式和DataLoader多进程预取提升数据加载效率;通过KVStore选择device或dist_sync/dist_async实现单机或多机分布式训练;利用混合精度训练、梯度累积和模型符号化降低显存占用…