operator_第3页

清华开源混合精度推理系统MixQ，实现大模型近无损量化并提升推理吞吐

一键部署llm混合精度推理，端到端吞吐比awq最大提升6倍！清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。 MixQ支持8比特和4比特混合精度推理，可实现近无损的量化部署并提升推理的吞吐。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSe…

程序猿

2025年11月7日 • 用户投稿

1000

用户投稿

北大字节VAR获最佳论文、厦大清华获亚军，NeurIPS 2024最佳论文出炉

neurips 2024最佳论文揭晓！两篇论文荣获最佳论文奖，两篇荣获最佳论文亚军。本届大会共收到15671篇有效论文投稿，接收率仅为25.8%。最佳论文奖: 视觉自回归建模：通过Next-Scale预测实现可扩展图像生成 (Visual Autoregressive Modeling: Scal…

程序猿

2025年11月6日

0000

用户投稿

HorNet: 高效的空间交互模块

本文提出递归门控卷积(gnConv)，它通过门控卷积核递归设计执行高效、可扩展和平移等变的高阶空间交互，即插即用来改进各种视觉Transformer和基于CNN的模型，并提出新的视觉骨干网络家族：HorNet ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R…

程序猿

2025年11月6日

3000

用户投稿

基于飞桨实现乒乓球时序动作定位大赛：B榜第12名方案

该方案基于飞桨实现乒乓球时序动作定位，获B榜第12名。采用宽4s滑窗分割视频为100帧数据，改进BMN模型，将TEM改为双分支融合输出，用DIOU-soft-NMS替代Soft-NMS避免漏检。经数据处理、模型训练与推理，A榜得分44.45754，B榜45.22373，还提出了后续改进方向。 ☞☞☞…

程序猿

2025年11月6日

1000

刚刚，OpenAI正式放出智能体Operator！能推理、联网自主执行任务

openai发布operator：能联网自动执行任务的ai智能体，引发ai社区热议！北京时间昨天傍晚，继“星际之门项目”后，OpenAI再次成为AI领域的焦点。ChatGPT Pro用户发现界面新增“Operator”选项，引发猜测：OpenAI的计算机使用智能体来了吗？ ☞☞☞AI 智能聊天, …

程序猿

2025年11月4日 • 用户投稿

1000

OpenAI推出智能体Deep Research，将“非常耗费计算资源”

openai发布全新ai研究工具“deep research”，助力用户高效完成在线研究任务！这款工具通过chatgpt付费版提供，能够根据用户指令搜索并分析网络文本、图片、pdf文件及用户上传文件，最终生成一份全面报告。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 Dee…

程序猿

2025年11月4日 • 用户投稿

0000

如何在MXNet中训练AI大模型？高效构建深度学习的详细步骤

答案是优化数据管道、采用分布式训练、应用内存优化技术、精细调参。具体包括：使用RecordIO格式和DataLoader多进程预取提升数据加载效率；通过KVStore选择device或dist_sync/dist_async实现单机或多机分布式训练；利用混合精度训练、梯度累积和模型符号化降低显存占用…

程序猿

2025年11月2日 • 用户投稿

0000